Google phát hành mô hình AI 'lý luận' của riêng mình

13:55, 20/12/2024

Google vừa ra mắt mô hình AI lý luận thế hệ mới với cái tên khá dài Gemini 2.0 Flash Thinking Experimental, hứa hẹn mang đến những bước đột phá trong khả năng lý luận và xử lý thông tin phức tạp.

Được công bố trên nền tảng AI Studio – nơi dành riêng cho việc tạo mẫu và thử nghiệm các công nghệ AI mới, Gemini 2.0 được quảng bá là công cụ mạnh mẽ, tối ưu cho các bài toán trong lĩnh vực lập trình, toán học và vật lý. Theo Google, điểm khác biệt cốt lõi của Gemini 2.0 là khả năng "suy nghĩ" để tiếp cận các vấn đề một cách logic, thay vì vội vàng đưa ra kết quả kiểu đối đáp đơn giản như các mô hình AI truyền thống. Điều này phản ánh tham vọng của Google trong việc xây dựng một AI không chỉ xuất sắc trong tạo sinh nội dung mà còn có khả năng xử lý các vấn đề đòi hỏi tư duy lý luận chuyên sâu.

Khác với các mô hình trước đây, Gemini 2.0 sử dụng một phương pháp độc đáo khi tiếp nhận và phân tích thông tin. Khi được hỏi, thay vì trả lời ngay lập tức, mô hình này sẽ tạm dừng để xem xét kỹ lưỡng vấn đề, căn cứ vào nhiều nguồn thông tin liên quan, và tự tiến hành kiểm tra chéo. Cuối cùng, nó sẽ trình bày cách suy diễn cũng như tóm tắt câu trả lời một cách logic.

Cách tiếp cận này giúp Gemini 2.0 tránh được những sai sót cơ bản thường xảy ra ở các AI truyền thống, nhưng đồng thời lại khiến thời gian xử lý lâu hơn. Để đưa ra một câu trả lời hoàn thiện, mô hình có thể mất vài giây đến vài phút tùy vào độ phức tạp của vấn đề – điều này có thể khiến người dùng cảm thấy thiếu sự thuận tiện so với các giải pháp AI nhanh gọn, phản hồi tức thời hiện tại.

Dẫu được kỳ vọng rất cao, những kết quả thử nghiệm ban đầu của Gemini 2.0 lại gây ra nhiều ý kiến trái chiều. Mặc dù mô hình được đánh giá tốt về mặt ý tưởng khi tập trung vào việc xây dựng tư duy lý luận, nhưng trong những bài kiểm tra đơn giản, Gemini 2.0 không hoàn toàn vượt trội so với các hệ thống AI hiện nay.

Chẳng hạn, khi được hỏi từ "strawberry" có bao nhiêu chữ cái "R", mô hình đã đưa ra câu trả lời "hai" đúng, nhưng không có gì đặc biệt thể hiện sự vượt trội về cách suy luận. Điều này cho thấy Google vẫn còn một hành trình dài để hoàn thiện và hiện thực hóa tham vọng về một AI lý luận toàn diện và đáng tin cậy.

Gemini 2.0 ra đời trong bối cảnh ngành công nghiệp AI đang chứng kiến sự cạnh tranh khốc liệt giữa các tên tuổi lớn. Từ sau sự kiện OpenAI ra mắt GPT-4 Turbo với khả năng lý luận mạnh mẽ, nhiều công ty công nghệ như DeepSeek và Alibaba đều nhanh chóng theo đuổi hướng phát triển này.

Đầu tháng 11, DeepSeek đã tung ra mô hình lý luận DeepSeek-R1, trong khi đội ngũ Qwen của Alibaba cũng giới thiệu một đối thủ mới, hứa hẹn cạnh tranh trực tiếp trên sân chơi AI mở. Google, với nguồn lực khổng lồ, đang dồn sức vào mảng này khi huy động hơn 200 nhà nghiên cứu tập trung xây dựng các mô hình lý luận trong nội bộ. Tuy nhiên, các báo cáo gần đây cũng chỉ ra rằng, việc mở rộng quy mô mô hình đơn thuần không còn mang lại hiệu quả đột phá như trước. Điều này buộc các công ty phải sáng tạo hơn trong cải tiến về mặt lý luận và nhận thức để duy trì sự phát triển của AI.

Dù Gemini 2.0 cùng các mô hình lý luận khác đã tạo ra hy vọng lớn về tương lai của trí tuệ nhân tạo, nhưng con đường này không thiếu khó khăn. Khả năng xử lý lý luận của AI tiêu tốn lượng sức mạnh tính toán khổng lồ, đi kèm chi phí vận hành đắt đỏ. Trong khi đó, hiệu quả thực tế của các mô hình lý luận vẫn cần được đánh giá thêm, đặc biệt khi chúng đối mặt với các bài toán thực tiễn nhiều rào cản hơn các chuẩn mực thử nghiệm.

Mặc dù vậy, không thể phủ nhận rằng Gemini 2.0 và các dự án tương tự đang mở ra một chương mới đầy tiềm năng trong lĩnh vực trí tuệ nhân tạo. Google dường như hiểu rằng, để tạo ra một AI không chỉ biết "học và nói", mà còn biết "nghĩ và suy luận", sẽ cần thêm rất nhiều sự đầu tư, thử nghiệm và kiên nhẫn trong thời gian tới.