Mô hình lý luận mạnh mẽ được phát triển với giá dưới 50 đô la

15:13, 06/02/2025

Vào thứ Sáu vừa qua, một nhóm nghiên cứu AI từ Đại học Stanford và Đại học Washington đã bất ngờ khiến cộng đồng công nghệ sửng sốt khi công bố khả năng đào tạo một mô hình trí tuệ nhân tạo (AI) với khả năng lý luận vượt trội với chi phí chưa đầy 50 đô la tín dụng điện toán đám mây.

Mô hình này, mang tên s1, thể hiện khả năng ngang ngửa với các mô hình AI tiên tiến như o1 của OpenAI hay R1 của DeepSeek trong các bài kiểm tra về toán học và lập trình. Điều đặc biệt đáng chú ý là toàn bộ dữ liệu, mã nguồn và mô hình s1 đều đã được chia sẻ công khai trên GitHub, mở ra cơ hội cho nhiều nhà nghiên cứu khác tham gia cải tiến.

Theo nhóm nghiên cứu, s1 được phát triển từ một mô hình nền tảng nhỏ có sẵn, sau đó được tinh chỉnh thông qua một quy trình có tên "chưng cất" (distillation). Đây là một phương pháp tối ưu chi phí, tập trung trích xuất khả năng lý luận từ một mô hình AI lớn bằng cách huấn luyện dựa trên câu trả lời của mô hình đó. Trong trường hợp này, s1 được "chưng cất" từ Gemini 2.0 Flash Thinking Experimental – một sản phẩm sáng tạo của Google. Đây cũng chính là phương pháp Berkeley từng áp dụng để tạo ra một mô hình lý luận AI với chi phí khoảng 450 đô la chỉ vào tháng trước. Tuy nhiên, với s1, chi phí được giảm xuống ở một quy mô chưa từng thấy.

Nguồn hình ảnh:Yuichiro Chino / Hình ảnh Getty

Đối với nhiều người, sự ra đời của s1 không chỉ là một bước tiến đáng kinh ngạc về mặt công nghệ mà còn mang ý nghĩa sâu sắc. Nó chứng minh rằng ngay cả những nhà nghiên cứu không được hậu thuẫn bởi hàng triệu đô la vẫn có thể tạo ra đột phá trong lĩnh vực AI, vốn thường bị chi phối bởi những "gã khổng lồ công nghệ". Tuy nhiên, điều này cũng đặt ra những câu hỏi nghiêm túc về ranh giới đạo đức và thương mại trong ngành. Chẳng hạn, liệu còn gì độc đáo khi một mô hình trị giá hàng triệu đô la có thể dễ dàng bị sao chép với chi phí chưa đến 50 đô?

Không ngạc nhiên khi sự ra đời của s1 đã thu hút sự chú ý không mấy vui vẻ từ các gã khổng lồ trong ngành. Các phòng thí nghiệm lớn như OpenAI đã từng công khai cáo buộc DeepSeek, một đối thủ cạnh tranh, sử dụng bất hợp pháp dữ liệu từ API của mình để chưng cất mô hình AI.

Mô hình s1 không chỉ là một minh chứng cho triết lý "ít nhưng hiệu quả", mà còn mở ra một cách nhìn mới về hiệu suất trong AI. Nhóm nghiên cứu đằng sau s1 cho biết mục tiêu của họ là tìm kiếm con đường ngắn nhất để đạt được hiệu suất lý luận mạnh mẽ trong AI, trong đó bao gồm cả việc thử nghiệm các phương pháp cho phép "tăng thời gian tư duy" của mô hình trước khi trả lời. Kỹ thuật này, vốn là điểm khác biệt quan trọng của o1 từ OpenAI, đã được nhóm áp dụng thành công cho s1 bằng một cách thức đầy sáng tạo: họ dạy mô hình “đợi” trước khi đưa ra câu trả lời. Việc thêm từ "chờ" vào quá trình suy luận của s1 giúp nó suy nghĩ sâu hơn và chính xác hơn.

Mô hình s1 dựa trên nền tảng một mô hình AI nhỏ được phát triển bởi phòng thí nghiệm AI Qwen thuộc sở hữu của Alibaba, vốn có thể tải xuống miễn phí. Để huấn luyện s1, các nhà nghiên cứu chỉ cần một tập dữ liệu gồm 1.000 câu hỏi được tuyển chọn kỹ lưỡng. Điểm sáng tạo nằm ở việc kết hợp các câu trả lời cùng với "luồng suy nghĩ" đằng sau mỗi câu trả lời từ Gemini 2.0 Flash Thinking Experimental. Quá trình huấn luyện chỉ mất chưa đầy 30 phút trên 16 GPU Nvidia H100 – với mức chi phí chưa tới 20 đô la nếu thuê trên dịch vụ điện toán đám mây ngày nay.

Không thể phủ nhận rằng chưng cất là một phương pháp mạnh mẽ để tái tạo khả năng của các mô hình AI lớn với chi phí thấp. Nhưng đồng thời, như các nhà nghiên cứu đã lưu ý, phương pháp này không tạo ra các mô hình AI hoàn toàn mới mà thiên về tái hiện hiệu quả của những công nghệ hiện có. Tương lai của lĩnh vực này vẫn nằm trong tầm với của các gã khổng lồ công nghệ như Google, Meta và Microsoft, những công ty được dự đoán sẽ đầu tư hàng trăm tỷ đô la vào phát triển cơ sở hạ tầng AI và các thế hệ mô hình mới từ nay đến năm 2025.

S1 là một minh chứng cho sự đổi mới táo bạo trong ngành trí tuệ nhân tạo, nhưng cũng gợi mở nhiều tranh luận về sự cân bằng giữa đổi mới và đạo đức công nghệ. Liệu đây có phải là kỷ nguyên dân chủ hóa AI, nơi bất kỳ ai cũng có thể đóng góp đột phá? Hay ngược lại, nó sẽ là căn nguyên của một cuộc chiến mới về sở hữu trí tuệ và rào cản thương mại hóa? Thời gian sẽ trả lời, nhưng trước mắt, s1 đã khiến cả thế giới phải kinh ngạc.