Ưu tiên của ChatGPT: Chuyên môn hoá hay thu nhỏ chatbot?
Với hai phiên bản mới của GPT-4, o1 cho đến công cụ tìm kiếm mới, ChatGPT và công ty mẹ OpenAI đã có năm hoạt động đáng chú ý…
Ngày 30/11/2022, OpenAI ra mắt mô hình ChatGPT đầu tiên trên thế giới.
Những hoạt động ban đầu được cho là bài kiểm tra đối với mô hình của OpenAI đã nhanh chóng trở thành chatbot, đồng thời trở thành biểu tượng cho sự phát triển của trí tuệ nhân tạo tạo sinh (GenAI), theo Euro News.
Năm 2024, OpenAI cho ra mắt một số phiên bản mới, bao gồm GPT-4 đi kèm với trí thông minh nhanh nhạy hơn trong các lĩnh vực văn bản, giọng nói và thị giác, cùng với o1 - loạt mô hình mới có khả năng lý luận nhiệm vụ phức tạp trong khoa học, lập trình và toán học.
Chỉ vài tuần trước, OpenAI chính thức trình làng SearchGPT, tiện ích mở rộng trình duyệt cung cấp "câu trả lời nhanh chóng, kịp thời" cho mọi truy vấn người dùng với các nguồn web liên quan, vượt trội hoàn toàn so với công cụ tìm kiếm truyền thống.
Tuy nhiên, công ty cũng đối mặt với nhiều vấn đề nội bộ, như quyết định từ chức của người đồng sáng lập Ilya Sutskever, giải thể đội ngũ nghiên cứu siêu trí tuệ và hàng loạt vụ kiện từ cơ quan thông tấn Hoa Kỳ với cáo buộc vi phạm bản quyền.
Vậy ChatGPT của OpenAI sẽ phát triển ra sao trong năm tới khi công ty đang nỗ lực đẩy mạnh một số hoạt động quan trọng.
OpenAI ra mắt mô hình ChatGPT lần đầu vào tháng 11/2022.
"Bước đột phá lớn" của OpenAI
Trong buổi Ask Me Anything (AMA) trên Reddit vào tháng trước, nhà sáng lập OpenAI, Sam Altman và các cộng sự đã chia sẻ một số kế hoạch ưu tiên trong năm thứ ba hoạt động.
Theo đó, ông Kevin Weil, Giám đốc Sản phẩm OpenAI, cho biết trong AMA rằng "chủ đề lớn" của năm 2025 là liệu ChatGPT có thể thực hiện nhiệm vụ theo cách độc lập hay không.
CEO Altman gợi ý rằng công cụ có thể giống như tác nhân tự động, điều mà ông coi là "bước đột phá khổng lồ" tiếp theo của công ty.
"AI agents", hay còn gọi là trí tuệ nhân tạo tác nhân, cho phép doanh nghiệp thiết kế mô hình ngôn ngữ lớn (LLMs) điều khiển hệ thống của họ để tự động hóa một số nhiệm vụ tại nơi làm việc.
Đây là một thành tựu mà nhiều đối thủ của OpenAI hiện đã bắt đầu thực hiện, như tác nhân Vertex AI của Google Cloud, LinkedIn và Microsoft. Theo các báo cáo truyền thông, bản cập nhật tiếp theo của Google Gemini, Project Jarvis, cũng có thể bao gồm tác nhân tự động.
Bà Kate Devlin, giáo sư về Trí tuệ Nhân tạo và Xã hội tại Đại học King's College London, cho biết đã có những phản ứng trái chiều đối với tác nhân AI từ đối thủ cạnh tranh của OpenAI tung ra.
"Một số người rất lạc quan về điều này và coi đây là bước thay đổi lớn, cho phép tồn tại đa dạng kiểu trợ lý cá nhân, nơi người dùng có thể tin tưởng giao nhiều nhiệm vụ hơn cho AI", bà Devlin nói. "Cũng có những người e ngại về điều này và không thích ý tưởng để AI kiểm soát quá nhiều công việc hoặc quyền lực".
Mô hình tiếp theo của ChatGPT?
Đã có một số đồn đoán rằng OpenAI sẽ phát hành một mô hình hoàn toàn mới vào khoảng cuối năm nay.
CEO Altman nhấn mạnh với Reddit AMA rằng "những bản phát hành tốt nhất" sẽ ra mắt vào cuối năm nay nhưng "không có bản nào mà chúng tôi gọi là ChatGPT-5". Theo người đứng đầu Open AI, ưu tiên hiện tại của công ty là "tập trung phát hành" các mô hình, như GPT-4.0 và 0.1 đã ra mắt trong năm nay.
Báo cáo từ The Verge thông tin, phiên bản Orion, được cho là người kế nhiệm của cả GPT-4.0 và o1, dự kiến phát hành vào tháng 12 cho các doanh nghiệp hợp tác với OpenAI để họ có thể xây dựng sản phẩm và tính năng riêng của mình.
Ông Tadao Nagasaki, Giám đốc Điều hành OpenAI Nhật Bản, tiết lộ hồi tháng 9 về một mô hình ChatGPT trong tương lai sẽ "mạnh gấp 100 lần" so với GPT-4, theo báo cáo của truyền thông địa phương.
Ông Devlin cho rằng hoạt động của AI agent sẽ được đưa vào bất kỳ bản phát hành nào của Orion trong tương lai. Một số cập nhật đáng chú khác là Sora, mô hình AI chuyển văn bản thành video, hiện đang tạm dừng hoạt động. Phần mềm này vẫn đang được "hoàn thiện".
CEO Altman chia sẻ phiên bản tiếp theo của DALL-E, phần mềm tạo hình ảnh của OpenAI, "xứng đáng để chờ đợi" nhưng chưa có kế hoạch phát hành.
OpenAI xem xét chuyên môn hoá hay thu nhỏ quy mô Chatbot
Thay vì mở rộng quy mô, đã đến lúc mô hình ngôn ngữ nhỏ được xem xét.
Một trong những điểm OpenAI và các công ty khác cần chú ý trong năm 2025 là tình trạng thiếu hụt chung đang diễn ra trong ngành, bà Devlin tiếp tục.
"Các công ty AI cần tính toán nhiều hơn, họ cần nhiều năng lượng và dữ liệu hơn", bà Devlin nói. "Vì vậy, họ có thể làm được bao nhiêu dưới những hạn chế đó?".
Một phương hướng mà OpenAI có thể xem xét là thu nhỏ quy mô xuống các LLM vừa và nhỏ ít tốn tài nguyên hơn. Những mô hình nhỏ hơn này có khả năng "chọn lọc dữ liệu" để trở nên cụ thể hoặc hữu ích hơn trong lĩnh vực đặc thù, như luật pháp hoặc y tế, bà Devlin cho biết.
"Thay vì chỉ mở rộng quy mô, đã đến lúc chúng ta phải suy ngẫm về những gì mình đã có... tất nhiên mô hình nhỏ cũng có rủi ro riêng và chúng ta nên dành thời gian để đánh giá những rủi ro đó".
Ông Abdul Sadka, Giám đốc Viện Tương lai Kỹ thuật số Sir Peter Rigby tại Đại học Aston, cho rằng OpenAI nên giữ ChatGPT "chung chung" để các công ty hoặc lĩnh vực có thể tinh chỉnh thành bộ dữ liệu cụ thể mà họ muốn sử dụng.
Tuy nhiên, ông Sadka gợi ý OpenAI có thể mở rộng để cung cấp thêm "chế độ" cho ChatGPT, chẳng hạn như khả năng nhận diện hình ảnh y tế để "cung cấp báo cáo chẩn đoán về bất kỳ tình trạng tiềm ẩn" mà bệnh nhân gặp phải.
Để giúp ChatGPT trở nên chuyên môn hóa, ông Sadka cho rằng các công ty sử dụng phần mềm có thể xây dựng một cơ sở dữ liệu bên ngoài mà AI chưa được "làm quen" để "giảm khả năng... ảo tưởng" - thuật ngữ dùng để chỉ những phản hồi dựa trên phán đoán tốt nhất của AI dành cho câu hỏi mà công cụ không nhận ra.