OpenAI ra mắt tác nhân AI mới: Cuộc cách mạng trợ lý ảo
Mới đây, OpenAI vừa chính thức công bố tính năng “tác nhân AI” (AI Agent) tích hợp vào nền tảng ChatGPT, mở ra bước ngoặt quan trọng trong hành trình phát triển trí tuệ nhân tạo. Từ một chatbot thuần túy chỉ phản hồi câu hỏi, ChatGPT giờ đây có thể suy nghĩ, lên kế hoạch và hành động thay người dùng theo yêu cầu, đánh dấu sự chuyển dịch từ AI giao tiếp sang AI hành động.
Tính năng ChatGPT Agent là sự kết hợp tinh tế giữa các công cụ mạnh mẽ đã có của OpenAI như Operator, cho phép duyệt web theo thời gian thực, và Deep Research, tổng hợp và phân tích dữ liệu từ nhiều nguồn thành báo cáo súc tích. Thay vì phải chuyển đổi giữa các ứng dụng hay tìm kiếm thủ công, người dùng giờ đây chỉ cần dùng ngôn ngữ tự nhiên để đưa ra mệnh lệnh, ví dụ như: “xem lịch của tôi và tóm tắt các cuộc họp sắp tới” hoặc “lên kế hoạch và mua nguyên liệu cho bữa sáng kiểu Nhật cho bốn người”.
Điểm đột phá của Agent là khả năng hoạt động trên một “máy tính ảo” riêng biệt, môi trường cho phép nó xử lý các chuỗi tác vụ liên tục và thực hiện hành động có tính thực tiễn. Trong bản demo, ChatGPT Agent có thể chuẩn bị toàn bộ kế hoạch cho một đám cưới, bao gồm đề xuất trang phục theo yêu cầu, tìm khách sạn phù hợp và lên lịch di chuyển, tất cả đều phối hợp nhịp nhàng qua nhiều nền tảng và dịch vụ trực tuyến khác nhau.
Ảnh minh họa.
OpenAI cho biết ChatGPT Agent đạt được những thành tích ấn tượng trong các bài kiểm tra kỹ thuật. Cụ thể, trong bài Humanity’s Last Exam (HLE) gồm 3.000 câu hỏi thuộc hơn 100 lĩnh vực, tác nhân này đạt 41,6%, gần gấp đôi mô hình o3 và o4-mini. Trong bài FrontierMath, một bài toán nâng cao dành cho AI, công cụ đạt 27,4% khi có quyền truy cập công cụ hỗ trợ, so với chỉ 6,3% của o4-mini.
Ngoài các bài thi học thuật, nhiều thử nghiệm thực tế cũng cho thấy tác nhân này có thể đảm nhiệm các công việc hành chính cơ bản như lập báo cáo bảng tính, phân tích dữ liệu khách hàng, sắp xếp lịch họp, vốn là những công việc thường ngày tại nhiều doanh nghiệp.
Tính năng hành động độc lập đồng nghĩa với việc cần kiểm soát kỹ lưỡng. OpenAI đã lường trước các rủi ro tiềm ẩn và tích hợp nhiều biện pháp bảo vệ: Agent không được tự ý truy cập dữ liệu cá nhân như tài khoản ngân hàng trừ khi được người dùng cho phép rõ ràng; với các hành động có thể gây thay đổi hệ thống (ví dụ gửi email), luôn cần sự xác nhận của người dùng; đồng thời được huấn luyện để từ chối những yêu cầu “rủi ro cao” như chuyển tiền hay can thiệp hệ thống tài chính.
Một lớp bảo vệ khác là chế độ Watch Mode: Nếu người dùng rời khỏi tab đang hoạt động của ChatGPT Agent khi công cụ đang truy cập website nhạy cảm, phiên tác vụ sẽ tự động dừng lại. Theo CEO của OpenAI, tính năng này nên được coi là “một bước đột phá mang tính thử nghiệm”, và khuyên người dùng chỉ nên dùng Agent cho những mục đích hợp lý như lên lịch, tra cứu, mua sắm cơ bản, tránh giao phó các nhiệm vụ chứa dữ liệu nhạy cảm khi chưa thật sự cần thiết.
Tác nhân AI của OpenAI ra mắt giữa lúc hàng loạt tên tuổi lớn đang chạy đua trong lĩnh vực này. Google với Gemini có tham vọng tương tự khi thử nghiệm trợ lý có thể đặt bàn nhà hàng, mua vé sự kiện. Apple đang phát triển phiên bản Siri mới có thể điều khiển ứng dụng thay người dùng. Amazon, Meta và xAI của Elon Musk cũng đều công bố các dự án AI Agent riêng.
Theo Klarna, một công ty fintech Thụy Điển, chỉ trong một tháng, tác nhân AI của họ đã xử lý 2/3 tổng số hội thoại chăm sóc khách hàng, tương đương với công việc của 700 nhân viên toàn thời gian, đây là một con số cho thấy tiềm năng khổng lồ trong việc tự động hóa quy trình vận hành.
Dù tiềm năng lớn, ChatGPT Agent hiện chỉ khả dụng cho người dùng trả phí tại một số quốc gia. Tại khu vực EU, tính năng này chưa được triển khai do yêu cầu nghiêm ngặt về bảo mật dữ liệu theo GDPR. OpenAI cho biết sẽ tiếp tục mở rộng, hoàn thiện tính năng dựa trên phản hồi người dùng, đồng thời nâng cấp hệ thống phòng vệ trước khi phổ cập rộng rãi.
Sự ra mắt của ChatGPT Agent không chỉ là một tính năng mới mà là bước đi chiến lược cho tương lai. Nó cho thấy các mô hình ngôn ngữ lớn đang dần trở thành những cộng sự ảo thực thụ, bởi nó không chỉ hỗ trợ viết, tra cứu, mà còn tham gia vào việc thực hiện công việc một cách chủ động. Tuy còn nhiều giới hạn và thách thức về quyền riêng tư, bảo mật, nhưng rõ ràng đây là bước mở đầu cho một kỷ nguyên AI hành động, nơi người dùng không chỉ “nói chuyện” với AI, mà có thể “làm việc cùng nhau” trong thế giới số ngày càng phức tạp.