Anthropic ra mắt Opus 4.5 với tích hợp mới cho Chrome và Excel

09:29, 25/11/2025

Anthropic công bố Opus 4.5, phiên bản mới nhất của mô hình chủ lực. Đây cũng là mô hình cuối cùng trong dòng 4.5 series, sau khi hãng lần lượt phát hành Sonnet 4.5 vào tháng 9 và Haiku 4.5 vào tháng 10.

Đúng như kỳ vọng, phiên bản Opus mới đạt hiệu năng hàng đầu trên nhiều bộ kiểm thử, gồm:

  • Coding benchmarks: SWE-Bench, Terminal-bench

  • Khả năng sử dụng công cụ (tool use): tau2-bench, MCP Atlas

  • Giải quyết vấn đề tổng quát: ARC-AGI 2, GPQA Diamond

Đáng chú ý, Opus 4.5 là mô hình đầu tiên đạt trên 80% ở bài kiểm thử SWE-Bench verified, một chuẩn đánh giá lập trình được giới chuyên môn đánh giá cao.

Ảnh: Anthropic

Anthropic cũng nhấn mạnh vào khả năng thao tác máy tính và xử lý bảng tính của Opus, đồng thời công bố loạt sản phẩm song song để chứng minh hiệu quả của mô hình trong các môi trường đó. Cùng với Opus 4.5, Anthropic sẽ mở rộng phát hành hai sản phẩm từng ở giai đoạn thử nghiệm: Claude for Chrome và Claude for Excel.

  • Tiện ích mở rộng Chrome sẽ khả dụng cho người dùng gói Max.

  • Phiên bản tích hợp Excel dành cho người dùng Max, Team và Enterprise.

Opus 4.5 cũng đi kèm nâng cấp bộ nhớ cho các tác vụ long-context, đòi hỏi thay đổi lớn trong cách mô hình quản lý bộ nhớ.

“Chúng tôi đã cải thiện chất lượng xử lý ngữ cảnh dài trong quá trình huấn luyện Opus 4.5, nhưng chỉ mở rộng cửa sổ ngữ cảnh thôi là chưa đủ,” Dianne Na Penn, Giám đốc quản lý sản phẩm nghiên cứu tại Anthropic, chia sẻ với TechCrunch. “Biết được những chi tiết nào cần ghi nhớ còn quan trọng hơn cả việc có một cửa sổ ngữ cảnh dài.”

Những thay đổi này cũng cho phép Anthropic tung ra tính năng được mong chờ từ lâu: “endless chat” (trò chuyện không giới hạn) dành cho người dùng trả phí Claude. Nhờ đó, cuộc trò chuyện có thể tiếp tục mà không bị gián đoạn khi mô hình chạm giới hạn ngữ cảnh; thay vào đó, mô hình sẽ tự nén lại bộ nhớ ngữ cảnh mà không thông báo cho người dùng.

Nhiều nâng cấp của Opus 4.5 hướng đến các kịch bản tác nhân (agentic use cases) - đặc biệt là những tình huống trong đó Opus đóng vai trò tác nhân chính, điều phối các tác nhân phụ chạy trên Haiku. Những công việc như vậy đòi hỏi khả năng quản lý working memory cực kỳ tốt - chính là nơi các cải tiến bộ nhớ mà Penn nhắc tới phát huy hiệu quả.

“Đây là lý do những yếu tố nền tảng như bộ nhớ trở nên rất quan trọng,” Penn nói. “Claude cần có khả năng khám phá codebase, đọc các tài liệu lớn, và biết khi nào phải quay lại, kiểm tra lại điều gì đó.”

Opus 4.5 sẽ đối mặt với cạnh tranh lớn từ các mô hình hàng đầu vừa ra mắt gần đây - đáng chú ý nhất là GPT 5.1 của OpenAI (phát hành ngày 12/11) và Gemini 3 của Google (phát hành ngày 18/11).