Google ra mắt Ironwood – bộ xử lý AI mạnh nhất từ trước đến nay
Google vừa ra mắt bộ xử lý AI thế hệ mới mang tên Ironwood, với hiệu suất tính toán vượt xa mọi siêu máy tính hiện nay. Con chip được thiết kế tối ưu cho suy luận, đánh dấu bước chuyển mạnh mẽ sang kỷ nguyên AI chủ động và thông minh hơn.
Khác với các TPU trước đây vốn tập trung vào huấn luyện mô hình, Ironwood được tối ưu cho giai đoạn suy luận – tức việc áp dụng những gì mô hình đã học vào các tình huống thực tế. Amin Vahdat, Phó Chủ tịch Google phụ trách hệ thống ML và AI đám mây, nhận định: “Đây là những gì chúng tôi gọi là 'kỷ nguyên suy diễn', nơi AI trở thành một tác nhân chủ động, không chỉ phản hồi mà còn hiểu và giải quyết vấn đề”.
Bộ xử lý Ironwood của Google. Ảnh: Google
Khi triển khai ở quy mô lớn với 9.216 chip, Ironwood đạt hiệu suất tính toán lên đến 42,5 exaflop – cao gấp 24 lần so với siêu máy tính nhanh nhất thế giới hiện nay là El Capitan (1,7 exaflop). Mỗi chip Ironwood sở hữu 192 GB bộ nhớ HBM, gấp sáu lần so với thế hệ trước (Trillium), cùng băng thông 7,2 terabit/giây, tăng 4,5 lần.
Google cho biết Ironwood là nền tảng chủ lực cho các mô hình AI tiên tiến như Gemini 2.5, đặc biệt là hai biến thể:
Gemini 2.5 Pro, phục vụ các tác vụ cao cấp như mô hình tài chính và nghiên cứu thuốc.
Gemini 2.5 Flash, phiên bản chi phí thấp hơn, linh hoạt điều chỉnh độ sâu lập luận dựa trên độ phức tạp của yêu cầu, hướng đến các ứng dụng hàng ngày.
Ngoài phần cứng, Google cũng ra mắt Cloud WAN – nền tảng quản lý mạng diện rộng, cho phép doanh nghiệp kết nối trực tiếp với cơ sở hạ tầng AI của Google, giảm độ trễ và tối ưu hiệu năng.
Với Ironwood, Google khẳng định vị thế dẫn đầu trong cuộc đua phần cứng AI, đồng thời thiết lập nền tảng cho thế hệ công nghệ AI tạo sinh tiếp theo – nơi tốc độ, hiệu quả và khả năng suy luận sẽ quyết định cuộc chơi.