Nvidia lên kế hoạch ra mắt chip mới tăng tốc xử lý AI

13:39, 02/03/2026

Nền tảng mới dự kiến được công bố tại hội nghị nhà phát triển Nvidia GTC ở San Jose vào tháng tới và sẽ tích hợp một con chip do startup Groq thiết kế.

Nvidia lên kế hoạch cho chip mới. Ảnh: Reuters

Nvidia có kế hoạch ra mắt bộ xử lý mới nhằm giúp OpenAI và các khách hàng khác xây dựng hệ thống AI nhanh hơn, hiệu quả hơn, theo Wall Street Journal dẫn lời các nguồn thạo tin hôm thứ Sáu.

Theo báo cáo, Nvidia đang phát triển một hệ thống mới dành cho điện toán “inference” – hình thức xử lý cho phép các mô hình AI phản hồi truy vấn của người dùng.

Nền tảng mới dự kiến được giới thiệu tại sự kiện Nvidia GTC ở San Jose vào tháng tới và sẽ tích hợp con chip do Groq thiết kế, nguồn tin cho biết thêm.

Hãng tin Reuters chưa thể xác minh ngay thông tin này. Nvidia và OpenAI hiện chưa phản hồi yêu cầu bình luận từ Reuters.

Trước đó trong tháng này, Reuters đưa tin OpenAI không hài lòng với tốc độ phần cứng của Nvidia trong việc tạo phản hồi cho người dùng ChatGPT đối với một số tác vụ cụ thể như phát triển phần mềm và giao tiếp giữa các hệ thống AI với phần mềm khác.

Một nguồn tin cho Reuters biết OpenAI cần phần cứng mới có thể đáp ứng khoảng 10% nhu cầu điện toán inference của hãng trong tương lai.

Nhà phát triển ChatGPT đã thảo luận về khả năng hợp tác với các startup, trong đó có Cerebras và Groq, để cung cấp chip phục vụ inference nhanh hơn, hai nguồn tin cho biết. Tuy nhiên, Nvidia đã ký thỏa thuận cấp phép trị giá 20 tỷ USD với Groq, khiến các cuộc đàm phán giữa OpenAI và startup này chấm dứt, một nguồn tin nói với Reuters.

Hồi tháng 9, Nvidia cho biết có ý định đầu tư tới 100 tỷ USD vào OpenAI trong khuôn khổ một thỏa thuận giúp hãng sản xuất chip này nắm cổ phần tại startup AI, đồng thời cung cấp cho OpenAI nguồn tài chính để mua các chip tiên tiến.