Chip AI thế hệ mới của Nvidia gặp vấn đề lớn khi hoạt động trong môi trường máy chủ
Dòng chip AI Blackwell mới của Nvidia, hiện đang đối mặt với một vấn đề nghiêm trọng khi các máy chủ đi kèm bị quá nhiệt. Điều này đã làm dấy lên lo ngại từ phía một số khách hàng, vì họ e rằng sẽ không kịp triển khai các trung tâm dữ liệu mới đúng tiến độ.
Chip xử lý đồ họa Blackwell mới của Nvidia, vốn được kỳ vọng là bước đột phá trong công nghệ AI, đang gặp phải vấn đề nghiêm trọng khi các máy chủ chứa tới 72 chip này bị quá nhiệt. Theo báo cáo từ các nguồn tin thân cận, sự cố xảy ra khi các chip được kết nối trong giá đỡ máy chủ, gây cản trở quá trình triển khai và vận hành.
Các nhân viên Nvidia, cùng với khách hàng và nhà cung cấp có hiểu biết về vấn đề này, cho biết Nvidia đã phải yêu cầu các nhà cung cấp thay đổi thiết kế giá đỡ nhiều lần để giải quyết vấn đề quá nhiệt. Tuy nhiên, danh tính các nhà cung cấp vẫn chưa được tiết lộ.
Sản phẩm chip AI thế hệ mới của Nvidia đang đối mặt với thách thức về nhiệt độ khi vận hành trong môi trường máy chủ (Ảnh: Reuters)
Phản hồi về sự cố, phát ngôn viên của Nvidia chia sẻ: “Nvidia đang hợp tác chặt chẽ với các nhà cung cấp dịch vụ đám mây hàng đầu như một phần không thể thiếu trong nhóm kỹ thuật và quy trình của chúng tôi. Các lần lặp lại kỹ thuật là điều bình thường và được mong đợi”.
Nvidia đã giới thiệu chip Blackwell vào tháng 3 và ban đầu dự kiến sẽ xuất xưởng vào quý 2. Tuy nhiên, sự chậm trễ trong việc giải quyết vấn đề kỹ thuật có khả năng ảnh hưởng lớn đến các khách hàng lớn như Meta Platforms, Google (thuộc Alphabet), và Microsoft, những công ty đang kỳ vọng vào hiệu suất vượt trội của chip Blackwell để triển khai trung tâm dữ liệu AI thế hệ mới.
Chip Blackwell sử dụng hai ô silicon ghép lại thành một thành phần duy nhất, mang lại hiệu suất nhanh hơn 30 lần so với thế hệ trước trong các tác vụ AI như phản hồi từ chatbot. Điều này khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng AI hiện đại. Tuy nhiên, những thách thức hiện tại có thể làm giảm kỳ vọng của thị trường đối với sản phẩm này nếu Nvidia không sớm khắc phục triệt để sự cố.
Trong bối cảnh cạnh tranh khốc liệt trong lĩnh vực AI, việc Nvidia giải quyết vấn đề này một cách hiệu quả sẽ là yếu tố quyết định khả năng duy trì vị thế dẫn đầu của hãng trên thị trường công nghệ.