Dịch vụ mới biến hạ tầng hiện tại thành môi trường AI hiệu năng cao
AI Factories, một dịch vụ mới mang đến cho doanh nghiệp và chính phủ một hạ tầng AI chuyên dụng, được triển khai trực tiếp trong trung tâm dữ liệu làm gia tăng hiệu năng.

Khi các chính phủ và tổ chức lớn tìm cách mở rộng các dự án AI, nhiều đơn vị đã bắt đầu hướng đến khái niệm “AI factory” (Nhà máy AI) để đáp ứng nhu cầu đặc thù về chủ quyền dữ liệu và tuân thủ quy định. Tuy nhiên, việc xây dựng một AI factory hiệu năng cao đòi hỏi một hệ thống toàn diện bao gồm quy trình quản lý, cơ sở dữ liệu, lưu trữ và bảo mật - với độ phức tạp mà ít khách hàng muốn tự mình gánh vác.
AWS AI Factories tích hợp các công cụ tăng tốc AI tiên tiến nhất, từ công nghệ điện toán NVIDIA AI hiện đại đến chip Trainium, kết hợp với khả năng mạng tốc độ cao, độ trễ thấp, hệ thống lưu trữ cùng cơ sở dữ liệu hiệu năng cao, bảo mật toàn diện, hạ tầng tiết kiệm năng lượng, và các dịch vụ AI mạnh mẽ của AWS như Amazon Bedrock và SageMaker AI. Nhờ đó, khách hàng có thể nhanh chóng phát triển và triển khai ứng dụng AI ở quy mô lớn, tối ưu hiệu suất và đáp ứng nhu cầu kinh doanh đặc thù.
Các tổ chức trong những ngành chịu sự quản lý chặt chẽ và khu vực công đang đối mặt với thách thức lớn về hạ tầng AI khi triển khai các dự án quy mô lớn. Việc tự xây dựng năng lực AI đòi hỏi khoản đầu tư khổng lồ vào GPU, trung tâm dữ liệu và năng lượng, đồng thời phải vượt qua các quy trình mua sắm phức tạp, lựa chọn mô hình phù hợp cho từng trường hợp sử dụng và ký kết giấy phép với nhiều nhà cung cấp AI khác nhau.
Tất cả những yếu tố này khiến lộ trình triển khai kéo dài nhiều năm, gia tăng sự phức tạp trong vận hành và làm các tổ chức bị phân tán khỏi mục tiêu kinh doanh cốt lõi.
AWS AI Factories mang đến giải pháp cho thách thức này bằng cách triển khai hạ tầng AI chuyên dụng của AWS ngay trong trung tâm dữ liệu của khách hàng, được vận hành độc quyền cho họ. AWS AI Factories hoạt động như một AWS Region riêng, cung cấp khả năng truy cập an toàn, độ trễ thấp vào dịch vụ tính toán, lưu trữ, cơ sở dữ liệu và AI.
Cách tiếp cận này cho phép tận dụng không gian trung tâm dữ liệu và năng lượng điện sẵn có, đồng thời mở quyền truy cập vào toàn bộ hạ tầng và dịch vụ AI của AWS - từ các chip AI tiên tiến nhất phục vụ huấn luyện và suy luận, đến các công cụ xây dựng, huấn luyện và triển khai mô hình AI.
Ngoài ra, dịch vụ được quản lý còn mang lại quyền truy cập vào các mô hình nền tảng (foundation model) hàng đầu mà không cần thương thảo hợp đồng riêng với từng nhà cung cấp, đồng thời giúp khách hàng đáp ứng đầy đủ yêu cầu về bảo mật, chủ quyền dữ liệu và tuân thủ quy định liên quan đến nơi dữ liệu được xử lý và lưu trữ.
AWS và NVIDIA tăng tốc triển khai hạ tầng AI cho khách hàng
Với sự tích hợp NVIDIA - AWS AI Factories, khách hàng AWS có quyền truy cập liền mạch vào nền tảng điện toán tăng tốc của NVIDIA, bộ phần mềm AI toàn diện cùng hàng nghìn ứng dụng tăng tốc bởi GPU, mang lại hiệu năng vượt trội, hiệu quả cao và khả năng mở rộng linh hoạt để phát triển các giải pháp AI thế hệ mới.
Những công nghệ tiên tiến nhất được kết hợp gồm: AWS Nitro System, mạng Elastic Fabric Adapter (EFA) ở quy mô petabit, và Amazon EC2 UltraClusters hỗ trợ các nền tảng mới nhất NVIDIA Grace Blackwell cùng thế hệ kế tiếp NVIDIA Vera Rubin.
Trong tương lai, AWS sẽ bổ sung hỗ trợ công nghệ kết nối chip tốc độ cao NVIDIA NVLink Fusion trên các chip Trainium4 và Graviton thế hệ mới, cũng như trong Nitro System. Sự tích hợp này giúp khách hàng rút ngắn thời gian đưa sản phẩm ra thị trường, đồng thời đạt hiệu năng vượt trội.
Hỗ trợ khu vực công tăng tốc ứng dụng AI
AWS AI Factories được thiết kế để đáp ứng các tiêu chuẩn bảo mật nghiêm ngặt nhất của AWS, mang lại cho khối khách hàng chính phủ sự tin cậy tuyệt đối khi vận hành những khối lượng công việc nhạy cảm ở mọi cấp độ phân loại: Không mật, nhạy cảm, mật và tuyệt mật.
Đồng thời, AWS AI Factories cung cấp cho các chính phủ trên toàn cầu khả năng sẵn sàng, độ tin cậy, bảo mật và quyền kiểm soát cần thiết để thúc đẩy tăng trưởng kinh tế và khai thác tối đa lợi ích từ công nghệ AI.
AWS và NVIDIA đang hợp tác chiến lược với HUMAIN, công ty toàn cầu có trụ sở tại Ả Rập Saudi chuyên phát triển năng lực AI toàn diện. Trong khuôn khổ hợp tác này, AWS sẽ xây dựng “AI Zone” tiên phong đầu tiên tại Ả Rập Saudi, với quy mô lên tới 150.000 chip AI, bao gồm GPU GB300, hạ tầng AI chuyên dụng của AWS và các dịch vụ AI của AWS, tất cả được triển khai trong trung tâm dữ liệu do HUMAIN thiết kế riêng./.
