Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam

09:41, 13/02/2025

Google muốn hợp tác với Chính phủ và tổ chức trong nước để phát triển mô hình ngôn ngữ lớn và khai thác tiềm năng của AI tại Việt Nam.

Mô hình ngôn ngữ lớn chỉ phát huy hết tác dụng khi được lập trình bằng nguồn dữ liệu tiếng Việt.

Đây là một trong các đề xuất hợp tác được Tổng giám đốc Công ty TNHH Google Việt Nam Marc Woo đề cập tại Hội nghị phát triển khoa học công nghệ, đổi mới sáng tạo, chiều 11/02 ở Hà Nội.

Theo ông Woo, lĩnh vực trí tuệ nhân tạo trong nước thời gian qua có nhiều bước tiến, nhưng để có sự phát triển vượt bậc, Việt Nam vẫn rất cần một lực lượng tri thức, lao động cũng như doanh nghiệp lành nghề, thành thạo công nghệ AI.

Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam

Đại diện Google tại Việt Nam cho rằng, mô hình ngôn ngữ lớn (LML) chỉ phát huy hết tác dụng khi được lập trình bằng nguồn dữ liệu tiếng Việt (Ảnh: VNG Cloud)

Ông Woo cho rằng, dữ liệu và mô hình có thể quyết định sức mạnh của công nghệ AI. Thời gian qua, Google đã dành nhiều nguồn lực xây dựng các mô hình ngôn ngữ lớn, nhưng các mô hình này "chỉ phát huy được hết tác dụng khi chúng được đào tạo bằng nguồn dữ liệu, đặc biệt là tiếng Việt đa dạng và chất lượng cao".

"Chúng tôi rất mong được hợp tác với Chính phủ, các tổ chức, trường đại học, để cùng phát triển mô hình ngôn ngữ lớn, hiện đại và mang đậm tinh hoa tiếng Việt", ông Woo nói.

Đại diện Google tại Việt Nam đánh giá, việc xây dựng bộ dữ liệu quốc gia mở, cho phép khai thác để xây dựng ứng dụng AI là điểm tích cực của Việt Nam, sẵn sàng trao đổi và chia sẻ bài học kinh nghiệm để phát triển.

Về nguồn nhân lực, Tổng giám đốc Công ty TNHH Google Việt Nam cho biết, sẽ tiếp tục cung cấp học bổng và chương trình đào tạo nâng cao kỹ năng AI cho những người đủ điều kiện. Với học sinh, sinh viên và giáo viên, Google sẵn sàng cung cấp tài khoản truy cập miễn phí gói giải pháp Google WorkSpace, Classroom - công cụ hỗ trợ học tập và giảng dạy bằng trí tuệ nhân tạo.

Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam

LML là các chương trình máy tính có thể phân tích và tạo ra văn bản bằng nguồn dữ liệu ngôn ngữ. Trước đó, mô hình LML của Google đã thành công với nhiều nguồn dữ liệu ngôn ngữ trên thế giới, hiện Google mong muốn LML được phát huy hết tác dụng với nguồn dữ liệu tiếng Việt (Ảnh minh họa: Internet)

Hiện phần lớn chatbot AI phổ biến đều hỗ trợ tiếng Việt, tuy nhiên khả năng xử lý của các mô hình ngôn ngữ lớn đứng sau có nhiều khác biệt.

Báo cáo tình hình phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt thông qua bộ tiêu chuẩn VMLU được công bố tháng 1/2025 cho thấy, có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng tính đến cuối 2024 từ các doanh nghiệp, tổ chức trong và ngoài nước.

Trong đó, Llama-3-70B của Meta, KiLM-13b-v24.7.1 của Zalo AI, GPT-4 của OpenAI là những mô hình dẫn đầu năng lực tiếng Việt tổng quát, cao hơn Gemma hay Gemini của Google.

Chính phủ Việt Nam từng đề nghị Google hỗ trợ lập “vườn ươm AI”

Trước đó, ngày 25/09/2024, trong buổi gặp gỡ ông Karan Bhatia, Phó chủ tịch phụ trách Quan hệ Chính phủ và Chính sách công của Google tại New York, Tổng Bí thư, Chủ tịch nước Tô Lâm đã đề nghị Google hợp tác trong hai sáng kiến thúc đẩy nghiên cứu AI tại Việt Nam; tiếp tục có tiếng nói, định hướng các nhà cung ứng của mình mở rộng đầu tư kinh doanh tại Việt Nam; hỗ trợ nâng cao năng lực, giúp doanh nghiệp Việt Nam tham gia vào chuỗi cung ứng của tập đoàn.

Logo Google tại Việt Nam (Ảnh: Lưu Quý)

Đồng thời, Tổng Bí thư, Chủ tịch nước mong muốn có sự hợp tác chặt chẽ giữa Google với Việt Nam về đào tạo lĩnh vực trí tuệ nhân tạo, phối hợp với Trung tâm Đổi mới sáng tạo Quốc gia Việt Nam (NIC) và các cơ quan, viện, trường đại học trong nước triển khai hai sáng kiến: Phát triển trung tâm R&D về AI tại Việt Nam và hỗ trợ thiết lập "vườn ươm AI", để hỗ trợ những ý tưởng mới và sáng tạo trong lĩnh vực này.

Trong buổi gặp gỡ, ông Karan Bhatia khẳng định cam kết của Google, tập đoàn đang và sẽ tiếp tục phối hợp, hỗ trợ Việt Nam trong đào tạo nguồn nhân lực chất lượng cao về AI, đồng thời, tư vấn về môi trường chính sách, pháp lý theo hướng tối ưu hóa để phát triển AI, trong đó có những quy định về dịch chuyển dữ liệu. Google kỳ vọng hỗ trợ Việt Nam về dịch vụ đám mây kết hợp AI, cũng như hợp tác trong lĩnh vực an ninh mạng.

Việt Nam là thị trường có nền kinh tế số phát triển mạnh mẽ, thuộc nhóm dẫn đầu khu vực Đông Nam Á

Năm 2024, tập đoàn Google đã mở văn phòng mới ở TP HCM (Công ty TNHH Google Việt Nam), và mở thêm một số cơ sở sản xuất điện thoại và linh kiện đang hoạt động hiệu quả tại Việt Nam. Theo thông tin trên trang tra cứu về mã số thuế, Google Việt Nam được đăng ký từ tháng 5/2023, có địa chỉ tại TP HCM.

Website của Google cũng đồng thời cập nhật thông tin, các nhà quảng cáo tại Việt Nam sẽ thực hiện thủ tục về thuế thông qua Công ty TNHH Google Việt Nam, thay cho Google Asia Pacific trước đây. Việc chuyển đổi sẽ thực hiện từ ngày 1/4/2024. Các đối tác thực hiện mức thuế 10% theo quy định của Việt Nam từ 1/3/2024.

Trong tham vọng vươn ra quốc tế, Google đánh giá Việt Nam là thị trường có nền kinh tế số phát triển mạnh mẽ, thuộc nhóm dẫn đầu khu vực Đông Nam Á. Bên cạnh đó, Việt Nam là nước có sự đồng lòng, nhất quán của người dân và Chính phủ, chú trọng về phát triển khoa học công nghệ, trong đó có AI và công nghệ số.