Google tham vọng xây dựng mô hình AI hỗ trợ 1.000 ngôn ngữ
Hệ thống mà Google đang nghiên cứu phát triển hiện đã có thể dịch được 100 ngôn ngữ khác nhau. Nhưng đây mới chỉ là bước đi đầu tiên.
Cùng với các kế hoạch được đồn đại là giới thiệu hơn 20 sản phẩm được hỗ trợ bởi trí tuệ nhân tạo trong sự kiện I/O năm nay, Google đang tiến tới mục tiêu xây dựng một mô hình AI hỗ trợ 1.000 ngôn ngữ khác nhau.
Trong bản cập nhật được đăng vào ngày 6.3, Google đã chia sẻ thêm thông tin về Universal Speech Model (USM), một hệ thống mà gã khổng lồ công nghệ mô tả là “bước đầu tiên quan trọng” trong việc thực hiện các mục tiêu của mình.
Tháng 11 năm ngoái, công ty đã công bố kế hoạch tạo ra một mô hình AI hỗ trợ 1.000 ngôn ngữ được sử dụng nhiều nhất trên thế giới, đồng thời tiết lộ mô hình USM của mình.
Google ôm tham vọng xây dựng mô hình AI có thể xử lý tới 1.000 ngôn ngữ.
Google mô tả USM là “một nhóm mô hình giọng nói tiên tiến nhất” với 2 tỉ tham số được đào tạo trên 12 triệu giờ nói và 28 tỉ câu nói đến từ hơn 300 ngôn ngữ khác nhau.
YouTube đã sử dụng USM để tạo phụ đề chi tiết cũng như hỗ trợ nhận dạng giọng nói tự động (ASR). Khả năng này giúp nó tự động phát hiện và dịch các ngôn ngữ, bao gồm tiếng Anh, tiếng Trung Quốc, tiếng Amharic, tiếng Cebuano, tiếng Assam, v.v.
Hiện tại, Google cho biết USM hỗ trợ hơn 100 ngôn ngữ và sẽ đóng vai trò là “nền tảng” để xây dựng một hệ thống mở rộng hơn nữa. Meta đang làm việc trên một công cụ dịch AI tương tự, nhưng vẫn đang ở giai đoạn đầu phát triển.
Công nghệ này có thể được tích hợp trong kính thực tế tăng cường, giống như khái niệm mà Google đã trình diễn trong sự kiện I/O năm ngoái.
Nó có thể phát hiện và cung cấp các bản dịch theo thời gian thực, xuất hiện ngay trước mắt người dùng trong không gian ảo.
Tuy nhiên, công nghệ này dường như vẫn còn hơi xa vời và việc Google trình bày sai ngôn ngữ tiếng Ả Rập trong I/O chứng tỏ nó vẫn cần nhiều thời gian hơn để phát triển.
Mô hình ngôn ngữ này hiện đã được được sử dụng trên mạng xã hội chia sẻ video YouTube để tạo phụ đề cho các video. Tuy nhiên mới chỉ có 73 trong số 100 ngôn ngữ của USM được hỗ trợ hiển thị trên YouTube.
Google hiện không phải là công ty duy nhất trong lĩnh vực dịch thuật dựa trên AI, nhưng triển vọng áp dụng công nghệ máy học vào dịch thuật là một hướng đi thú vị.
Hiện chưa rõ Google dự định sẽ làm điều gì với USM, nhưng khả năng ứng dụng của nó là vô tận. Mô hình này càng có giá trị nếu nó có thể ghi nhận và dịch các câu nói theo thời gian thực, với kết quả dịch có thể hiển thị dưới dạng ký tự hoặc lời nói do AI tổng hợp. Và giá trị của USM sẽ chỉ càng tăng thêm nếu nó có khả năng dịch các văn bản nhanh hơn, hiệu quả hơn.
Một kịch bản hay ho có thể tính tới là chúng ta có những chiếc kính thực tế ảo tăng cường, với khả năng tự động nhận diện rồi dịch các ngôn ngữ khác nhau về ngôn ngữ mẹ đẻ mà không cần chờ ra lệnh.
Sẽ còn hay hơn nữa nếu AI tự nhận diện những thứ gì nó không nên dịch ra. Ví dụ như nó tự lọc các cuộc trò chuyện của những người ở xung quanh và không bơm vào tai chúng ta đủ loại câu chuyện khác nhau.
Tuy nhiên vẫn còn một chặng đường dài trước khi USM đạt được mục tiêu ban đầu là bao gồm tới 1.000 ngôn ngữ. 100 ngôn ngữ là một khởi đầu tuyệt vời, nhưng vẫn còn nhiều ngôn ngữ hơn thế đang tồn tại trên thế giới. Vì thế, chúng ta sẽ phải chờ xem điều gì sẽ xảy ra tiếp theo.
Sự kiện Google I/O (một hội nghị thường niên của Google) sắp sửa diễn ra. Với những tin đồn về việc Google đang phát triển khoảng 20 sản phẩm AI, chúng ta có thể sẽ được nghe về chúng cũng như USM trong các bài phát biểu chính tại sự kiện.
Chân Hoàn (T/h)
- Google Doodle tôn vinh những điều mà phụ nữ đã làm cho nhau
- Google mang Magic Eraser đến với tất cả những người đăng ký Google One - người dùng iPhone
- Google đạt cột mốc quan trọng trong nỗ lực phát triển điện toán lượng tử
- Một số nhân viên Google được cho là không hài lòng về thông báo 'vội vàng' của Bard