Meta ra mắt chương trình mới để cải thiện AI về giọng nói và dịch thuật
Meta đang triển khai một chương trình mới hợp tác với UNESCO để thu thập các bản ghi âm và bản chép lời nói mà công ty cho biết sẽ giúp phát triển AI công khai trong tương lai.
Chương trình Đối tác Công nghệ Ngôn ngữ đang tìm kiếm những cộng tác viên có thể đóng góp hơn 10 giờ ghi âm giọng nói có kèm bản chép lại, một lượng lớn văn bản viết và các bộ câu đã dịch sang "nhiều ngôn ngữ khác nhau". Theo Meta, các đối tác sẽ làm việc với các nhóm AI của công ty để tích hợp các ngôn ngữ này vào các mô hình nhận dạng giọng nói và dịch thuật AI, khi hoàn thiện sẽ trở thành mã nguồn mở.
Các đối tác cho đến nay bao gồm chính quyền Nunavut, một vùng lãnh thổ thưa dân ở miền Bắc Canada. Một số cư dân Nunavut nói các ngôn ngữ Intuit được gọi chung là Inuktut.
"Những nỗ lực của chúng tôi đặc biệt tập trung vào các ngôn ngữ chưa được phục vụ, để hỗ trợ công việc của UNESCO", Meta viết trong bài đăng trên blog cung cấp cho TechCrunch. "Cuối cùng, mục tiêu của chúng tôi là tạo ra các hệ thống thông minh có thể hiểu và đáp ứng các nhu cầu phức tạp của con người, bất kể ngôn ngữ hay nền tảng văn hóa".
Bổ sung cho chương trình mới, Meta cho biết họ đang phát hành một chuẩn mực dịch máy mã nguồn mở để đánh giá hiệu suất của các mô hình dịch ngôn ngữ. Chuẩn mực này, bao gồm các câu do các nhà ngôn ngữ học tạo ra, hỗ trợ bảy ngôn ngữ và có thể được truy cập và đóng góp từ nền tảng phát triển AI Hugging Face.
Meta đang định hình cả hai sáng kiến này như một hoạt động từ thiện. Nhưng công ty sẽ được hưởng lợi từ việc nâng cấp các mô hình nhận dạng giọng nói và dịch thuật.
Meta tiếp tục mở rộng số lượng ngôn ngữ mà trợ lý AI của mình, Meta AI, hỗ trợ và thử nghiệm các tính năng như dịch tự động cho người sáng tạo. Tháng 9 năm ngoái, Meta đã thông báo rằng họ sẽ bắt đầu thử nghiệm một công cụ dịch giọng nói trong Instagram Reels, cho phép người sáng tạo lồng tiếng nói của họ và tự động đồng bộ hóa môi.
Cách Meta xử lý nội dung bằng các ngôn ngữ khác ngoài tiếng Anh trên các nền tảng của mình đã trở thành mục tiêu của nhiều lời chỉ trích. Theo một báo cáo, Facebook đã bỏ qua gần 70% thông tin sai lệch về COVID bằng tiếng Ý và tiếng Tây Ban Nha so với chỉ 29% thông tin sai lệch tương tự bằng tiếng Anh. Và các tài liệu bị rò rỉ từ công ty tiết lộ rằng các bài đăng bằng tiếng Ả Rập thường xuyên bị gắn cờ nhầm là ngôn từ kích động thù địch.
Meta cho biết họ đang thực hiện các bước để cải thiện công nghệ dịch thuật và kiểm duyệt.