Meta công bố AI dịch ngôn ngữ không cần chữ viết

14:58, 20/10/2022

AI của Meta đã dịch thành công tiếng Phúc Kiến, vốn không có hệ thống chữ viết cụ thể. Đây là ngôn ngữ được sử dụng bởi gần 49 triệu người ở các quốc gia như Trung Quốc, Đài Loan, Malaysia, Philippines…

Các công cụ dịch thuật bằng trí tuệ nhân tạo (AI) thường tập trung vào những ngôn ngữ có dạng viết. Trong khi đó, gần một nửa ngôn ngữ trên thế giới tồn tại dưới dạng nói, chưa có hệ thống chữ viết hoàn chỉnh.

Những thứ tiếng này gây ra vấn đề lớn cho hệ thống dịch thuật bằng AI vì chúng phải được chuyển từ ngôn ngữ nói sang ngôn ngữ viết, sau đó mới có thể dịch theo nhu cầu của người dùng và lại chuyển về ngôn ngữ nói.

Nhưng Meta cho biết khắc phục hạn chế này với AI mã nguồn mở thuộc dự án Universal Speech Translator (UST) của mình.

Meta công bố "hệ thống dịch ngôn ngữ nói bằng AI đầu tiên trên thế giới”.

Hôm 19/10, hãng công nghệ đã công bố “hệ thống dịch ngôn ngữ nói bằng AI đầu tiên trên thế giới”. AI của Meta đã dịch thành công tiếng Phúc Kiến, vốn không có hệ thống chữ viết cụ thể. Đây là ngôn ngữ được sử dụng bởi gần 49 triệu người ở các quốc gia như Trung Quốc, Đài Loan, Malaysia, Philippines…

“Công nghệ của chúng tôi giúp người Phúc Kiến có thể giao tiếp thoải mái với người nói tiếng Anh”, hãng khẳng định.

Để huấn luyện AI hiểu ngôn ngữ của con người, các nhà nghiên cứu thông thường sẽ cung cấp bộ dữ liệu chữ viết khổng lồ cho hệ thống máy tính. Nhưng tiếng Phúc Kiến lại không có đủ thông tin cho quá trình này.

Vì thế, họ đã tìm cách dịch trực tiếp từ giọng nói, không thông qua văn bản. Meta cho biết ngôn ngữ ban đầu sẽ được chuyển thành một chuỗi âm thanh bằng nhạc cụ, giúp tạo sóng âm thanh cho đoạn hội thoại. Meta cho biết hiện công cụ dịch tiếng Phúc Kiến vẫn đang trong quá trình phát triển và chỉ có thể dịch được một câu trong một lần.

Hãng khẳng định hệ thống dịch thuật này là cột mốc quan trọng đầu tiên của dự án UST. Dự án này tập trung phát triển công nghệ AI có khả năng dịch thuật tức thì với mọi ngôn ngữ, kể cả ngôn ngữ nói.

Theo Meta, các công nghệ AI trước đó mới chỉ có thể dịch ngôn ngữ viết nhưng mục tiêu của tập đoàn công nghệ là dịch nhiều thứ tiếng khác dù không có hệ thống chữ viết.

Trong video công bố, Mark Zuckerberg cũng khẳng định Meta sẽ phát triển công cụ mã nguồn mở, giúp người dùng có thể dịch sang nhiều ngôn ngữ khác theo nhu cầu. Trước đó, tập đoàn cũng từng công bố BlenderBot 3 nhằm xây dựng một chatbot hoàn toàn bằng AI.

Khôi Nguyên (T/h)