Google triển khai tính năng dịch giọng nói trực tiếp trong cuộc gọi video
CEO Sundar Pichai gọi đây là "công nghệ giúp phá vỡ rào cản ngôn ngữ" và được hãng triển khai trước tiên trên ứng dụng Google Meets.
Trong video giới thiệu, lời nói bằng tiếng Tây Ban Nha được AI chuyển đổi sang tiếng Anh một cách mượt mà và tự nhiên, và ngược lại, dù vẫn tồn tại độ trễ nhỏ. Đáng chú ý, hệ thống sử dụng chính giọng nói gốc của người dùng để tái tạo bản dịch, trong khi âm thanh ban đầu vẫn được giữ lại với âm lượng nền thấp, tạo cảm giác chân thực và liên tục trong hội thoại.
Tính năng này được đánh giá hữu ích trong nhiều tình huống, như gia đình sinh sống ở nhiều quốc gia khác nhau với những ngôn ngữ khác nhau, hoặc được sử dụng bởi các công ty đa quốc gia, cho phép đồng nghiệp toàn cầu kết nối và trò chuyện thời gian thực.
Theo Google, độ trễ khi dịch rất thấp, điều mà các giải pháp khác chưa thể làm được hiện nay.
Tính năng mới ban đầu hỗ trợ dịch tiếng Anh và Tây Ban Nha, chỉ khả dụng với với các thuê bao Google AI Pro và Ultra. Hãng cho biết nhiều ngôn ngữ khác sẽ được triển khai dần "trong vài tuần tới", đồng thời sẽ mở rộng thử nghiệm với khách hàng doanh nghiệp trên Workspace trong năm nay.
Dịch giọng nói thời gian thực là một trong những kết quả của dự án Starline công bố năm 2021. Dự án đưa ra ý tưởng con người có thể thực hiện cuộc gọi với cảm giác chân thực. Ngoài các công nghệ về ngôn ngữ, họ còn phát triển hệ thống camera 3D để tái hiện hình ảnh của người gọi điện. Tại Google I/O 2025, hãng cũng giới thiệu Google Beam, một thiết bị phần cứng hỗ trợ gọi điện dự án này.