Áp dụng công nghệ tiên tiến trong lĩnh vực nghiên cứu về xử lý tiếng nói và ngôn ngữ tiếng Việt

08:54, 27/11/2022

Ngày 26/11/2022, Hội thảo lần thứ 9 về Xử lí ngôn ngữ và tiếng nói tiếng Việt - VLSP 2022 đã diễn ra tại Viện Nghiên cứu Cao cấp về Toán (VIASM). Hội thảo do Câu lạc bộ Xử lí ngôn ngữ và tiếng nói tiếng Việt (VLSP), Hội Tin học Việt Nam (VAIP) tổ chức, với sự phối hợp của Trường ĐH KHTN và Viện Toán cao cấp... Tại hội thảo, Ban tổ chức đã báo cáo tổng kết các cuộc thi, trao giải thưởng cho các đội xuất sắc.

Để hội thảo được duy trì và ngày càng hiệu quả hơn qua các năm, bên cạnh nỗ lực của mọi thành viên Ban Tổ chức, còn ghi nhận sự hỗ trợ tích cực của nhiều đơn vị, đặc biệt là doanh nghiệp sẵn sàng tài trợ, đóng góp dữ liệu, kinh phí cho hội thảo và các cuộc thi. Đây đều là những đóng góp, ủng hộ hoàn toàn tự nguyện, vì sự phát triển của cộng đồng VLSP. Đặc biệt phải kể đến những đơn vị tài trợ thường niên như Aimesoft, Dagoras, VBee, Int2.

TS. Nguyễn Thị Minh Huyền trao chứng nhận cho đơn vị tài trợ.

TS. Nguyễn Thị Minh Huyền, Trường ĐH Khoa học Tự nhiên, ĐHQG Hà Nội, Chủ tịch Câu lạc bộ VLSP, cho biết, VLSP 2022 đã tổ chức 7 cuộc thi về xử lý tiếng nói và văn bản. Trong đó gồm tổng hợp, nhận dạng tiếng nói, xác định người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.

Theo Ban Tổ chức, nhận dạng tiếng nói tiếng Việt (Vietnamese Automatic Speech Recognition - VietASR) là một trong những bài toán quan trọng nhất của xử lý tiếng nói. Chủ đề của cuộc thi năm nay tập trung vào nhận dạng các bài giảng trực tuyến.

TS. Nguyễn Thị Thu Trang, Trường ĐH Bách khoa Hà Nội cho hay, các đội thi năm nay chinh phục 4 sắc thái cảm xúc phổ biến bao gồm trung lập, buồn, vui và cáu giận. Các đội cần nghiên cứu và phát triển hệ thống tổng hợp tiếng nói với các nhãn cảm xúc đầu vào, để đưa ra giọng nói đầu ra tương ứng với nhãn cảm xúc đó.

TS. Nguyễn Thị Minh Huyền cho biết, trong những năm gần đây, chuỗi hội thảo của Câu lạc bộ Xử lí ngôn ngữ và tiếng nói tiếng Việt (VLSP), Hội Tin học Việt Nam đã có những đóng góp rất tích cực cho cộng đồng thông qua việc cung cấp các bộ dữ liệu có chú giải miễn phí dùng trong nghiên cứu.

Thông qua tổ chức các cuộc thi cho các nhóm nghiên cứu xử lí ngôn ngữ, Ban tổ chức có được đánh giá khách quan về chất lượng các công cụ giải quyết các tác vụ khác nhau trong lĩnh vực xử lí ngôn ngữ tự nhiên, qua đó cộng đồng nghiên cứu cũng được chia sẻ các tiến bộ khoa học công nghệ nhờ các báo cáo khoa học của các đội thi xuất sắc nhất tại hội thảo.

Chung cuộc, các đội sau đây đã giành giải nhất trong 7 nội dung thi.

* Nhận dạng tiếng nói: Đội thi đến từ Trung tâm Không gian mạng Viettel gồm Đặng Đình Sơn, Lê Nhật Minh, Lê Đăng Linh.

* Tổng hợp tiếng nói: Đội thi của VinBigData gồm Nguyễn Văn Thịnh, Đỗ Trí Nhân, Phạm Hùng Cường, Hồ Tuấn Vũ, Mạc Đăng Khoa.

* Xác minh người nói đa ngữ cho các ngôn ngữ Ấn:

Có ràng buộc tài nguyên: Đội thi của Northwestern Polytechnical University (NPU), China.

Không ràng buộc tài nguyên: Đội thi của Học viện Công nghệ Bưu chính Viễn thông và VNG gồm Tue Nguyen Van, Dung Nguyen Duy.

Xác minh người nói các ngôn ngữ châu Á: Đội thi đến từ InterITS JSC và Đại học Thái Nguyên gồm Van Tuan Mai, Hung Dinh Van, , Quynh Dam Ba, Quoc Bao Nguyen.

* Phân tích cú pháp thành phần tiếng Việt: Đội thi đến từ Trường ĐH Stanford.

Hỏi đáp đa ngữ về nội dung ảnh: Đội thi đến từ CMC Applied Technology Institute, CMC Corporation gồm Nguyễn Tiến Đồng, Lê Vũ Lợi, Trần Thị Minh Tươi, Nguyễn Vạn Nhã.

* Dịch máy: Đội thi của Samsung SDS R&D Center gồm Tran Ngoc Son, Nguyen Anh Tu, Nguyen Minh Tri.

* Tóm tắt tóm lược đa văn bản: Đội thi đến từ Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội gồm Nguyễn Thái Bình, Nguyễn Tấn Minh, Nguyễn Hải Long.

Câu lạc bộ Xử lí Ngôn ngữ và Tiếng nói Tiếng Việt công bố và trao giải cho các đội đã giành giải trong 7 nội dung thi.