Trí tuệ nhân tạo vẫn chưa có khả năng suy luận như con người

08:57, 24/11/2020

Bài kiểm tra đánh giá trình độ ngôn ngữ tại Đại học Nam California cho thấy trí tuệ nhân tạo (AI) chưa thể soạn những câu văn hợp lý và đúng ngữ cảnh, theo Techxplore.

Xử lý ngôn ngữ tự nhiên (Natural language processing - NLP) là một nhánh quan trọng của ngành trí tuệ nhân tạo, tập trung vào việc nghiên cứu tương tác giữa máy tính và ngôn ngữ tự nhiên của con người, với mục tiêu giúp máy tính có thể thực hiện những nhiệm vụ liên quan đến ngôn ngữ.

Trong bài báo công bố vào ngày 16.11 tại hội nghị Phát hiện Phương pháp Thực nghiệm trong Xử lý Ngôn ngữ Tự nhiên (Findings of Empirical Methods in Natural Language Processing - EMNLP), trợ lý giáo sư Xiang Ren và học trò Yuchen Lin trình bày thử nghiệm mới nhất của họ trong lĩnh vực NLP. Hai thầy trò đưa ra một loạt danh từ và động từ rồi giao cho máy tính soạn những câu mô tả tình huống hằng ngày. Chẳng hạn, với tập hợp từ "chó", "đĩa", "ném", "bắt", máy tính đặt câu: “hai con chó ném đĩa vào nhau”. Sau nhiều lần thử nghiệm, Xiang Ren và học trò nhận thấy rằng các câu mà máy tính tạo ra đều đúng ngữ pháp nhưng sai logic.

Trí tuệ nhân tạo vẫn chưa có khả năng suy luận như con người1

So sánh kết quả đặt câu giữa con người và máy tính. Những câu máy tính đặt là: "Con chó ném đĩa vào cầu thủ bóng đá", "Hai con chó ném đĩa vào nhau", "Một con chó ném đĩa và một con chó khác bắt đĩa"...

Bài kiểm tra này dựa trên giả định rằng trí tuệ nhân tạo vẫn chưa nắm vững những ý niệm thông thường như người ném đĩa và chó bắt đĩa. Mặt khác, một người có khả năng suy luận bình thường sẽ biết rằng hai con chó không thể ném đĩa vào nhau.

Yuchen Lin nhận định: "Robot cần hiểu các kịch bản tự nhiên trong cuộc sống hằng ngày trước khi thực hiện những hành động tương tác với con người. Con người có được khả năng đặt câu nhờ hiểu và ứng dụng các khái niệm mà họ nhận ra trong môi trường xung quanh. Khi AI đạt được khả năng này thì đây sẽ là một cột mốc quan trọng trong sự phát triển của nhân loại. Nhưng chúng tôi muốn kiểm tra xem máy tính có thể đạt được khả năng suy luận phổ quát hay không".

Minh Anh (T/h)