Hàn Quốc: Dùng bài báo và sách giáo khoa để huấn luyện AI là hành vi vi phạm bản quyền

07:54, 05/12/2025

Chính phủ Hàn Quốc khẳng định việc các mô hình trí tuệ nhân tạo sử dụng toàn bộ bài báo hoặc sách giáo khoa để huấn luyện mà không có phép là hành vi xâm phạm bản quyền.

Ngày 4/12, Bộ Văn hóa, Thể thao và Du lịch cùng Ủy ban Bản quyền Hàn Quốc đã tổ chức họp báo công bố hướng dẫn mới về khái niệm “sử dụng hợp lý” trong huấn luyện AI.

Tài liệu có tên Hướng dẫn về sử dụng hợp lý tác phẩm cho huấn luyện AI tạo sinh làm rõ rằng việc thu thập quy mô lớn các tài liệu có bản quyền, gồm bài báo, sách giáo khoa, hình ảnh thương mại và âm nhạc, không được phép theo luật hiện hành.

Theo luật bản quyền của Hàn Quốc, việc sử dụng tác phẩm  chỉ được coi là sử dụng hợp lý khi hành vi đó không mâu thuẫn với việc khai thác bình thường tác phẩm hoặc không gây thiệt hại bất hợp lý cho chủ sở hữu quyền. Tuy nhiên, sự phát triển nhanh chóng của AI tạo sinh đang làm dấy lên tranh cãi về việc liệu hoạt động thu thập dữ liệu hàng loạt để huấn luyện mô hình có thuộc phạm vi ngoại lệ này hay không.

Hướng dẫn mới nêu bốn yếu tố khiến việc sử dụng không thể xem là hợp lý, gồm, gây hại cho lợi ích hợp pháp của chủ bản quyền, thiếu yếu tố chuyển đổi mục đích rõ rệt, không mang lại lợi ích xã hội hoặc công cộng, và nhằm mục đích thương mại.

Cơ quan quản lý dẫn chứng ví dụ, việc huấn luyện AI bằng toàn bộ nội dung bài báo để tạo bản tóm tắt thương mại không được xem là sử dụng hợp lý, vì không có tính chuyển đổi ý nghĩa và có thể gây tổn hại kinh tế cho các nhà xuất bản, ủy ban cho biết.

Tương tự, việc đưa toàn bộ sách giáo khoa đã mua hợp pháp vào mô hình AI để tạo ra sách giáo khoa mới hoặc sách bài tập cũng bị coi là vi phạm, do có nguy cơ làm suy yếu vị thế thị trường của các nhà xuất bản.

Việc dùng hình ảnh thương mại có trả phí làm dữ liệu huấn luyện để sinh ra hình ảnh phái sinh cũng bị xem là xâm phạm bản quyền, đặc biệt khi có hành vi vượt qua các biện pháp bảo vệ công nghệ.

Cùng với đó, việc các hệ thống AI được huấn luyện bằng tệp nhạc đã mua để tạo ra “bản cover AI” cũng bị đánh giá là có khả năng thay thế trực tiếp bản gốc, gây thiệt hại kinh tế rõ ràng.

Hướng dẫn cũng nêu các trường hợp mà việc huấn luyện AI có thể được coi là sử dụng hợp lý, gồm, sử dụng bộ dữ liệu công khai cho nghiên cứu xử lý ngôn ngữ tự nhiên, huấn luyện trên các bài báo khoa học được truy cập công khai để tạo bản tóm tắt, dùng dữ liệu số và biểu đồ có sẵn trong nghiên cứu STEM, và phân tích video thu thập hợp pháp trong nghiên cứu hành vi phạm tội.

Ông Kang Seok won, Chủ tịch Ủy ban Bản quyền, cho biết tài liệu phản ánh quá trình tham vấn sâu rộng giữa các chủ sở hữu quyền và nhà phát triển AI, ông nói rằng, “Chúng tôi muốn đưa ra một tiêu chuẩn diễn giải phù hợp điều kiện trong nước, chúng tôi hy vọng hướng dẫn này sẽ giảm bớt sự bất định liên quan đến huấn luyện AI.”

Tại Việt Nam, nhằm đón đầu làn sóng công nghệ AI, Chính phủ cũng đang nhanh chóng hoàn thiện dự thảo Luật Trí tuệ nhân tạo để tạo hành lang phát triển AI đảm bảo an toàn và có đạo đức.