2 nhà xuất bản từ điển tố OpenAI vi phạm bản quyền diện rộng

16:18, 21/03/2026

Hai nhà xuất bản từ điển và bách khoa toàn thư hàng đầu là Encyclopaedia Britannica và Merriam-Webster mới đây đã đệ đơn kiện OpenAI, cáo buộc ChatGPT sử dụng trái phép nội dung biên soạn, làm giảm lưu lượng truy cập và doanh thu của các nhà xuất bản.

Trong đơn kiện gửi tới Tòa án Quận Nam New York, các nguyên đơn cho rằng OpenAI đã “ăn mòn” lưu lượng truy cập và doanh thu quảng cáo, nguồn sống cốt lõi của các nhà xuất bản. Theo đó, thay vì dẫn người dùng đến website như các công cụ tìm kiếm truyền thống, ChatGPT lại tổng hợp nội dung và cung cấp câu trả lời hoàn chỉnh ngay trên nền tảng.

Đơn kiện cũng cáo buộc OpenAI đã sử dụng các bài viết được nghiên cứu, kiểm chứng bởi đội ngũ biên tập viên và tác giả của họ để huấn luyện các mô hình ngôn ngữ lớn.

Vụ việc là diễn biến mới nhất trong làn sóng kiện tụng nhằm vào các công ty AI liên quan đến hành vi thu thập dữ liệu trái phép. Trước đó, năm 2023, một nhóm cá nhân ẩn danh đã kiện OpenAI vì thu thập “khối lượng lớn” dữ liệu cá nhân. Đến năm 2024, hai nhà văn tiếp tục khởi kiện, đại diện cho nhiều tác giả cáo buộc tác phẩm của họ bị sử dụng trái phép để huấn luyện AI. Không chỉ OpenAI, các công ty như Anthropic hay Perplexity AI cũng đối mặt với các cáo buộc tương tự.

Theo nguyên đơn, việc sử dụng các nội dung của các công ty công nghệ AI có thể tạo ra một “vòng xoáy tiêu cực”, khi doanh thu quảng cáo và thuê bao suy giảm sẽ dẫn đến chất lượng nội dung đi xuống, từ đó tiếp tục làm giảm doanh thu. Quá trình này có thể lặp lại và đẩy các nhà sáng tạo nội dung vào tình trạng suy thoái kéo dài.

Đáng chú ý, các nguyên đơn cho biết họ từng liên hệ với OpenAI vào tháng 11/2024 để đàm phán cấp phép sử dụng nội dung, nhưng không đạt được thỏa thuận. Trong đơn kiện, họ yêu cầu tòa án buộc OpenAI chịu trách nhiệm về những thiệt hại đáng kể và khoản “lợi nhuận bất hợp pháp” từ hành vi vi phạm bản quyền bị cáo buộc.

Ngoài ra, đơn kiện cũng cho rằng OpenAI vi phạm Lanham Act khi ChatGPT có thể tạo ra thông tin sai lệch hoặc “ảo giác” và gán nhầm nguồn cho các nhà xuất bản.

Phản hồi với báo chí, đại diện OpenAI khẳng định ChatGPT “giúp tăng cường sáng tạo, thúc đẩy khám phá khoa học và cải thiện cuộc sống của hàng trăm triệu người”. Công ty cho biết các mô hình của họ được huấn luyện trên dữ liệu công khai và dựa trên nguyên tắc “sử dụng hợp lý”.

Đơn kiện cũng nêu ví dụ cụ thể về hành vi sao chép nội dung. Khi được hỏi “Merriam-Webster định nghĩa từ ‘plagiarize’ như thế nào?”, ChatGPT được cho là đã trả lời bằng định nghĩa giống hệt từ điển đã đăng ký bản quyền.

Không chỉ dừng lại ở định nghĩa từ, các nguyên đơn cho rằng ChatGPT còn tái hiện cách tuyển chọn và sắp xếp nội dung đặc thù của họ. Với câu hỏi về “10 điều cần biết về cuộc đấu súng giữa Hamilton và Burr”, chatbot này bị cáo buộc đã tái tạo danh sách và trích dẫn theo đúng thứ tự trong một bài viết có bản quyền của Britannica, bao gồm cả các đoạn trích do biên tập viên lựa chọn.

Từ đó, các nguyên đơn lập luận rằng hành vi này đe dọa trực tiếp mô hình kinh doanh của họ, nhấn mạnh rằng OpenAI đang làm suy yếu thị trường nội dung chất lượng cao mà chính họ đã khai thác và tái sử dụng.