AI Gemini của Google đối mặt làn sóng tố vi phạm bản quyền từ các nhà xuất bản

13:07, 19/01/2026

Google đang đứng trước áp lực pháp lý ngày càng lớn khi các nhà xuất bản sách hàng đầu tại Mỹ đồng loạt cáo buộc tập đoàn công nghệ này vi phạm bản quyền trên quy mô lớn để phát triển hệ thống trí tuệ nhân tạo Gemini.

Hai nhà xuất bản thành viên của Hiệp hội Các nhà xuất bản Mỹ (Association of American Publishers, AAP), bao gồm: Cengage Group và Hachette Book Group, vào tuần trước đã nộp đơn xin tham gia với tư cách đại diện tập thể cho các nhà xuất bản trong một vụ kiện xâm phạm bản quyền, cáo buộc Google sử dụng các bản sao trái phép để huấn luyện dịch vụ AI Gemini.

Vụ kiện mang tên In Re Google Generative AI Copyright Litigation được một nhóm họa sĩ minh họa và nhà văn khởi kiện lần đầu vào năm 2023, hiện đang được Thẩm phán Eumi K. Lee thụ lý tại Tòa án Liên bang Khu vực Bắc California.

googles-gemini-ai-uses-features-and-industry-impact-1

“Vụ việc này sẽ đặt ra một câu hỏi nền tảng của thời đại AI: trách nhiệm của các công ty AI đối với các chủ sở hữu bản quyền, những người có tác phẩm bị lấy cắp để xây dựng nên các doanh nghiệp nghìn tỷ USD là gì?”, đơn xin tham gia vụ kiện của các nhà xuất bản nêu rõ. “Trong vụ việc này, một số tác giả đang tìm cách chứng nhận các nhóm chủ sở hữu bản quyền trên toàn ngành xuất bản để đặt câu hỏi đó với Google. Tuy nhiên, các nhà xuất bản lại không nằm trong số những đại diện được đề xuất”. Vì vậy, tòa án cần cho phép các nhà xuất bản tham gia để “khắc phục thiếu sót này”.

Với phiên điều trần về việc chứng nhận vụ kiện tập thể dự kiến diễn ra vào ngày 4 tháng 2, các nhà xuất bản khẳng định họ “cần được đại diện” và có tiếng nói “trước khi bị gộp vào một nhóm khởi kiện mà không được thông báo hoặc không có cơ hội đánh giá”.

Trong hồ sơ gửi tòa, các nhà xuất bản dẫn lại sự hợp tác thành công giữa tác giả và nhà xuất bản trong vụ Bartz kiện Anthropic, dẫn tới thỏa thuận dàn xếp trị giá 1,5 tỷ USD.

“Theo vụ Bartz kiện Anthropic, các tác giả và nhà xuất bản đã cùng nhau chuẩn bị các yêu cầu pháp lý cho phiên tòa và đạt được một thỏa thuận kỷ lục”, đơn nêu. “Khi Thẩm phán Alsup chứng nhận vụ kiện tập thể, ông dự đoán rằng các nhà xuất bản và tác giả sẽ cùng giải quyết các vấn đề. Và điều đó đã xảy ra, nhưng chỉ vì các nhà xuất bản tham gia vụ kiện ngay từ đầu”.

Trong thông cáo báo chí, đại diện AAP cho biết Cengage và Hachette mong muốn đại diện cho “tất cả các nhà xuất bản có quyền lợi bị Google xâm phạm theo cách tương tự”, đồng thời nhấn mạnh sự tham gia của họ sẽ mang lại “chuyên môn và bằng chứng có ý nghĩa then chốt trong cuộc đấu tranh buộc các công ty AI phải chịu trách nhiệm theo Luật Bản quyền”.

Tương tự vụ Anthropic, các nhà xuất bản cáo buộc Google đã “lấy các cuốn sách có bản quyền của nguyên đơn và nhóm khởi kiện, rồi sao chép nhiều lần” để phát triển Gemini, bao gồm sách được tải từ “nguồn lậu” và bị trích xuất “từ phía sau các tường phí hợp pháp”.

Chủ tịch kiêm Tổng giám đốc điều hành AAP, bà Maria Pallante, cho rằng vụ kiện có thể gây ra “những hệ quả sâu rộng” và cảm ơn Cengage cùng Hachette vì đã chủ động xin tham gia.

“Thông qua hành động hôm nay, AAP và các thành viên mong muốn hỗ trợ các nhà sáng tạo đang kiện Google. Chúng tôi tin rằng sự tham gia của các nhà xuất bản sẽ củng cố vụ kiện, đặc biệt vì chúng tôi có vị thế đặc thù để làm rõ nhiều vấn đề pháp lý, thực tiễn và chứng cứ trước tòa”, bà Pallante nói. “Việc các công ty công nghệ cần tác phẩm sáng tạo để xây dựng hệ thống AI an toàn, hữu ích và hấp dẫn là điều dễ hiểu, nhưng điều đó phải dẫn tới đối thoại về cấp phép, chứ không phải những sự biện minh. Đã đến lúc vượt qua giai đoạn phát triển AI hỗn loạn ban đầu và quay trở lại với các mối quan hệ hợp tác cộng sinh, vốn luôn là nền tảng của luật bản quyền”.

Googleplex_-_June_2019_5865

Các diễn biến mới cho thấy Google đang đứng trước áp lực pháp lý ngày càng lớn khi các nhà xuất bản sách hàng đầu tại Mỹ đồng loạt cáo buộc tập đoàn công nghệ này vi phạm bản quyền trên quy mô lớn để phát triển hệ thống trí tuệ nhân tạo Gemini.

Sau khi các tác giả cá nhân khởi kiện Google từ năm 2023 với cáo buộc sao chép sách để huấn luyện AI tạo sinh, hai “ông lớn” trong ngành xuất bản là Hachette Book Group và Cengage Group đã chính thức xin tham gia vụ kiện với tư cách đại diện cho các nhà xuất bản. Động thái này được Hiệp hội Các nhà xuất bản Mỹ đánh giá là bước đi quan trọng nhằm đảm bảo quyền lợi của toàn ngành xuất bản trong kỷ nguyên AI.

Theo các đơn kiện nộp tại Tòa án Liên bang Bắc California, Google bị cáo buộc đã cố ý sao chép hàng loạt tác phẩm có bản quyền ở mọi công đoạn phát triển Gemini. Các nhà xuất bản cho rằng Google đã tải sách từ những nguồn vi phạm bản quyền như Z Library, OceanofPDF, WeLib, cũng như thu thập nội dung từ các nền tảng có thu phí và thư viện thuê bao như Scribd, mà không có sự cho phép hay thỏa thuận cấp phép hợp pháp.

Đáng chú ý, bộ dữ liệu huấn luyện C4 của Google được cho là chứa nội dung từ ít nhất 28 trang web bị chính phủ Mỹ xác định là thị trường vi phạm bản quyền. Biểu tượng bản quyền xuất hiện hơn 200 triệu lần trong bộ dữ liệu này, cho thấy quy mô sao chép bị cáo buộc là đặc biệt lớn. Các nguyên đơn cũng cho rằng Google đã cố tình loại bỏ các cảnh báo về điều khoản sử dụng, trong khi vẫn giữ lại các tác phẩm có bản quyền và nội dung phía sau tường phí.

Không chỉ dừng ở hành vi sao chép dữ liệu, vụ kiện còn cáo buộc Gemini tạo ra các đầu ra có khả năng “thay thế tác phẩm gốc”, bao gồm việc tái tạo nguyên văn, tóm tắt chi tiết và các phiên bản mô phỏng yếu tố sáng tạo của sách, qua đó ảnh hưởng trực tiếp đến thị trường và giá trị kinh tế của các tác phẩm được bảo hộ.

Các nhà xuất bản yêu cầu tòa án buộc Google bồi thường thiệt hại theo quy định pháp luật, ban hành lệnh cấm chấm dứt hành vi xâm phạm, đồng thời yêu cầu tiêu hủy toàn bộ các bản sao trái phép và công khai danh sách tác phẩm đã được sử dụng để huấn luyện Gemini.

Vụ việc diễn ra trong bối cảnh Google và nhiều công ty AI lớn khác đang đối mặt với làn sóng kiện tụng liên quan đến bản quyền trên toàn cầu. Dù một số phán quyết gần đây cho rằng việc sử dụng tác phẩm có bản quyền để huấn luyện AI có thể được xem là “sử dụng hợp lý”, các thẩm phán vẫn tỏ ra đặc biệt quan ngại trước việc các công ty duy trì những “thư viện nội dung lậu” lâu dài.

Giới chuyên gia  nhận định, nếu các nhà xuất bản giành được lợi thế pháp lý trong vụ kiện này, đây có thể trở thành tiền lệ quan trọng, buộc các công ty AI phải thay đổi cách tiếp cận, từ việc “thu thập miễn phí” sang đàm phán cấp phép minh bạch với chủ sở hữu bản quyền. Điều này không chỉ tác động đến Google, mà còn có thể định hình lại mối quan hệ giữa ngành công nghệ và ngành sáng tạo trong kỷ nguyên trí tuệ nhân tạo.