Meta bị cáo buộc sử dụng sách vi phạm bản quyền trong huấn luyện AI
Chủ sở hữu tạp chí kinh doanh Entrepreneur đã đệ đơn kiện Meta Platforms tại tòa án liên bang bang California, cáo buộc tập đoàn công nghệ này sử dụng trái phép các tác phẩm của mình để huấn luyện hệ thống trí tuệ nhân tạo AI Llama.
Công ty Entrepreneur Media, LLC đã khởi kiện Meta Platforms, Inc. tại Tòa án quận phía Bắc bang California (U.S. District Court for the Northern District of California), với cáo buộc rằng Meta đã sử dụng các phiên bản sách và bài viết vi phạm bản quyền để huấn luyện các mô hình trí tuệ nhân tạo mang tên Llama.
Đơn kiện, được nộp tại San Francisco ngày 6/11/2025, cho rằng Meta đã xâm phạm bản quyền trực tiếp và gián tiếp, đồng thời vi phạm Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số (DMCA). Entrepreneur cáo buộc Meta đã “xây dựng một đế chế trí tuệ nhân tạo trị giá hàng tỷ USD dựa trên nền tảng của hành vi chiếm đoạt bản quyền có hệ thống và trên diện rộng.”

Cáo buộc vi phạm bản quyền quy mô lớn chống lại Meta
Theo nguyên đơn, Meta đã sao chép hàng trăm terabyte tài liệu có bản quyền, bao gồm các sách xuất bản chuyên nghiệp và các số báo của tạp chí Entrepreneur, mà không có sự cho phép hay chi trả thù lao. Hồ sơ vụ kiện cho biết Meta đã sử dụng dữ liệu thu thập từ các “thư viện ngầm” như Library Genesis (LibGen), Bibliotik và Z-Library - những trang web nổi tiếng vì lưu trữ và phân phối sách lậu.
Đơn kiện nêu rằng Meta đã tải xuống và phân phối lại các tác phẩm có bản quyền này thông qua các mạng chia sẻ dữ liệu như BitTorrent và LibTorrent, vốn tự động chia sẻ tệp với người dùng khác. Theo đó, Meta không chỉ tải xuống các tác phẩm của Entrepreneur mà còn trở thành một bên phân phối tài liệu vi phạm bản quyền trong quá trình này.
Bộ dữ liệu Books3 và quá trình huấn luyện AI của Meta
Entrepreneur cho rằng mô hình Llama đầu tiên của Meta được huấn luyện trên bộ dữ liệu Books3, vốn là một phần của tập dữ liệu mở có tên The Pile. Công ty mô tả Books3 là tập hợp gần 200.000 cuốn sách vi phạm bản quyền thu thập từ Bibliotik.
Trong báo cáo kỹ thuật về LLaMA 1, Meta khẳng định mô hình này được huấn luyện “hoàn toàn bằng các bộ dữ liệu công khai” và dữ liệu đó “tương thích với việc mã nguồn mở”. Tuy nhiên, Entrepreneur phản biện rằng “công khai” không đồng nghĩa với “thuộc phạm vi công cộng”, và Meta không thể sử dụng tài liệu có bản quyền cho mục đích mã nguồn mở mà không có sự đồng ý của chủ sở hữu.
Đơn kiện cũng dẫn tài liệu FAQ của Llama, trong đó Meta cho biết các mô hình Llama được cấp phép sử dụng thương mại rộng rãi theo giấy phép riêng do Meta ban hành.
Các tác phẩm bị vi phạm bản quyền
Đơn kiện liệt kê nhiều ví dụ về các tác phẩm có bản quyền của Entrepreneur xuất hiện trong cơ sở dữ liệu của LibGen, bao gồm: Start Your Own Coaching Business: Your Step-by-Step Guide to Success; Start Your Own Import/Export Business ; Ultimate Guide to Pinterest for Business ; Breakthrough: How to Harness the AHA! Moments that Spark Success ; Start Your Own Business, 6th Edition .
Ngoài ra, Entrepreneur còn nêu các bài báo trong các số tạp chí năm 2010, như The Successful Optimist, The Red Pen Rule for Marketing Copy và The Four Keys to Raising Capital. Công ty khẳng định sở hữu bản quyền hợp pháp đối với tất cả các tác phẩm này, đã được đăng ký tại Văn phòng Bản quyền Hoa Kỳ trước khi Meta bị cáo buộc sử dụng trái phép.

Hành vi gỡ bỏ thông tin quản lý bản quyền của Meta
Theo đơn kiện, trong quá trình xử lý dữ liệu, hệ thống của Meta đã loại bỏ các thông tin quản lý bản quyền như tên tác giả, ghi chú bản quyền và siêu dữ liệu nhúng trong tệp EPUB/PDF trước khi dùng để huấn luyện AI. Entrepreneur cho rằng đây là hành vi cố ý nhằm che giấu vi phạm, khiến việc truy xuất nguồn gốc tác phẩm trở nên khó khăn.
Các hồ sơ công khai trong những vụ kiện liên quan khác cũng ghi nhận việc kỹ sư Meta “lọc bỏ các dòng bản quyền” khỏi tệp để tạo ra kho dữ liệu không còn thông tin nhận dạng.
Thiệt hại tài chính đối với Entrepreneur Media
Entrepreneur cho biết hành động của Meta đã gây thiệt hại tài chính nghiêm trọng. Doanh số sách điện tử của công ty được cho là đã giảm khoảng 50% kể từ khi các mô hình AI như Llama xuất hiện, trong khi sản phẩm đầu ra của Llama có thể tạo ra nội dung tương tự sách hướng dẫn kinh doanh của Entrepreneur hoàn toàn miễn phí.
Đơn kiện trích dẫn phán quyết của một tòa án liên bang trong vụ án khác, trong đó cảnh báo rằng: “Thị trường dành cho các tác phẩm phi hư cấu, ví dụ như sách hướng dẫn chăm sóc vườn, có thể bị suy giảm nghiêm trọng do khả năng của các mô hình ngôn ngữ lớn (LLMs) trong việc tạo ra các nội dung tương tự.”
Entrepreneur cũng dẫn báo cáo dự thảo năm 2025 của Văn phòng Bản quyền Hoa Kỳ, nêu rõ: “Tốc độ và quy mô mà các hệ thống AI tạo ra nội dung đặt ra rủi ro nghiêm trọng trong việc làm loãng thị trường của các tác phẩm cùng loại với dữ liệu được dùng để huấn luyện.”
Meta liệu có cố tình bỏ qua việc cấp phép bản quyền?
Đơn kiện cáo buộc Meta cố ý chọn con đường vi phạm bản quyền thay vì mua giấy phép sử dụng dữ liệu, trong khi các nhà phát triển AI khác như OpenAI, Google và Anthropic đều đã chi trả để cấp phép dữ liệu huấn luyện. Entrepreneur cho rằng Meta đã coi việc vi phạm bản quyền là biện pháp nhanh và rẻ hơn để phát triển AI cạnh tranh, coi các vụ kiện tiềm ẩn chỉ là “chi phí kinh doanh”.
Công ty cho rằng hành vi của Meta làm suy yếu thị trường cấp phép dữ liệu hợp pháp và giảm giá trị của ngành xuất bản chuyên nghiệp. Entrepreneur yêu cầu bồi thường thiệt hại, chi phí pháp lý, cùng lệnh cấm vĩnh viễn buộc Meta ngừng sử dụng các tác phẩm của mình cho mục đích huấn luyện AI hoặc xóa bỏ thông tin bản quyền.
Diễn biến pháp lý liên quan và bước tiếp theo
Trước đó, vào tháng 7 năm nay, một tòa án liên bang Hoa Kỳ đã phán quyết rằng việc sử dụng tác phẩm có bản quyền được mua hợp pháp để huấn luyện AI có thể nằm trong phạm vi cho phép của luật bản quyền. Tuy nhiên, tòa án bác bỏ việc sử dụng sách lậu, khẳng định rằng các tài liệu vi phạm bản quyền “vốn dĩ đã là hành vi xâm phạm.”
Entrepreneur hiện được đại diện bởi hãng luật Hueston Hennigan LLP và Newmeyer & Dillion LLP, đang yêu cầu bồi thẩm đoàn tuyên bố hành vi của Meta là cố ý vi phạm. Vụ kiện sẽ tiếp tục qua các giai đoạn thủ tục và điều tra nếu không đạt được thỏa thuận ngoài tòa.
