Apple bị tố dùng 'chùa' video YouTube bản quyền trong huấn luyện AI

08:40, 16/04/2026

Một nhóm nhà sáng tạo nội dung tại Mỹ đã đệ đơn kiện tập thể cáo buộc Apple thu thập và sử dụng video YouTube trái phép để huấn luyện AI, vi phạm luật bản quyền và làm dấy lên lo ngại về khai thác dữ liệu trong kỷ nguyên trí tuệ nhân tạo.

Một vụ kiện tập thể vừa được nộp lên tòa án liên bang tại bang California, Mỹ, cáo buộc Apple vi phạm bản quyền khi sử dụng trái phép video từ nền tảng YouTube để huấn luyện các mô hình trí tuệ nhân tạo.

Cáo buộc thu thập dữ liệu không xin phép

Nguyên đơn trong vụ kiện bao gồm các nhà sáng tạo nội dung nổi tiếng như h3h3Productions, H3 Podcast, cùng hai kênh về golf là MrShortGameGolf và Golfholics. Họ cho rằng các video của mình đã bị thu thập và đưa vào các bộ dữ liệu huấn luyện AI mà không hề được thông báo hay xin phép.

Theo đơn kiện, hành vi này có thể vi phạm Digital Millennium Copyright Act, đạo luật bảo vệ bản quyền nội dung số tại Mỹ.

Nghi vấn vượt qua hàng rào bảo vệ của nền tảng

Các nguyên đơn cáo buộc Apple đã sử dụng công cụ kỹ thuật nhằm vượt qua cơ chế bảo vệ của YouTube để tải xuống video với quy mô lớn. Cụ thể, đơn kiện cho rằng các hệ thống scraping sử dụng địa chỉ IP luân phiên để tránh bị phát hiện.

Nguồn dữ liệu này sau đó được cho là dùng để xây dựng các mô hình AI nội bộ, bao gồm hệ thống được gọi là “Apple AI Video”. Bằng chứng được đưa ra là một nghiên cứu có đề cập đến bộ dữ liệu Panda-70M, vốn được cho là tập hợp hoàn toàn từ video YouTube. Trong đó, riêng nội dung từ h3h3Productions được xác định xuất hiện trong hàng trăm video thuộc bộ dữ liệu này.

Yêu cầu bồi thường và chấm dứt hành vi

Các nhà sáng tạo yêu cầu tòa án ra lệnh cấm Apple tiếp tục sử dụng nội dung của họ, đồng thời đòi bồi thường thiệt hại và các khoản phí pháp lý. Vụ kiện cũng được mở rộng dưới dạng kiện tập thể, đại diện cho nhiều nhà sáng tạo nội dung khác tại Mỹ có thể bị ảnh hưởng tương tự.

Nguyên đơn nhấn mạnh rằng việc khai thác nội dung mà không trả phí hay xin phép là “một cuộc tấn công” vào cộng đồng sáng tạo, trong bối cảnh ngành công nghiệp AI tạo sinh đang phát triển mạnh mẽ và có giá trị hàng nghìn tỷ USD.

Làn sóng kiện tụng AI tiếp tục leo thang

Đây không phải lần đầu các nhà sáng tạo này khởi kiện các công ty công nghệ lớn. Trước đó, họ từng đưa ra cáo buộc tương tự đối với Meta, Nvidia, ByteDance và Snap liên quan đến việc thu thập dữ liệu phục vụ huấn luyện AI.

Về phía Apple, công ty từng được xem là thận trọng hơn trong vấn đề dữ liệu huấn luyện AI, với các nỗ lực đàm phán cấp phép nội dung từ các tổ chức truyền thông. Tuy nhiên, hãng vẫn vướng vào nhiều tranh cãi pháp lý, gần đây nhất là liên quan đến việc sử dụng bộ dữ liệu “The Pile”, vốn bị cho là chứa nhiều tài liệu có bản quyền.

Vụ kiện lần này tiếp tục phản ánh xung đột ngày càng gay gắt giữa các nền tảng công nghệ và cộng đồng sáng tạo nội dung, khi dữ liệu trở thành “nguyên liệu đầu vào” quan trọng cho sự phát triển của trí tuệ nhân tạo.