Anthropic bị kiện vi phạm bản quyền liên quan tới đào tạo AI

10:28, 22/08/2024

Công ty trí tuệ nhân tạo Anthropic đã bị kiện tập thể tại tòa án liên bang California bởi ba tác giả, những người cho rằng công ty này đã lạm dụng sách của họ và hàng trăm nghìn cuốn khác để đào tạo chatbot Claude dựa trên trí tuệ nhân tạo.

Vụ kiện tập thể được đề xuất đã được nộp tại một tòa án California vào hôm 19/8 vừa qua và cáo buộc Anthropic “xây dựng một doanh nghiệp trị giá nhiều tỷ đô la bằng cách ăn cắp hàng trăm nghìn cuốn sách có bản quyền”. Trong vụ kiện, các tác giả cho biết Anthropic đã sử dụng một bộ dữ liệu nguồn mở rộng lớn được gọi là “The Pile” để đào tạo gia đình chatbot Claude AI của mình.

Trong bộ dữ liệu nguồn mở này có Books3, một thư viện khổng lồ gồm các ebook bị sao chép trái phép, bao gồm các tác phẩm của Stephen King, Michael Pollan và hàng nghìn tác giả khác. Hồi đầu tháng 8, Anthropic đã xác nhận rằng họ đã sử dụng The Pile để đào tạo Claude. “Rõ ràng là Anthropic đã tải xuống và sao chép các bản sao của The Pile và Books3, biết rằng các bộ dữ liệu này bao gồm một kho nội dung có bản quyền được lấy từ các trang web vi phạm bản quyền như Bibiliotik”, đơn kiện viết.

Việc sử dụng trái phép tác phẩm của các tác giả để đào tạo AI đã khiến Anthropic vướng vào kiện tụng (Ảnh: Reuters).

Các tác giả muốn tòa án chứng nhận vụ kiện tập thể của họ cũng như yêu cầu Anthropic phải trả tiền bồi thường đề xuất và ngăn chặn công ty sử dụng tài liệu có bản quyền trong tương lai. Các nhà văn đã đâm đơn kiện Anthropic bao gồm Andrea Bartz, tác giả của We Were Never Here; Charles Graeber, người đã viết The Good Nurse; và Kirk Wallace Johnson, tác giả của The Feather Thief.

Mặc dù vụ kiện thừa nhận rằng Books3 đã bị xóa khỏi phiên bản “chính thức nhất” của The Pile, nhưng phiên bản gốc vẫn được cho là có sẵn ở nơi khác trực tuyến. Một cuộc điều tra gần đây cũng phát hiện ra rằng các công ty như Anthropic và Apple đã đào tạo các mô hình AI của họ trên hàng nghìn phụ đề video YouTube được thu thập từ The Pile.

Năm 2023, cựu Thống đốc Arkansas Mike Huckabee và các tác giả khác đã đệ đơn kiện tương tự chống lại Meta, Microsoft và EleutherAI - tổ chức phi lợi nhuận đứng sau The Pile - về cáo buộc tác phẩm của họ bị sao chép trái phép và được sử dụng để đào tạo các mô hình AI. George R.R. Martin, Jodi Picoult, Michael Chabon và một số tác giả khác cũng đã kiện OpenAI về việc bị cáo buộc sử dụng nội dung có bản quyền của họ.