Thẩm phán Mỹ: Dùng sách bản quyền để đào tạo AI là 'sử dụng hợp lý'
Thẩm phán William Alsup của Tòa án Quận Hoa Kỳ mới đây đã phán quyết việc Anthropic sử dụng các sách có bản quyền để huấn luyện AI Claude là "sử dụng hợp lý" và "mang tính chuyển đổi".
Theo CNBC, Anthropic, công ty được Amazon hậu thuẫn, không vi phạm bản quyền của các tác giả khi huấn luyện mô hình ngôn ngữ lớn (LLM) vì những mô hình này “không tái tạo cho công chúng các yếu tố sáng tạo của một tác phẩm, thậm chí không cả phong cách biểu đạt riêng biệt của một tác giả nào,” thẩm phán William Alsup của Tòa án Quận Hoa Kỳ viết.
“Mục đích và bản chất của việc sử dụng các tác phẩm có bản quyền để huấn luyện LLM nhằm tạo ra văn bản mới là một hành vi có tính chuyển đổi điển hình,” Alsup viết. “Giống như bất kỳ người đọc nào khao khát trở thành nhà văn.”
Phán quyết trên được đưa ra trong phiên tòa cuối tháng 6, xuất phát từ vụ nhà văn Bartz kiện Anthropic PBC hồi tháng 8/2024. Trong đó, ba tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson cáo buộc Anthropic - công ty phát triển AI Claude - đã vi phạm bản quyền khi sử dụng sách của họ và hàng triệu cuốn khác để huấn luyện mô hình chatbot.
Phán quyết này được xem là một chiến thắng quan trọng đối với các công ty AI trong bối cảnh các cuộc chiến pháp lý đang diễn ra về việc sử dụng các tác phẩm có bản quyền trong quá trình phát triển và huấn luyện mô hình ngôn ngữ lớn.
Phán quyết của Alsup cũng thiết lập ranh giới và cơ hội pháp lý cho ngành công nghiệp này trong tương lai.
Phát ngôn sau tuyên bố của tòa án, Anthropic cho biết công ty “hài lòng” với phán quyết và cho rằng quyết định này “phù hợp với mục đích của luật bản quyền là thúc đẩy sự sáng tạo và tiến bộ khoa học".
Vụ kiện được đệ trình tại Tòa án Quận Bắc California do các tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson khởi kiện vào tháng Tám. Đơn kiện cáo buộc rằng Anthropic đã xây dựng một “doanh nghiệp trị giá hàng tỷ đô la bằng cách đánh cắp hàng trăm nghìn cuốn sách có bản quyền.”
Một phần của vụ kiện xoay quanh khoảng 7 triệu cuốn sách mà Anthropic bị cáo buộc đã sao chép trái phép và lưu giữ trong một “thư viện trung tâm.” Công ty khởi nghiệp này sau đó đã quyết định không sử dụng các tài liệu vi phạm bản quyền đó để huấn luyện các mô hình của mình.
Theo Lexology, một số cuốn sách trong cơ sở dữ liệu thư viện đã được Anthropic số hóa sau khi mua hợp pháp, xé bìa, quét toàn bộ và lưu trữ. Tuy nhiên, Anthropic cũng tải xuống lượng lớn bản miễn phí khác từ các trang web lậu để sử dụng đào tạo.
Do đó, mặc dù ủng hộ việc Anthropic sử dụng sách có bản quyền, tuy nhiên, thẩm phán Alsup đã ra lệnh đưa ra xét xử đối với việc Anthropic đã sử dụng các cuốn sách vi phạm bản quyền như thế nào để tạo ra thư viện trung tâm, nhằm xác định mức độ thiệt hại có thể xảy ra.
Vị thẩm phán cũng nhấn mạnh, theo luật bản quyền Mỹ (US Copyright Act), việc dùng sách được bảo hộ để tạo ra nội dung mới có thể là "sử dụng hợp lý". Đây là cơ sở pháp lý quan trọng cho phép sử dụng hạn chế tài liệu có bản quyền mà không cần xin phép chủ sở hữu. Phán quyết cũng công nhận hành vi số hóa sách mà Anthropic đã mua hợp pháp để huấn luyện AI là hợp lý. Bởi, đây chỉ là sự chuyển đổi định dạng nhằm phục vụ nghiên cứu, thay vì sao chép hay phân phối tác phẩm gốc.
Tuy nhiên, điều đó cũng không giúp xóa bỏ việc công ty thu thập và lưu trữ lượng lớn tài liệu bất hợp pháp. Theo ông, luật Bản quyền "không có sự miễn trừ nào dành cho các công ty AI". Hành vi sao chép lậu để tạo kho dữ liệu bắt buộc chịu trách nhiệm pháp lý.
Vụ kiện dự kiến sẽ tiếp tục được đưa ra xét xử vào tháng 12 để xác định Anthropic phải bồi thường bao nhiêu cho sai lầm này. Theo luật bản quyền Mỹ, hành vi cố ý vi phạm bản quyền có thể chịu mức phạt lên tới 150.000 USD cho mỗi tác phẩm.