Các giám đốc điều hành Meta bị ám ảnh bởi việc đánh bại GPT-4
Các tài liệu nội bộ bị tiết lộ trong vụ kiện bản quyền AI liên quan đến Meta đã hé lộ một bức tranh đầy áp lực, tham vọng và cạnh tranh khốc liệt giữa các công ty công nghệ lớn trong lĩnh vực trí tuệ nhân tạo.
Những thông điệp nội bộ của Meta, được công bố trong vụ kiện Kadrey kiện Meta, cho thấy đội ngũ các giám đốc điều hành AI và các nhà nghiên cứu hàng đầu của Meta đang bị ám ảnh bởi việc đánh bại GPT-4, mô hình AI nổi tiếng của OpenAI. Tham vọng này không chỉ là một mục tiêu chiến lược mà dường như đã trở thành nỗi ám ảnh toàn diện, đặc biệt trong quá trình phát triển mô hình Llama 3.
Trong một tin nhắn gửi vào tháng 10 năm 2023, Ahmad Al-Dahle, Phó Chủ tịch về AI tạo sinh của Meta, nêu rõ sự cấp thiết của mục tiêu vượt qua GPT-4: “Mục tiêu của chúng tôi cần phải là GPT-4. Chúng tôi sắp có 64.000 GPU! Chúng tôi cần học cách xây dựng lợi thế và giành chiến thắng trong cuộc đua này.”
Lời nhấn mạnh này không chỉ bóc trần tham vọng mãnh liệt mà còn phản ánh áp lực khổng lồ mà đội ngũ AI tại Meta đang đối mặt. Trong khi các mô hình AI nguồn mở như Llama luôn là niềm tự hào chiến lược của Meta, các thông điệp nội bộ cho thấy họ coi GPT-4 và Claude của Anthropic – những mô hình đóng không công khai trọng số – là "chuẩn vàng" mà họ phải xây dựng để vượt qua.
Sự quyết tâm tập trung đánh bại đối thủ lớn này thậm chí còn được thể hiện qua cách các lãnh đạo Meta nhìn nhận đối thủ khác, như Mistral. Al-Dahle thẳng thừng nhận xét trong một tin nhắn: “Mistral chẳng là gì đối với chúng tôi.” Điều này cho thấy Meta không chỉ đặt mục tiêu phát triển mà còn muốn tập trung tối đa nguồn lực để đánh bại những đối thủ kỳ cựu như OpenAI và Anthropic.
Cuộc đua nội bộ tại Meta trở nên căng thẳng hơn khi tầm quan trọng của dòng mô hình Llama được nâng cao. Một giám đốc điều hành thậm chí thừa nhận: “Llama 3 thực sự là tất cả những gì tôi quan tâm,” thể hiện tinh thần tập trung toàn lực của công ty trong việc tạo ra một mô hình mang tính đột phá.
CEO Mark Zuckerberg cũng đặt kỳ vọng lớn vào dự án này. Trong một lá thư nội bộ vào tháng 7 năm 2024, Zuckerberg khẳng định rằng: “Llama 3 có khả năng cạnh tranh với những mô hình tiên tiến nhất hiện nay và dẫn đầu ở một số lĩnh vực. Từ năm sau, chúng tôi kỳ vọng các mẫu Llama mới sẽ trở thành tiên phong trong ngành.”
Vào tháng 4 năm 2024, Meta ra mắt chính thức Llama 3 và mô hình đã cho thấy sự cạnh tranh sát sao với các đối thủ mạnh như GPT-4 và Claude, thậm chí vượt trội hơn so với các lựa chọn mã nguồn mở đến từ Mistral. Tuy nhiên, phía sau thành công này là những tranh cãi lớn liên quan đến cách Meta xử lý dữ liệu để đào tạo mô hình.
Trong quá trình phát triển, các thông điệp nội bộ tiết lộ rằng đội ngũ Meta không hài lòng với chất lượng dữ liệu đào tạo trên Llama 2.
Nhà nghiên cứu Hugo Touvron nhận xét: “Tập dữ liệu này thật tệ” và bàn bạc về việc cải thiện các nguồn dữ liệu để tăng hiệu suất và năng lực của Llama 3. Những tài liệu này cũng tiết lộ về ý định sử dụng các nguồn dữ liệu khá nhạy cảm, như truy cập vào thư viện LibGen, vốn chứa nhiều tài liệu có bản quyền. Các nhà xuất bản lớn như Cengage Learning, Macmillan Learning, McGraw Hill và Pearson Education hiện đã kiện Meta về việc sử dụng dữ liệu trái phép này.
Tinh thần gấp rút trong cuộc đua đã phần nào được thể hiện qua tin nhắn nội bộ của Al-Dahle: “Chúng ta có đúng bộ dữ liệu ở đó không? Có thứ gì bạn muốn sử dụng nhưng không thể vì mấy lý do ngớ ngẩn không?” Những câu hỏi này gây ra lo ngại về tiêu chuẩn đạo đức của Meta khi thực hiện đào tạo mô hình AI. Điều đáng nói hơn là quyết định sử dụng các nguồn dữ liệu tiềm ẩn rủi ro pháp lý được cho là đã có sự chấp thuận của CEO Zuckerberg.
Cuộc đua công nghệ ngày càng khiến các ranh giới giữa tham vọng và trách nhiệm trở nên mong manh. Meta, với khát vọng vươn lên dẫn đầu ngành AI, đã ném mình vào một cuộc chiến không khoan nhượng với những đối thủ lớn như OpenAI và Anthropic, bất chấp những nguy cơ pháp lý lớn từ việc xử lý dữ liệu đào tạo của mình.
Thành công của họ với Llama 3 rõ ràng đã giúp Meta vươn lên tầm cao mới, nhưng các cuộc tranh cãi pháp lý liên quan đến bản quyền vẫn đè nặng lên danh tiếng của công ty. Cuộc chiến của Meta không chỉ đại diện cho một công ty lớn trong ngành công nghệ mà còn là minh chứng rõ nhất về tốc độ và sự quyết liệt của cuộc đua AI hiện nay – nơi các doanh nghiệp càng ngày càng phải đối mặt với nhiều thách thức lớn trong việc cân bằng giữa đổi mới công nghệ, đạo đức, và pháp luật.