Meta vừa ra mắt mô hình AI kiểm tra mô hình AI khác

13:25, 19/10/2024

Ngày 18/10, chủ sở hữu Facebook là Meta vừa phát hành các mô hình trí tuệ nhân tạo mới, với công cụ "Trình đánh giá tự học" và thể kiểm tra các mô hình AI khác.

Các mô hình AI vừa phát hành có công cụ "Trình đánh giá tự học", có thể kiểm tra hoạt động của các mô hình AI khác. Đặc biệt, công cụ này hứa hẹn sẽ giảm sự tham gia của con người trong quá trình phát triển trí tuệ nhân tạo nhờ trí tuệ siêu phàm.

Việc phát hành diễn ra sau khi Meta giới thiệu ứng dụng này trong một báo cáo hồi tháng 8. Trong đó nêu chi tiết cách công cụ dựa vào cùng một kỹ thuật "chuỗi suy nghĩ" được sử dụng bởi các mô hình 1 mới phát hành của OpenAI để đưa ra phán đoán đáng tin cậy về phản hồi của các mô hình.

Kỹ thuật đó bao gồm việc chia các vấn đề phức tạp thành các bước logic nhỏ hơn, cải thiện độ chính xác của các phản hồi đối những các vấn đề khó trong các môn học như khoa học, mã hóa và toán học.

Meta vừa ra mắt mô hình AI kiểm tra mô hình AI khác.

Theo các nhà nghiên cứu của Meta trong dự án, khả năng sử dụng AI để đánh giá AI một cách đáng tin cậy mở ra một con đường khả thi hướng tới việc xây dựng các tác nhân AI tự chủ có thể học hỏi từ chính những sai lầm của mình.

Các mô hình tự cải thiện có thể cắt giảm nhu cầu về một quy trình thường tốn kém và thiếu hiệu quả được sử dụng ngày nay có tên là "Học tăng cường từ phản hồi của con người". Quy trình này đòi hỏi đầu vào từ các anotator của con người phải có chuyên môn chuyên sâu để dán dữ liệu chính xác và xác minh đáp án cho các câu hỏi toán học và viết phức tạp.

Các nhà nghiên cứu cho rằng, khi AI tiến bộ hơn sẽ ngày càng giỏi hơn trong việc kiểm tra công việc của mình. Ý tưởng về việc tự học và có khả năng tự đánh giá về cơ bản là rất quan trọng đối với ý tưởng đạt được cấp độ siêu phàm của AI.

Được biết, các công ty khác bao gồm Google và Anthropic cũng đã công bố nghiên cứu về khái niệm RLAIF, hoặc Học tăng cường từ phản hồi của AI. Tuy nhiên, không giống như Meta, những công ty đó thường không phát hành các mô hình để sử dụng công cộng.

Các công cụ AI khác do Meta vừa phát hành gồm bản cập nhật cho mô hình Segment Anything - Phân đoạn bất kỳ nhận dạng hình ảnh của công ty, một công cụ giúp tăng tốc thời gian tạo phản hồi LLM và bộ dữ liệu có thể được sử dụng để hỗ trợ khám phá các vật liệu vô cơ mới.

Meta đã hé lộ rằng họ đang phát triển một mô hình AI mã nguồn mở.

Hồi tháng 4/2024, Meta đã hé lộ rằng họ đang phát triển một mô hình AI mã nguồn mở đầu tiên có hiệu suất ngang bằng với các mô hình riêng tư tốt nhất đến từ các công ty như OpenAI. Giờ đây mô hình đó đã ra mắt.

Llama 3.1 được công ty tuyên bố vượt trội hơn GPT-4o và Claude 3.5 Sonnet của Anthropic trên một số tiêu chuẩn đánh giá. Họ cũng đang mở rộng trợ lý AI Meta AI dựa trên Llama tới nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung tính năng có thể tạo hình ảnh dựa trên diện mạo cụ thể của một người.

CEO Mark Zuckerberg hiện dự đoán rằng Meta AI sẽ trở thành trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt mặt cả ChatGPT.

Llama 3.1 có phiên bản lớn nhất có 405 tỷ tham số và được huấn luyện với hơn 16.000 GPU H100 cực kỳ đắt tiền của Nvidia, có thể giá hàng trăm triệu USD.

Để giúp đưa Llama 3.1 ra thế giới, Meta đang hợp tác với hơn hai chục công ty, bao gồm Microsoft, Amazon, Google, Nvidia và Databricks, để giúp các nhà phát triển triển khai phiên bản của riêng họ. Meta tuyên bố rằng chi phí vận hành Llama 3.1 trong sản xuất chỉ bằng khoảng một nửa so với GPT-4o của OpenAI. Họ đang phát hành trọng số mô hình để các công ty có thể đào tạo nó trên dữ liệu tùy chỉnh và điều chỉnh theo ý muốn.

Meta cho rằng, họ đã sử dụng dữ liệu tổng hợp, hoặc dữ liệu được tạo ra bởi một mô hình thay vì con người, để có phiên bản 405 tỷ tham số của Llama 3.1 cải thiện các phiên bản nhỏ hơn 70 tỷ và 8 tỷ.

Ahmad Al-Dahle, Phó Chủ tịch AI tạo sinh của Meta, dự đoán rằng Llama 3.1 sẽ được các nhà phát triển ưa chuộng như "một giáo viên cho các mô hình nhỏ hơn sau đó được triển khai" theo "cách hiệu quả hơn về chi phí".

Lần đầu tiên, việc kiểm tra đối kháng (hay red teaming) của Meta đối với Llama 3.1 bao gồm tìm kiếm các trường hợp sử dụng tiềm năng về an ninh mạng và sinh hóa học. Một lý do khác để kiểm tra mô hình kỹ lưỡng hơn là những gì Meta mô tả là các hành vi "tác nhân" mới nổi.

Llama 3.1 là mô hình AI mã nguồn mở lớn nhất từ trước đến nay.

Một trong các ưu điểm của mô hình mới là khả năng tích hợp với API công cụ tìm kiếm để "truy xuất thông tin từ internet dựa trên một truy vấn phức tạp và gọi nhiều công cụ liên tiếp để hoàn thành nhiệm vụ của bạn." Một ví dụ khác ông đưa ra là yêu cầu mô hình vẽ biểu đồ số lượng nhà bán tại Mỹ trong 5 năm qua. "Nó có thể thực hiện tìm kiếm [web] cho bạn, tạo mã Python và thực thi nó."

Llama đang được chính Meta sử dụng để vận hành cho trợ lý AI của họ, với hy vọng biến nó thành một chatbot đa năng tương tự ChatGPT và có thể được tìm thấy ở hầu hết trong Instagram, Facebook và WhatsApp. 

Mặc dù mô hình 405 tỷ tham số tiên tiến nhất của Llama 3.1 có thể sử dụng miễn phí trong Meta AI, trợ lý ảo này sẽ chuyển bạn sang mô hình 70 tỷ nhỏ hơn sau khi vượt quá một số lượng lời nhắc không xác định trong một tuần nhất định. Điều này cho thấy mô hình 405 tỷ vẫn quá đắt để Meta vận hành ở quy mô đầy đủ. Công ty sẽ cung cấp thêm thông tin về ngưỡng lời nhắc sau khi đánh giá mức sử dụng ban đầu.

Meta hy vọng sẽ tránh được việc tạo ra một cỗ máy deepfake, khi tính năng mới "Imagine Me" trong Meta AI quét khuôn mặt của bạn qua camera điện thoại để sau đó cho phép bạn chèn hình ảnh của mình vào các hình ảnh nó tạo ra. Bằng cách thu thập hình ảnh của bạn theo cách này chứ không phải thông qua ảnh trong hồ sơ của bạn. Công ty nhận thấy nhu cầu của mọi người muốn tạo ra nhiều loại phương tiện AI hơn và chia sẻ chúng lên nguồn cấp dữ liệu của họ, ngay cả khi điều đó có nghĩa là làm mờ ranh giới giữa những gì có thể nhận biết là thật và không thật.

Meta AI sẽ được ứng dụng trên tai nghe Quest, kính Ray-Ban của Meta...

Trong một bức thư được đăng trên blog công ty của Meta, Mark Zuckerberg cho rằng, các mô hình AI mã nguồn mở sẽ vượt qua và đang cải thiện nhanh hơn các mô hình độc quyền, tương tự như cách Linux trở thành hệ điều hành mã nguồn mở vận hành cho hầu hết các điện thoại, máy chủ và thiết bị ngày nay.

Ông chủ Meta so sánh khoản đầu tư của Meta vào AI mã nguồn mở với dự án Open Compute Project trước đây, đã giúp công ty "tiết kiệm hàng tỷ USD" nhờ có các công ty bên ngoài như HP giúp cải thiện và chuẩn hóa thiết kế trung tâm dữ liệu của Meta khi công ty đang xây dựng năng lực của riêng mình. Mark Zuckerberg tin rằng việc phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành, khi hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng mã nguồn mở.