AI của World Labs có thể tạo ra các cảnh 3D tương tác từ một bức ảnh duy nhất
World Labs, công ty khởi nghiệp do nhà tiên phong về AI Fei-Fei Li sáng lập đã công bố dự án đầu tiên của mình là một hệ thống AI có thể tạo ra các cảnh 3D giống như trò chơi điện tử từ một hình ảnh duy nhất.
Nhiều hệ thống AI có thể biến ảnh thành mô hình và môi trường 3D. Nhưng các cảnh của World Labs lại độc đáo ở chỗ chúng có tính tương tác và có thể chỉnh sửa.
“Công nghệ của chúng tôi cho phép bạn bước vào bất kỳ hình ảnh nào và khám phá nó ở chế độ 3D”, World Labs viết trong bài đăng trên blog. “Ngoài hình ảnh đầu vào, tất cả đều được tạo ra”.
Nguồn hình ảnh: World Labs
Các cảnh do AI tạo ra từ World Labs, người dùng có thể dễ dàng khám phá thông qua bản demo trên trang web của họ, thực sự ấn tượng mặc dù có phần hơi hoạt hình. Những cảnh này được hiển thị trực tiếp trong trình duyệt và cung cấp một camera có thể điều khiển với độ sâu trường ảnh (DoF) có thể điều chỉnh theo ý muốn. Khi hiệu ứng DoF được thiết lập mạnh, các đối tượng ở nền sẽ trở nên mờ hơn, tạo cảm giác chiều sâu cho bức tranh.
Hệ thống của World Labs nằm trong một xu hướng AI mới nổi được gọi là "mô hình thế giới", trong đó nhiều mô hình có khả năng mô phỏng trò chơi và môi trường 3D. Tuy nhiên, một số mô hình gặp phải hiện tượng tạo tác và thiếu tính nhất quán. Chẳng hạn, mô hình mô phỏng Minecraft của công ty khởi nghiệp Decart, mang tên Oasis, bị giới hạn ở độ phân giải thấp và thường "quên" cấu trúc của các cấp độ khi người chơi tiếp tục khám phá.
Ngược lại, phương pháp của World Labs đảm bảo các cảnh vẫn giữ nguyên sau khi được tạo ra và tuân thủ các định luật vật lý cơ bản. Điều này mang lại cảm giác chắc chắn và có chiều sâu cho cảnh vật.
Hơn nữa, hệ thống của World Labs còn cho phép áp dụng các hiệu ứng tương tác và hoạt ảnh vào các cảnh, như thay đổi màu sắc của các đối tượng và điều chỉnh ánh sáng nền một cách động. Điều này không chỉ làm tăng tính sinh động và hấp dẫn cho các cảnh mà còn mở ra nhiều cơ hội sáng tạo cho người dùng trong việc tương tác với môi trường 3D.
Nguồn hình ảnh: World Labs
“Hầu hết các công cụ AI hiện nay chủ yếu tập trung vào việc tạo ra nội dung 2D như hình ảnh hoặc video,” World Labs chia sẻ. “Tuy nhiên, việc phát triển nội dung 3D sẽ nâng cao khả năng kiểm soát và tính nhất quán, từ đó cách mạng hóa quy trình sản xuất phim, trò chơi, mô phỏng và các biểu hiện kỹ thuật số khác của thế giới vật lý xung quanh chúng ta.”
Dù vậy, vẫn còn nhiều vấn đề cần cải thiện. Hiện tại, người dùng chỉ có thể khám phá một phần hạn chế của các cảnh trong World Labs; khi di chuyển ra ngoài khu vực cho phép, bạn sẽ gặp phải các ranh giới không thể vượt qua. Thỉnh thoảng, cũng xảy ra một số lỗi trong việc kết xuất, khiến cho các vật thể hòa trộn với nhau theo những cách không tự nhiên.
Tuy nhiên, World Labs khẳng định rằng đây chỉ là “bản xem trước ban đầu” của hệ thống. Trong một bài viết trên blog, công ty khởi nghiệp này cho biết: "Chúng tôi đang nỗ lực hết mình để cải thiện quy mô và độ chân thực của những thế giới mà chúng tôi tạo ra, đồng thời thử nghiệm những phương pháp mới nhằm giúp người dùng có thể tương tác với các thế giới đó một cách linh hoạt hơn."
Với những bước tiến này, World Labs hi vọng sẽ mang đến những trải nghiệm 3D phong phú và hấp dẫn hơn cho người dùng trong tương lai.
Nguồn hình ảnh: World Labs
World Labs, ra mắt vào đầu năm nay, đã thu hút được 230 triệu đô la vốn đầu tư mạo hiểm từ nhiều nhà đầu tư nổi tiếng, bao gồm Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures và Eric Schmidt. Với mức định giá vượt 1 tỷ đô la, công ty đặt mục tiêu cho ra mắt sản phẩm đầu tiên vào năm 2025.
Ngoài việc phát triển các cảnh tương tác hấp dẫn, World Labs còn có kế hoạch xây dựng các công cụ hỗ trợ chuyên nghiệp dành cho nghệ sĩ, nhà thiết kế, nhà phát triển, nhà làm phim và kỹ sư. Công ty hướng đến các khách hàng từ các nhà phát triển trò chơi điện tử cho đến các hãng phim lớn.
Justin Johnson, đồng sáng lập World Labs, cho biết trong một tập podcast gần đây của a16z: “Chúng tôi đã có khả năng tạo ra các thế giới ảo tương tác, nhưng chi phí cho việc này thường lên đến hàng trăm triệu đô la và tốn nhiều thời gian phát triển.” Ông nhấn mạnh rằng “[Các mô hình thế giới] sẽ không chỉ cho phép bạn tạo ra một hình ảnh hay một clip, mà là một thế giới 3D được mô phỏng hoàn toàn, sống động và tương tác.”
Với tầm nhìn này, World Labs không chỉ muốn cách mạng hóa cách thức tạo ra nội dung kỹ thuật số mà còn tạo ra những cơ hội mới cho các ngành công nghiệp sáng tạo. Công ty đang đứng trước ngưỡng cửa của một kỷ nguyên mới trong sản xuất nội dung 3D, đầy hứa hẹn và tiềm năng.