AI phát triển năm 2024 và thách thức?
Về năng lượng
“Các trung tâm AI ngốn điện ngày càng tăng.” Đó là một tiêu đề trong báo cáo Dự đoán AI thế hệ 2024 của CBInsight. Theo đó, báo cáo thông tin “Chip cao cấp của Nvidia sẽ tiêu thụ lượng năng lượng tương đương một quốc gia nhỏ vào năm 2024.” Và thực sự là “Các trung tâm dữ liệu mô hình cũ, hiện có chưa sẵn sàng cho việc này.”
Nhu cầu về các trung tâm dữ liệu AI tăng vọt. Trung tâm AI càng lớn, nhu cầu làm mát càng tăng và lượng tiền khổng lồ đang được đổ vào các công ty công nghệ phụ trợ cho trung tâm dữ liệu AI như làm mát bằng chất lỏng của công ty KKR đã mua CoolIT Systems với 270 triệu USD trong quý II năm 2023. Bosch đã hỗ trợ JetCool thông qua liên doanh của chi nhánh trong quý IV năm 2023. Hay Vertiv đã mua Cooltera cũng quý IV năm 2023. Năng lượng tái tạo được nhiều công ty đề cập tới, tuy nhiên với AI, để duy trì và phát triển bền vững, tương lai năng lượng hạt nhân sẽ là lựa chọn cần thiết.
Ở Việt nam, tập đoàn Viettel vừa ra mắt trung tâm dữ liệu lớn nhất Việt nam, nó có công suất tiêu thụ điện lên tới 30 MW.[i] Có thể hình dung mức tiêu thụ này như sau. Thuỷ điện Hoà bình có 8 tổ máy, mỗi tổ máy phát được 240 MW. Như vậy, cả nhà máy sẽ chỉ phát được cho 64 trung tâm dữ liệu như của Viettel.
Vấn đề dữ liệu
“Chúng ta sắp hết mất nguồn dữ liệu chất lượng để đào tạo cho học máy LLMs” Các nhà nghiên cứu ước tính rằng đến năm 2026, chúng ta sẽ cạn kiệt dữ liệu văn bản[ii] chất lượng cao để đào tạo LLMs - một xu hướng có thể làm chậm tiến độ AI.”[iii] Văn bản internet miễn phí không còn là một kênh khai thác nữa - và việc tìm kiếm các nguồn độc quyền ngày càng khó khăn hơn.
Các nhà cung cấp có nội dung độc quyền sẽ trở thành mục tiêu sôi động trong việc nhượng quyền và mua lại.[iv] Chi phí và sự khan hiếm sẽ thúc đẩy nhu cầu về có bộ dữ liệu tổng hợp. Công ty Glaive đã kêu gọi được vốn đầu tư ban đầu 3,5 triệu USD vào quý III năm 2023 từ Spark Capital và Village Global để tuỳ chỉnh cho việc huấn luyện LLMs dựa trên nền tảng dữ liệu tổng hợp. CEO của OpenAI, Sam Altman từng phát biểu “tất cả các dữ liệu rồi nhanh chóng được tổng hợp.” Microsoft cũng tạo ra các mô hình đào tạo ngôn ngữ PHI-1 và 2 dựa trên dữ liệu tổng hợp từ GPT. Hay NOUS, công ty đã xây dựng mô hình học máy LLM đã được đào tạo (OpenHermes-2, Nous Hermes) trên 900K đến 1M mục nhập dữ liệu do GPT-4 tạo ra. Họ đã huy động được 5,2 triệu đô la tài trợ ban đầu trong quý 4 năm 21 từ DistributedG, OSS Capital và các tổ chức khác.[v]
Cơn khát GPU
Ngày càng nhiều đối thủ cho Nvidia: Sự cạnh tranh chip ngày càng tăng trong bối cảnh thiếu GPU đang ảnh hưởng nặng nề đến ngành công nghiệp AI. Giá bán mỗi H100s được tăng lên chóng mặt. Ước tính từ Raymond James về chi phí sản xuất H100: Nvidia có chi phí khoảng 3,320 USD. Giá bán trung bình 30,000 USD và giá niêm yết trên eBay tháng 01 năm 2024 là 45,000 USD và niêm yết trên CDW cũng tháng 1 năm 2024 là 97,835 USD.[vi] Đến mức, Elon Musk đã phát biểu tại Hội nghị thượng đỉnh hội đồng các tổng giám đốc Phố Wall (WSJ CEO Council Summit) rằng: “GPU vào thời điểm này khó kiếm hơn nhiều so với cả kiếm thuốc chữa bệnh.”
Các tập đoàn công nghệ càng lớn, mua càng nhiều. Ví dụ, năm 2023, Tesla mua 15 ngàn, Tencent mua 50 ngàn, Oracle mua 50 ngàn, Google mua 50 ngàn, nhưng cách biệt là Microsoft mua 150 ngàn và Beta mua 150 ngàn H100 GPUs.[vii] Trước nhu cầu tăng vọt, những khách hàng lớn nhất của Nvidia cũng đang đẩy mạnh sản xuất chip của riêng mình.
Tại tập đoàn Amazon, Giám đốc điều hành Andrew Jassy, phát biểu trong báo cáo tài chính quý IV năm 2023: “Thật sự rất khó để có được số lượng GPU như mọi người mong muốn. Và đó chỉ là một lý do khác khiến Trainium và Inferentia [chip Amazon] lại hấp dẫn mọi người đến vậy.” Hay tại Microsoft, Scott Guthrie, phó chủ tịch cấp cao của nhóm AI và điện toán đám mây của Microsoft phát biểu: “Ở quy mô chúng tôi vận hành, điều quan trọng là chúng tôi phải tối ưu hóa và tích hợp mọi lớp của cơ sở hạ tầng để tối đa hóa hiệu suất, đa dạng hóa chuỗi cung ứng và mang đến cho khách hàng sự lựa chọn về cơ sở hạ tầng.”
Chính vì vậy, Các đối thủ về chip đã đang gây khó cho sự phát triển thần tốc trong thời gian qua của Nvidia. Đáng kể như Amazon vói chip Trainium năm 2022 cho tính năng huấn luyện và Inferentia năm 2019 cho tính năng suy luận. Google với chip Tensor processing unit năm 2017 cho cả việc gia tốc huấn luyện và suy luận. Microsoft với Mala 100 cho cả việc gia tốc huấn luyện và suy luận năm 2024 (chuẩn bị ra mắt). Meta với MTIA cũng cho cả việc gia tốc huấn luyện và suy luận, ra mắt năm 2023 cho sử dụng nội bộ.[viii]
Những tác nhân xấu nhắm đến mô hình ngôn ngữ
Các chương trình học máy LLM hàng đầu cũng vẫn có thể không bao giờ được bảo mật hoàn toàn. Các hệ thống DeepMind, Bosch và các nhà nghiên cứu đã từng bị cho học máy LLM là để “tạo ra kế hoạch từng bước nhằm tiêu diệt loài người” Các vấn đề đối nghịch của LLMs chưa biết các nhà phát triển có đảm bảo giải quyết được hay không. Vấn đề mà chục năm qua cũng đã đặt ra để tấn công với tầm nhìn về phát triển máy tính điện tử.
Vấn đề bảo mật, toàn vẹn, sự đúng đắn cho dữ liệu ngày càng được thắt chặt với các ngữ cảnh hoàn toàn mới. Giám đốc sản phẩm Lee Klarich của Paloalto, nói trong báo cáo tài chính quý 2 năm 2023: “…có một số rủi ro liên quan đến học máy [LLM], đặc biệt là trong các trường hợp sử dụng của doanh nghiệp. Chúng tôi đã thấy một số ví dụ trong đó dữ liệu được đưa vào các mô hình ngôn ngữ lớn mà không hiểu dữ liệu sẽ được sử dụng như thế nào và dữ liệu đã được…công khai ngay cả khi nó vẫn cần được giữ bí mật ...Ngoài ra còn có sự nhạy cảm từ góc độ bảo mật của những thứ như tấn công tiêm nhiễm nhanh chóng, đầu độc dữ liệu…”
Từ vấn đề bảo mật, các nhà cung cấp mới chuyên bảo mật cho học máy LLMs đã xuất hiện: HiddenLayer tại Mỹ, sau gọi vốn Series A quý III năm 2023 đã có 56 triệu USD từ nhiều nhà đầu tư M12 (Dẫn đầu), Moore Strategic Ventures (Dẫn đầu), Booz Allen Liên danh, liên danh Capital One, Liên danh IBM, Liên danh Ten Eleven. CalypsoAI từ Mỹ sau gọi vốn Series A-II quý II năm 2023 đã có 38 triệu USD. Hay DeepKeep từ Israel giai đoạn đầu gọi vốn quý III năm 2023 với 6 triệu USD.[ix]
Vấn đề hợp nhất các hệ thống học máy MLOps
Các hoạt động của hệ thống học máy bị phân mảnh, không có liên kết, kế thừa. Có thể cần tới hơn 130 công ty riêng rẽ có sản phẩm ở 12 hạng mục khác nhau cùng tham gia giúp các doanh nghiệp thực hiện các dự án LLM từ đầu đến cuối. Trong khi doanh nghiệp mong muốn làm sao chỉ tới một nơi để có thể mua giải pháp AI họ cần. Các khách hàng cảm nhận được sự phức tạp trong một thị trường quá đông đúc. Do đó, đến lúc nền tảng end to end sẽ chiếm ưu thế trong thời gian tới.
Các công ty đang tích cực mua bán, hợp nhất như, Databricks đang tích cực đi mua các công ty LLMs cần thiết như arcion, Mosaic, Rubicon, Okera, Datajoy… trong khi đó, các công ty có hạ tầng đám mây cũng đã sẵn sàng nền tảng cho vận hành MLOps như Google Cloud, Microsoft Azure hay AWS.
AI đa phương thức trở thành như món tiền cược trên bàn, tuy vẫn đang sơ khai, nhưng các mô hình đang phát triển nhanh chóng. Như năm 2021, 2022, mô hình văn bản hình ảnh đưa ra của Open AI CLIP, Google ALIGH, Salesforce ALBEF, Google LIT, Google CLCA, DeepMind FLAMINGO, Salesforce BLIP. Mô hình LLMs hiểu hình ảnh như Salesforce BLIO2, Microsoft KOSMOS, LLaVA và AdeptFUYU-BB. Sang tới năm 2023, mô hình dữ liệu nhiều giác quan hoen như Google PALM-E, Meta ImageBind. Rồi các mô hình đa phương thức tự nhiên xuất hiện với khởi đầu là Google Gemini.[x]
Google đang thách thức các đối thủ bằng mô hình thương mại đầu tiên sử dụng đầu vào đa dạng. Gemini của Google vượt trội hơn GPT-4 Vision trong bảng chuẩn của MMMU tổng thể là 59.4 so với 56.8 của GPT-4 Vision trong các tiêu chí Nghệ thuật và Thiết kế, Kinh doanh, Khoa học, Sức khoẻ và y tế, Khoa học xã hội và con người, Kỹ thuật và công nghệ.[xi] Nhiều nhà phát triển LLM sẽ làm theo để cạnh tranh mô hình trên, như OpenAI được đầu tư với 14 tỷ USD, ANTHROPC với 3,4 tỷ USD, Inflection có 1,5 tỷ USD và nhiều công ty khác với hàng trăm triệu USD cho các dự án này.[xii] AI đa phương thức sẽ mở ra những cơ hội thương mại mới.
Doanh nghiệp cũng sẽ có cơ hội thực hiện được nhiều hơn với các dự án mô hình AI vừa túi tiền.
Chi tiêu của các doanh nghiệp cho các mô hình lớn có thể lên đến hàng triệu USD mà như Tom Dotan, phát biêu trên WSJ “[GPT-4] là một trong những mẫu AI lớn nhất và đắt nhất hiện có. Sử dụng nó để tóm tắt một email cũng giống như lấy một chiếc Lamborghini để giao một chiếc bánh pizza vậy.” Các mô hình hiện đang được thu nhỏ lại, khiến chúng được đào tạo nhanh hơn và chạy rẻ hơn, sẽ phù hợp hơn. Bất chấp quy mô của chúng, các mô hình ngôn ngữ nhỏ đang đạt hiệu suất cao trên các tiêu chuẩn chung.[xiii]
Các ngành có dữ liệu nhạy cảm sẽ chọn các mô hình nhỏ ở bên ngoài của học máy LLM. Như phát biểu của Glean, Giám đốc điều hành Arvind Jain, trả lời phỏng vấn với Computerworld “Chúng tôi nhận thấy sự lo ngại của các doanh nghiệp về việc sử dụng mô hình như GPT hoặc PaLM vì chúng rất lớn và phải do các nhà cung cấp mô hình lưu trữ. Theo một nghĩa nào đó, dữ liệu của bạn sẽ được chuyển qua các nhà cung cấp đó.”
Nhưng như phát biểu trong báo cáo tài chính của công ty ZETA, Giám đốc điều hành David Steinberg, phát biểu: “…chúng tôi thực sự tập trung vào cái mà chúng tôi gọi là mô hình ngôn ngữ nhỏ, cho phép thuật toán hoạt động bên trong CDP và chỉ xem dữ liệu của chúng cũng như đám mây dữ liệu Zeta, đồng thời thực sự, thực sự thông minh trên các sản phẩm của chúng mà không bao giờ cho phép dữ liệu của chúng rời khỏi hệ sinh thái. Điều đó gây được sự hưởng ứng như chưa từng thấy trước đây.”[xiv] Các mô hình nhỏ sẽ đảm nhận các nhiệm vụ hẹp về tài chính, y tế và luật. Các công ty có mô hình này như WEITER về y tế, ANT GROUP về y tế hay arcee.ai. về luật, tài chính và cả y tế.[xv]
Các mã nguồn mở đặt ra thách thức đối với LLM đóng.
Các nhà phát triển LLM nguồn mở đang nhận thấy sự quan tâm của nhà đầu tư và thương mại ngày càng tăng. Giám đốc điều hành Mark Zuckerberg, phát biểu trong báo cáo tài chính quý 3 năm 23 của Meta nói, "...chúng tôi cũng đang xây dựng các mô hình nền tảng như Llama 2, mà chúng tôi tin rằng hiện là mô hình nguồn mở hàng đầu với hơn 30 triệu lượt tải xuống Llama vào tháng trước." Các công ty đã huy động được tổng cộng gần 1 tỷ USD trong 2 tháng cuối năm 2023, riêng Databrick mua Mosaic đến 1,3 tỷ USD. (Không bao gồm các nhà phát triển nguồn mở chưa huy động vốn cổ phần (kể từ ngày 3/1/2024)[xvi]
Số lượng dự án AI kỷ lục sẽ được xây dựng trên các mô hình nguồn mở vào năm 2024. Khoảng cách năng lực giữa các giải pháp tư nhân và nguồn mở sẽ thu hẹp nhanh chóng. Các mô hình mở nhỏ hơn đang hoạt động tốt hơn GPT-3.5 và báo cáo hiệu suất tương đương với một số mô hình đóng lớn hơn trên điểm chuẩn MMLU.[xvii] Các doanh nghiệp sẽ ngày càng xem xét các lựa chọn thay thế bằng các giải pháp mã nguồn mở.
Hướng đến các máy chuyển đổi, kiến trúc mới thách thức với hiện trạng
Nghiên cứu của Google trong máy chuyển đổi là bước ngoặt trong lĩnh vực sáng tạo AI. Năm 2017 Máy chuyển đổi của Google dựa trên kiến trúc mạng lưới thần kinh mới, giúp hiểu ngôn ngữ tốt hơn các phương pháp cũ. Năm 2018, GOOGLE BERT AI hai chiều dựa trên máy chuyển đổi được đào tạo trước bằng văn bản Wikipedia, trong đó một từ được lấy trong ngữ cảnh của các từ trước và từ tiếp theo. OPENAI GPT mô hình AI theo ngữ cảnh một chiều dựa trên máy chuyển đổi, trong đó một từ được sử dụng trong ngữ cảnh của các từ đứng trước nó trong câu. Năm 2019, OPENAI GPT-2 AI được đào tạo trước với 8 triệu trang văn bản trên internet. Năm 2020, OPENAI GPT-3 tạo ra văn bản giống con người; lớn hơn và tính toán chuyên sâu hơn GPT-2; OpenAI phát hành tích hợp API.
Nhưng các mô hình dựa trên máy chuyển đổi đang để lại lượng khí thải carbon lớn. Lượng khí thải CO2 tương đương (tấn) theo các mô hình học máy được chọn và ví dụ thực tế, năm 2022: GPT-3 là 502, Gopher là 352 trong khi đó 1 người Mỹ 1 năm thải khoảng 5.5 tấn. Người dùng thì luôn luôn muốn có kết quả vượt giới hạn khả năng của hệ thống và máy chuyển đổi cũng luôn nhiều biến hơn và những thách thức mới này sẽ thương mại hoá trong năm 2024.
Bạn gái AI giết chết sự lãng mạn của con người
Người trẻ đang ít quan tâm tới tình dục hơn. Thế hệ gen Z cô đơn đang dần có các giải pháp, hệ thống AI và họ làm bạn với AI. Nhưng ai cần những người bạn thực sự khi bot AI của bạn có thể dễ thương như con người? Hơn một nửa số 4 triệu người dùng của Character.AI dưới 24 tuổi. Công nghệ dành cho các cuộc đối thoại mở và tạo nhân vật AI đang phát triển nhanh chóng.
Những tiến bộ trong ngành công nghiệp trò chơi sẽ dẫn đến những trải nghiệm xã hội, trực tuyến phong phú hơn. Inworld, một đối tác với Xbox và Unity Games đã huy động được đầu tư 117 triệu USD vào 13/10/2023. Convai cũng huy động được 4.8 triệu USD ngày 11/01/2023, hay Latitude đã huy động được 4 triệu USD ngày 01/4/2023. Circle Labs huy động được 4.3 triệu USD ngày 14/11/2023.[xviii] Năm 2024 sẽ chứng kiến sự bùng nổ của tình bạn AI.
iPhone thế hệ tiếp theo: Cuộc cách mạng phần cứng của AI
15 năm sau khi ra mắt, doanh số iPhone đang trì trệ. Apple bị chỉ trích vì đã đạt đến đỉnh cao đổi mới. Chính vì vậy, đột phá AI đã khởi động cuộc tìm kiếm iPhone thế hệ tiếp theo. Các công ty khởi nghiệp phát triển thiết bị AI tiêu dùng như: hu.ma.ne với sản phẩm là thiết bị đeo không màn hình, được hỗ trợ bởi ChatGPT, hỗ trợ giọng nói và cử chỉ, đã huy động được 242 triệu USD vào ngày 08/3/2023. Rewind vào ngày 09/5/2023 đã huy động được 27 triệu USD cho sản phẩm “Mặt dây chuyền” có thể đeo ghi lại và phân tích âm thanh. Tab là công ty huy động được 2 triệu USD ngày 10/1/2024 cho sản phẩm là vòng cổ đeo được ghi lại và phân tích âm thanh bằng GPT-4. Rabbit có 30 triệu USD ngày 21/12/2023 cho thiết bị dùng Rabbit OS, hệ điều hành dựa trên LLM; thiết bị r1 tương tác bằng Giọng nói, nút bấm và màn hình.[xix]
Các tập đoàn công nghệ hàng đầu, nhiều tri thức cũng như túi tiền đang thắng thế trong cuộc chơi. Apple dẫn đầu công nghệ lớn về hợp nhất và mua lại AI với 32 sản phẩm. Google với 21 và Meta mua 18. Microsoft mua 17 còn Amazon mua 10 sản phẩm.[xx] Các đối thủ nặng ký trong ngành đều đang đặt cược vào phần cứng gốc AI. OpenAI đang đàm phán để xây dựng phần cứng AI mới với LoveFrom, công ty đã thu hút hơn 20 nhân viên Apple1[xxi]. Trong đó, Jony Ive sáng lập viên, các vị trí trước đó là: SVP Thiết kế Công nghiệp, Giám đốc Thiết kế. Hay Tang Tan, Trưởng nhóm kỹ thuật phần cứng, vị trí trước đây là VP, iPhone & Apple Watch.
Theo báo cáo của các công ty thì công nghệ lớn và OpenAI sẽ thúc đẩy các thử nghiệm đầu tiên vào năm 2024. Như Meta cho ra thiết bị Kính thông minh Ray-Ban được hỗ trợ bởi AI, đã sẵn sàng thương mại. Apple có Apple Vision Pro phát hành tháng 2 năm 2024 và “Apple GPT” mang lại điều gì mới? OpenAI đang phát triển Iphone của AI. Tầm nhìn tương lai: LLM phát triển từ chatbot đến thành các hệ điều hành.
Các vùng tự trị: Từ cường điệu hoá đến hữu ích thật
Ý tưởng về các đặc vụ AI giống Jarvis đã lan truyền nhanh chóng vào năm 2023. Truyền thông đã đề cập đến các tác nhân tự trị phổ biến – các bot được hỗ trợ bởi LLM có thể suy luận và thực hiện các nhiệm vụ một cách độc lập. Các dự án vùng tự trị sinh sôi nảy nở - nhưng còn lâu mới hữu ích về mặt thương mại. Các vùng tự trị đó ngày càng lý luận tốt hơn nhưng vẫn gặp khó khăn trong việc thực hiện nhiệm vụ. Các tập đoàn công nghệ lớn đang quan tâm và đầu tư vào lĩnh vực này trong năm 2024.
Việc sử dụng trợ lý số, nâng hiệu quả nhân viên văn phòng
Theo thống kê của Cục Thống kê Lao động Hoa Kỳ, nhiều năm từ 2007 trở lại đây, nhân viên văn phòng có hiệu quả làm việc kém và không cải thiện được. Việc áp dụng kỹ thuật số có tương quan với tăng trưởng năng suất lao động của Hoa Kỳ. AI sẽ khởi động sự bùng nổ tiếp theo. Trong phát triển phần mềm, các trợ lý AI đang trở nên cần thiết đối với năng suất của nhà phát triển. Trợ lý mã hóa sẽ trở thành công cụ phát hành tiêu chuẩn tại các doanh nghiệp.
Trong lĩnh vực chăm sóc sức khỏe, các trợ lý số đang tự động hóa các nhiệm vụ tẻ nhạt như tài liệu. Các công ty đầu tư vào lĩnh vực này như Suki 95 triệu USD, Corti 87,2 triệu USD. Nuance 69,5 triệu USD, abridge với 57,5 triệu USD, Nabla 44,3 triệu USD, DeepScrible có 40,2 triệu USD và Regard có 20,6 triệu USD.[xxii]
AI so với AI: GenAI thúc đẩy làn sóng tấn công và phòng thủ mới
Các cuộc tấn công mạng tiếp tục gia tăng, với AI tạo động lực mới. Các cuộc tấn công mạng trung bình hàng tuần trên toàn cầu trên mỗi tổ chức đạt mức cao nhất mọi thời đại trong quý 2 năm 2023 theo Checkpoint là 1.258 cuộc. Deepfakes ngày càng tinh vi hơn bằng cách sử dụng các công cụ GenAI như hoán đổi khuôn mặt, giả mạo giọng nói.
Số lần thử deepfake tăng 31 lần vào năm 2023 so với năm 2022 được ghi lại bởi một nền tảng xác minh danh tính[xxiii]. ChatGPT thúc đẩy sự bùng nổ của các cuộc tấn công lừa đảo qua email. Một nhà cung cấp bảo mật email đã ghi nhận số lượng email lừa đảo tăng 1.256% từ Quý 4 năm 2022 đến quý 3 năm 2023 (theo SlashNext).
Các nhà cung cấp an ninh mạng sử dụng AI tổng hợp để chống lại các cuộc tấn công. “SlashNext đang nghiên cứu một giải pháp dựa trên AI tổng quát, có nghĩa là nó sẽ tạo ra loại lừa đảo và phần mềm độc hại của riêng mình, đồng thời nó sẽ đào tạo phần mềm để tự động nhận biết bất kỳ loại mối đe dọa mới nào xuất hiện trên thị trường…Đó là điểm khác biệt so với góc độ công nghệ.” Kỹ sư thiết kế cấp cao từ một khách hàng của SlashNext, công ty thuộc Fortune 500 nói.[xxiv]
Một loạt các nhà cung cấp an ninh mạng tập trung vào GenAI mới sẽ xuất hiện. Wraithwatch thành lập năm 2023 ở Mỹ gọi vốn 8 triệu USD cho lĩnh vực an ninh mạng. Jericho Security cũng năm 2023 ở Mỹ có 5 triệu USD trong việc Mô phỏng vi phạm và tấn công. BrightSide AI năm 2023 ở Thuỵ sĩ với 1 triệu USD cũng cho Mô phỏng vi phạm và tấn công. Nexusflow năm 2023 tại Mỹ có 11 triệu USD trong việc tạo trợ lý số cho trung tâm điều hành an ninh.
“Với trí tuệ nhân tạo, chúng tôi thấy rằng có những công cụ xuất hiện để giúp những kẻ tấn công tận dụng AI để tạo ra các cuộc tấn công lừa đảo cực kỳ thuyết phục...việc chúng tôi giải quyết [điều này] sẽ thực sự quan trọng.” Giám đốc điều hành của một cơ sở giáo dục, khách hàng của GoSecure phát biểu.
“Khả năng phát triển của Proofpoint nằm ở khả năng phát hiện các mối đe dọa mới nổi do trí tuệ nhân tạo tạo ra. Khi AI tổng hợp và các loại mối đe dọa khác trở nên phức tạp và phổ biến hơn, chúng gây ra rủi ro lớn hơn cho hoạt động kinh doanh của chúng tôi.” Một khách hàng khác của Proofpoint, giám đốc một công ty sản xuất thương mại đại chúng nói.[xxv]
GenAI tiếp quản ngành báo chí
Việc làm trong phòng báo chí ở Mỹ đang suy giảm. Các tổ chức truyền thông đang sử dụng AI để tăng tốc độ thu thập, sản xuất và phân phối tin tức. Như The New York Times sẻ dụng The Dynamic Metter với ứng dụng mô hình học máy đặt giới hạn đồng hồ đo được cá nhân hóa để có tính phí thông minh hơn. American Journalism Project chi 5 triệu USD làm đối tác với OpenAI để tận dụng các công cụ AI để hỗ trợ và mở rộng phạm vi đưa tin tức địa phương. Hay The Washington Post với Heliograf. Được giới thiệu lần đầu tiên vào năm 2016, Heliograf tự động hóa báo cáo về dữ liệu có cấu trúc (ví dụ: tỷ số thể thao). AP sử dụng SAM làm công cụ giám sát phương tiện truyền thông xã hội để luôn cập nhật tin tức mới nhất.[xxvi]
Nhưng với công cụ tìm kiếm dựa trên genAI sắp ra mắt, liệu điều đó có đủ không? Cũng theo WSJ “Một lực lượng đặc nhiệm ở Đại Tây Dương đã mô hình hóa những gì có thể xảy ra nếu Google tích hợp AI vào tìm kiếm. Nó phát hiện ra rằng 75% thời gian, tìm kiếm được hỗ trợ bởi AI có thể sẽ cung cấp câu trả lời đầy đủ cho truy vấn của người dùng và trang web của Atlantic sẽ bỏ lỡ lưu lượng truy cập mà lẽ ra nó sẽ nhận được.”
Các tổ chức tin tức sẽ đạt được thỏa thuận mới với các nhà phát triển LLM để cấp phép nội dung khi mô hình doanh thu thay đổi. “Người dẫn chương trình tin tức AI đang ở đây...tiếp theo là các phóng viên…” Chúng ta sẽ dần bắt gặp câu giới thiệu như vậy. Kênh Channel +1 Mỹ ra mắt “mạng tin tức AI tổng hợp” vào mùa thu năm 2024 với các kênh tin tức do AI tạo ra và giọng nói được tạo ra bằng kỹ thuật số. SBS News của Hàn quốc có Người đưa tin AI ra mắt Zae-In do công ty khởi nghiệp Pulse9 thiết kế. India Today của Ấn độ ra mắt người dẫn chương trình được hỗ trợ bởi AI Sana. Sports Illustrated Mỹ bị chỉ trích vì xuất bản các bài viết của những người viết giả do AI tạo ra…[xxvii]
Ngoài ảnh tĩnh: Việc tạo video có những bước tiến
“Việc tạo video khó hơn nhiều so với ảnh vì ngoài việc tạo chính xác từng pixel, hệ thống còn phải dự đoán chúng sẽ thay đổi như thế nào theo thời gian.” Phát biểu của Mark Zuckerberg vào quý III năm 2022. “Chuyển văn bản thành video thường được đào tạo trên các clip rất ngắn, nghĩa là chúng yêu cầu phương pháp tiếp cận khung hình chuyển chậm và tốn kém về mặt tính toán để tạo ra các video dài. Kết quả là, những mô hình này nổi tiếng là khó triển khai và mở rộng quy mô, đồng thời vẫn bị hạn chế về bối cảnh và độ dài.” Cựu kỹ sư ML Alara Darick, phát biểu vào quý II năm 2023.[xxviii] Thế nhưng, hiện nay các mô hình video tổng hợp đang phát triển nhanh chóng.
Theo dõi tác động ngay lập tức trên các ngành quảng cáo, Hollywood và các ngành truyền thông trực quan khác. Các công ty khởi nghiệp chạy đua xây dựng nền tảng chỉnh sửa và tạo video cho doanh nghiệp và sáng tạo. Runway, trong lần gọi vốn Series C đã có 237 triệu USD từ Google, Nvidia, Salesforce Ventures và Coatue. Runway hợp tác với Getty Images để tạo mô hình video genAI nhắm đến các hãng phim và công ty quảng cáo, truyền thông và phát thanh truyền hình ở Hollywood (Tháng 12 năm 2023). Pika có 55 triệu USD trong vòng series A từ Lightspeed Venture Partners, Adam D’Angelo và Andrej Karpathy. Đã báo cáo 500.000 người dùng “tạo ra hàng triệu video mỗi tuần” (Tháng 12 năm 2023). Hay Stability.ai, gọi vốn được 151 triệu USD từ Lightspeed Venture Pảtners, Coatue và Intel. Mô hình chuyển văn bản thành video có sẵn cho nhà phát triển thông qua API AI ổn định (tháng 12 năm 2023).
ByteDance với 7,4 tỷ USD sau vòng Series D từ Tiger Global, KKR và Tencent đã phát hành MagicVideo-V2, một "quy trình tạo video toàn diện nhiều giai đoạn" (Tháng 1 năm 2024). Hay Moonvalley có 30 triệu USD từ Khosla Ventures và Y Combinator, tạo ra "cảnh phim chất lượng điện ảnh"; đạt được 100.000 người dùng sau 6 tuần trên Discord (tháng 11 năm 2023)
Nối tiếp sự điên cuồng, một nghĩa địa genAI xuất hiện
Cơn sốt Gen AI điên cuồng đã đưa việc định giá AI lên tầm cao vào năm 2023. Định giá trung bình cho các giao dịch được VC (Đầu tư mạo hiểm) hỗ trợ vào năm 2023 của các công ty chưa có AI và có AI. Vòng đầu Seed tử 15 triệu lên 19 triệu. Series A từ 50 triệu lên 70 triệu và Series B từ 119 triệu lên 189 triệu USD.[xxix]
Các công ty GenAI mới ra đời đe doạ các công ty AI đời đầu một cách nhanh chóng, nhiều công ty phải sa thải nhân viên hàng loạt. Vào năm 2024, sự chú ý sẽ đổ dồn vào các công ty xây dựng các giải pháp gắn kết hơn trong các lĩnh vực chuyên biệt.
[i] https://www.qdnd.vn/giao-duc-khoa-hoc/tin-tuc/viettel-khai-truong-trung-tam-du-lieu-lon-nhat-viet-nam-772158
[ii] Dữ liệu từ các nguồn như bài báo, Wikipedia, nội dung web được lọc
[iii] “An analysis of the limits of scaling datasets in Machine Learning” by Epoch, MIT CSAIL, and others”
[iv] CB Insights research — https://www.cbinsights.com/research/generative-ai-publisher-licensing/
[v] Thông tin từ hồ sơ doanh nghiệp của các công ty – Glaive, Nous, OpenAI, Stability AI
[vi] Nguồn CB Ínight lấy từ Raymond James.
[vii] Nguồn: Omdia Research
[viii] Nguồn: từ các báo cáo từng công ty.
[ix] Nguồn: CB Insights market report -- Machine learning security
[x] Nguồn: Nghiên cứu đã công bố, thông cáo báo chí. *Ví dụ: tạo hình ảnh dựa trên văn bản, tạo mô tả hình ảnhAI đa phương thức đề cập đến các mô hình có thể hiểu và phản hồi ở nhiều phương thức dữ liệu (văn bản, video, hình ảnh, v.v.)
[xi] Nguồn: Tiêu chuẩn về hiểu biết và suy luận đa phương thức đa ngành (MMMU) dành cho chuyên gia AGI
[xii] Source: CB Insights market report —https://app.cbinsights.com/market-report/1710?tab=overview
[xiii]https://app.cbinsights.com/top-search?tab=earnings&isid=0-d260255e-5d7f-33d1-a06c-58e051d4eb93&companyView=table
[xiv]https://app.cbinsights.com/top-search?tab=earnings&isid=0-ade776db-3ae3-326f-8ffd-a0ae0dd3f9a1&companyView=table
[xv] Nguồn CB Insight từ hồ sơ các doanh nghiệp — Writer, Ant Group, arcee.ai
[xvi] https://app.cbinsights.com/market-report/1710?tab=marketData, https://app.cbinsights.com/top-search?tab=earnings&isid=0-af9142fc-4b2b-386f-9318-632c8a58ab97&companyView=table
[xvii] Nguồn: Ngôn ngữ đa tác vụ khổng lồ Điểm hiểu biết của CB Insight
[xviii] Nguồn: Hồ sơ công ty CB Insights - Inworld AI, Convai, Latitude, Circle Labs
[xix] Nguồn: Hồ sơ công ty CB Insights — Humane, Rewind, Tab, Rabbit
[xx] https://www.cbinsights.com/research/big-tech-ai-acquisitions/ (dữ liệu ngày 19/9/2023)
[xxi] Nguồn: Dữ liệu về những người chủ chốt của CB Insights — Jony Ive, Tang Tan; 1 Engadget
[xxiii]https://app.cbinsights.com/top-search?tab=earnings&isid=0-4a422726-d978-3c41-b956-ae18703e5636&companyView=table
[xxiv] Nguồn: Phỏng vấn người mua phần mềm CB Insights - SlashNext
[xxv] Nguồn: Phỏng vấn người mua phần mềm CB Insights - GoSecure, Proofpoint
[xxvi] Nguồn: SimilarWeb, WSJ
[xxvii] Nguồn: NYT, Channel 1, Futurism, The Guardian
[xxviii] Nguồn: Facebook, Hugging Face blog
Theo Tạp chí in số 1 tháng 4/2024