Mô hình AI ngốn lượng nước khổng lồ: ChatGPT-4 “uống” tới 500 ml nước mỗi khi người dùng đặt câu hỏi

14:52, 21/10/2024

Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) và trung tâm dữ liệu có thể làm tăng nhu cầu về nước.

Các mô hình ngôn ngữ lớn (LLM) phổ biến như ChatGPT của OpenAI rất tốn kém năng lượng, đòi hỏi các trang trại máy chủ to lớn cung cấp đủ dữ liệu để đào tạo các chương trình mạnh mẽ. Việc làm mát chính các trung tâm dữ liệu đó cũng khiến các chatbot AI trở nên vô cùng khát nước.

Theo nghiên cứu mới từ Đại học California, Riverside, quá trình tạo ra văn bản bằng AI tiêu thụ một lượng nước đáng kể để làm mát các trung tâm dữ liệu, chưa kể đến điện năng khổng lồ cần thiết. Điều này không chỉ ảnh hưởng đến môi trường mà còn làm tăng hóa đơn điện và nước cho cư dân sống gần các trung tâm dữ liệu, mở ra một cuộc tranh luận về tác động tiêu cực của AI đối với tài nguyên tự nhiên.

Quá trình tạo ra nội dung của các AI tiêu tốn một lượng tài nguyên không hề nhỏ.

Mô hình AI ngốn lượng nước khổng lồ để làm mát các trung tâm dữ liệu

Các trung tâm dữ liệu là xương sống của các hệ thống AI hiện đại như Chat GPT-4, nơi lưu trữ và xử lý khối lượng thông tin khổng lồ. Tuy nhiên, một trong những thách thức lớn mà chúng phải đối mặt là quản lý nhiệt độ bên trong các cơ sở này. Hàng nghìn máy chủ chạy liên tục tạo ra một lượng nhiệt lớn, và để đảm bảo các máy chủ hoạt động ổn định, hệ thống làm mát hiệu quả là bắt buộc.

Khi chạy đua trong cơn sốt AI sáng tạo, các nhà phát triển công nghệ hàng đầu bao gồm Microsoft, OpenAI và Google đều thừa nhận rằng nhu cầu ngày càng tăng đối với các công cụ AI đã kéo theo chi phí khổng lồ, từ chất bán dẫn đắt tiền đến mức tiêu thụ nước tăng.

Nhưng họ thường giữ bí mật về các chi tiết cụ thể. Rất ít người ở Iowa biết đây là là nơi sản sinh ra mô hình ngôn ngữ lớn tiên tiến nhất của OpenAI, GPT-4.

Xây dựng một mô hình ngôn ngữ lớn đòi hỏi phải phân tích các mẫu trên một kho văn bản khổng lồ do con người viết. Tất cả hoạt động tính toán đó tiêu tốn rất nhiều điện và tạo ra rất nhiều nhiệt. Để giữ mát trong những ngày nắng nóng, các trung tâm dữ liệu cần bơm nước vào.

Trong báo cáo môi trường mới nhất của mình, Microsoft tiết lộ rằng mức tiêu thụ nước toàn cầu của họ đã tăng vọt 34% từ năm 2021 đến năm 2022 (lên gần 1,7 tỷ gallon, hay hơn 2.500 bể bơi cỡ Olympic), tăng mạnh so với những năm trước và lý do được cho là do nhu cầu làm mát trong các trung tâm dữ liệu của họ tăng lên, nơi các công cụ như Bing Chat và ChatGPT hoạt động.

Lượng nước cần sử dụng cho các trung tâm dữ liệu cũng thay đổi tùy theo vị trí địa lý và chi phí năng lượng ở mỗi khu vực. Ở những nơi như Texas, nơi chi phí điện rẻ hơn, lượng nước tiêu thụ cho việc làm mát trung tâm dữ liệu thường thấp hơn, bởi vì hệ thống cần ít điện năng hơn để vận hành các máy chủ. Tuy nhiên, ở các bang có chi phí điện cao như Washington, trung tâm dữ liệu lại phải dùng nhiều nước hơn để bù đắp cho nhu cầu năng lượng cao.

ChatGPT “uống” tới 500 ml nước mỗi khi người dùng đặt câu hỏi

Theo báo cáo, tất cả chúng ta đều biết rằng ChatGPT tốn khoảng 700.000 USD mỗi ngày để vận hành, điều đáng lưu ý là mọi truy vấn trên ChatGPT đều phải sử dụng một lượng nước tương đương với một chai nước để làm mát không hệ thống. Nhìn chung, Microsoft khá minh bạch về việc sử dụng năng lượng của mình nhờ cam kết thực hiện các báo cáo hàng năm về tác động môi trường. Google cũng báo cáo mức tăng 20%, điều mà các nhà nghiên cứu của Đại học California cho là do sự phát triển của AI sáng tạo.

Tất cả hoạt động tính toán dữ liệu đều tiêu tốn rất nhiều điện và tạo ra rất nhiều nhiệt. Để giữ mát, các trung tâm dữ liệu cần bơm rất nhiều nước.

Trong một báo cáo sẽ được xuất bản vào cuối năm nay, các nhà nghiên cứu ước tính ChatGPT sẽ “uống” tới 500 ml nước mỗi khi người dùng đặt từ 5-50 câu hỏi. Phạm vi tiêu thụ nước thay đổi tùy thuộc vào vị trí đặt máy chủ và mùa trong năm. Ước tính này bao gồm việc sử dụng nước gián tiếp mà các công ty không đo lường được - chẳng hạn như để làm mát các nhà máy điện cung cấp điện cho trung tâm dữ liệu.

Đối với Microsoft, điều này khiến họ phải đau đầu. Microsoft đã làm việc chăm chỉ để xây dựng hình ảnh một tập đoàn quan tâm đến khí hậu, đầu tư vào các nền tảng như Climeworks air capture và tạo ra các sản phẩm Xbox từ vật liệu tái chế. Việc tiêu thụ nước cho các chiến lược AI có khả năng sẽ làm mất đi điều đó.

“Chúng tôi sẽ tiếp tục theo dõi lượng khí thải của mình, đẩy nhanh tiến độ đồng thời tăng cường sử dụng năng lượng sạch để cung cấp năng lượng cho các trung tâm dữ liệu, mua năng lượng tái tạo và các nỗ lực khác để đáp ứng các mục tiêu bền vững của chúng tôi là âm carbon, dương tính với nước và không lãng phí vào năm 2030”, Microsoft cho biết trong một tuyên bố.

Tuyên bố này nhằm đáp lại các báo cáo cho rằng Microsoft đã tiêu thụ hơn 11 triệu gallon nước cho các trung tâm dữ liệu ở Iowa. Được biết, con số này chiếm 6% tổng lượng nước sử dụng trong toàn khu vực, bao gồm cả nước uống cơ bản. Vị trí và khí hậu ôn hòa của Iowa mang lại hiệu quả hơn nhiều so với một số trung tâm dữ liệu của Microsoft ở xa hơn về phía nam, chẳng hạn như các trung tâm ở Arizona, nơi có khả năng sử dụng nhiều nước hơn nhằm thích ứng với nhiệt độ tăng cao. Chính quyền địa phương West Des Moines cho biết họ sẽ chỉ bật đèn xanh cho các dự án tương lai ở quy mô này của Microsoft nếu họ có thể “triển khai công nghệ để giảm đáng kể mức sử dụng nước vào giờ cao điểm so với mức hiện tại”, do nhu cầu bảo tồn nguồn cung cấp nước cho người dân.

Khan hiếm nước được dự đoán sẽ trở thành một thách thức lớn khi chúng ta bước vào giữa thế kỷ 21. Khoa học cho chúng ta biết rằng mọi thứ sẽ còn tồi tệ hơn nếu đạt đến các ngưỡng nhiệt độ nhất định, vượt xa những gì chúng ta đã thấy khi các kỷ lục về nhiệt độ bị phá vỡ, môi trường sống bị phá hủy và tình trạng khan hiếm nước gia tăng.

Microsoft cho biết họ đang làm việc trực tiếp với bộ phận nước để giải quyết các phản hồi. Hãng cũng vừa mua khoản tín dụng carbon trị giá khoảng 200 triệu USD từ một công ty có tên Heirloom và đã có những khoản đầu tư đáng kể vào các công nghệ làm mát. Nhưng mức độ tiêu thụ nước cũng như tác động đến môi trường của công ty vẫn là một mối lo ngại lớn.

Ảnh hưởng đến cư dân lân cận 

Các trung tâm dữ liệu cần lượng nước lớn để làm mát máy chủ, và lượng nước này thường được lấy từ nguồn cung cấp địa phương. Điều này có thể gây áp lực lớn lên hệ thống cung cấp nước, đặc biệt là ở những nơi đã phải đối mặt với tình trạng thiếu nước hoặc hạn hán. Một ví dụ điển hình là Meta – công ty này đã sử dụng tới 22 triệu lít nước chỉ để đào tạo mô hình AI LLaMA-3. Số nước này tương đương với lượng cần để trồng 4.439 pound gạo hoặc phục vụ nhu cầu sinh hoạt của 164 người Mỹ trong vòng một năm.

Khi các công ty công nghệ này đặt mục tiêu giảm bớt sự phụ thuộc vào nhiên liệu hóa thạch, họ thường có xu hướng chọn đặt trung tâm dữ liệu ở những khu vực có điện rẻ hơn như miền Nam nước Mỹ. Điều này có khả năng làm trầm trọng thêm vấn đề tiêu thụ nước ở những khu vực khô hạn trên thế giới.

Các khoáng chất như lithium và coban rất quan trọng với việc sản xuất pin để sử dụng trong các trung tâm dữ liệu hay ngành công nghiệp. Quá trình khai thác những khoáng khoáng sản này thường liên quan đến việc sử dụng lượng nước đáng kể và có thể dẫn đến ô nhiễm nguồn nước trên thế giới.

Khi một lượng lớn nước được chuyển hướng cho các trung tâm dữ liệu, nguồn cung cấp nước cho người dân địa phương có thể bị ảnh hưởng, dẫn đến việc giá nước tăng cao. Hóa đơn nước của cư dân sống gần các trung tâm này thường tăng lên đáng kể, do nhu cầu tăng và hệ thống phân phối phải chịu áp lực.

Cư dân và chính quyền địa phương ở nhiều khu vực đã bắt đầu phản ứng với những tác động tiêu cực của các trung tâm dữ liệu. Một số địa phương đã yêu cầu các công ty công nghệ lớn như Meta, Google, Microsoft phải cam kết sử dụng nguồn tài nguyên bền vững hơn và đầu tư vào các giải pháp làm mát hiệu quả để giảm thiểu tác động tiêu cực lên môi trường và cư dân. Tuy nhiên, việc thực hiện các giải pháp này không phải lúc nào cũng nhanh chóng hoặc hiệu quả.

Mặt khác, khi những nguồn năng lượng trên được phân bổ cho lĩnh vực công nghệ có thể dẫn đến tình trạng thiếu năng lượng cho các nhu cầu thiết yếu như cung cấp điện dân dụng.

Bên cạnh lượng nước, ChatGPT cũng ngốn một lượng điện đáng kể. Nếu chỉ 1/10 dân số Mỹ sử dụng ChatGPT để viết một email 100 từ mỗi tuần, lượng điện tiêu thụ sẽ tương đương với toàn bộ hộ gia đình ở thủ đô Washington (Mỹ) trong 20 ngày.

Không chỉ riêng ChatGPT, các mô hình AI khác như Llama 3.1 của Meta hay siêu máy tính của AI cũng đòi hỏi lượng nước và điện khổng lồ để huấn luyện và vận hành.

Cũng đã có báo cáo về việc AI tạo sinh có thể khiến lượng khí thải carbon phát ra môi trường tăng gấp ba lần, nguyên nhân cũng chính từ các trung tâm dữ liệu. Báo cáo của Morgan Stanley dự đoán ngành công nghiệp trung tâm dữ liệu có thể thải ra tới 2,5 tỉ tấn khí nhà kính vào năm 2030, gấp ba lần so với dự đoán nếu không có sự xuất hiện của AI tạo sinh.