AI và bài toán dữ liệu định dạng chuẩn trong chính phủ số
Không có dữ liệu chuẩn hóa và quy trình đồng bộ, AI chỉ là công cụ vô dụng trong bộ máy công quyền. Muốn triển khai chính phủ số thực chất, phải bắt đầu từ dữ liệu sạch.
Công nghệ trí tuệ nhân tạo (AI) đang trở thành trụ cột mới trong chiến lược chuyển đổi số của Việt Nam. Nhiều cơ quan nhà nước đã bắt đầu triển khai các ứng dụng AI thử nghiệm – từ chatbot hành chính đến hệ thống phân tích văn bản tự động. Tuy nhiên, theo đánh giá của giới chuyên gia, hiệu quả thực tế còn rất hạn chế. Lý do không nằm ở công nghệ, mà ở nền tảng dữ liệu và thể chế đi kèm.
AI chỉ có thể phát huy năng lực khi được huấn luyện trên khối dữ liệu đủ lớn, có định dạng thống nhất và có quy luật vận hành rõ ràng. Nhưng trong nhiều bộ, ngành và địa phương, dữ liệu hành chính hiện đang tồn tại ở các dạng rời rạc, không kết nối, không có chuẩn đầu vào. Có những đơn vị còn lưu dữ liệu trên bảng tính Excel, dùng hệ mã nội bộ, thậm chí không phân quyền truy cập rõ ràng.
Điều này dẫn đến hai hậu quả lớn: (1) AI không thể phân tích, vì không hiểu cấu trúc dữ liệu, và (2) không thể chia sẻ giữa các cơ quan, khiến hệ thống bị chia cắt – đi ngược hoàn toàn tinh thần chính phủ số.
Muốn khắc phục tình trạng này, Việt Nam cần thực hiện đồng thời ba giải pháp căn cơ:
1. Chuẩn hóa định dạng dữ liệu từ cấp xã đến cấp bộ.
Tất cả hệ thống dữ liệu hành chính – từ hộ tịch, giáo dục, y tế đến đất đai – phải tuân theo một hệ thống mã dùng chung, có quy chuẩn về kiểu dữ liệu, đơn vị đo, định danh. Đây là bước cần thiết để mọi công cụ AI đều “đọc được” và “hiểu được” dữ liệu.
2. Thiết lập kho dữ liệu dùng chung quốc gia theo nguyên tắc mở có kiểm soát.
Không thể để mỗi bộ ngành xây hệ thống riêng, dẫn tới lãng phí và xung đột giao thức. Dữ liệu cần được kết nối theo cơ chế trung tâm – vệ tinh, trong đó mỗi địa phương vừa là nguồn cấp dữ liệu, vừa được quyền truy cập, nhưng tất cả phải tuân thủ một cơ chế kiểm duyệt bảo mật thống nhất.
3. Tăng đầu tư cho hạ tầng dữ liệu, thay vì chỉ đầu tư phần mềm AI.
Hiện nhiều đơn vị đổ tiền cho phần mềm, nhưng lại dùng dữ liệu lỗi thời, thiếu cập nhật, dẫn đến hệ thống chạy sai, phản tác dụng. Đầu tư đúng phải bắt đầu từ khâu thu thập, làm sạch và gắn thẻ dữ liệu – giống như xây nhà từ nền móng, chứ không thể trang trí mái trước.
AI không phải chiếc đũa thần. Nếu không có dữ liệu chuẩn, AI chỉ là công cụ giả vờ thông minh. Một chính phủ số thực chất phải bắt đầu từ hệ sinh thái dữ liệu: rõ ràng, chuẩn hóa và chia sẻ có trách nhiệm.