Chiến lược dữ liệu mở trong chuyển đổi số của chính phủ

14:08, 04/03/2021

Chuyển đổi số được dẫn dắt bởi dữ liệu mở

Xây dựng chính phủ điện tử được hiểu là quá trình ứng dụng công nghệ thông tin để tin học hóa câc quy trình hiện tại của chính phủ. Chuyển đổi số sẽ là một bước phát triển cao hơn của chính phủ điện tử để hình thành nền chính phủ số. Nó được thể hiện thông qua sự đổi mới, tối ưu hóa các quy trình nhờ việc khai thác sự sẵn có của các nguồn dữ liệu số. 

Trong các tổ chức, dữ liệu luôn đóng vai trò dẫn dắt quá trình chuyển đổi số. Nó có thể tác động tới 3 trụ cột chính của tổ chức là: (i) mang lại các trải nghiệm mới cho khách hàng, (ii) cải tổ hiệu quả quy trình vận hành, (iii) đỏi mới mô hình kinh doanh để mang tới các giá trị khác biệt.

Nếu như trước đây, số lượng dịch vụ công trực tuyến là một chỉ số chính dùng để đánh giá mức độ phát triển của chính phủ điện tử. Chỉ số này thể hiện sự sẵn sàng của các quy trình dịch vụ công được tin học hóa để mang lại sự thuận tiện cho người dân. Trong chính phủ số, chỉ số đánh giá quan trọng nhất sẽ phải là mức độ sẵn sàng và khả năng sử dụng hiệu quả của các nguồn dữ liệu để mang lại trải nghiệm mới cho người dân và sự kiến tạo của chính phủ trong quản trị đất nước.

Dữ liệu trước đây thường chỉ được sử dụng khép kín trong một hệ thống thông tin để phục vụ cho một tổ chức sở hữu nó. Do vậy giá trị tiềm năng của dữ liệu không được khai thác một cách tối đa. Chỉ khi nó được chia sẻ, mở cho nhiều đối tượng sử dụng thì giá trị sẽ được nhân lên và tạo ra nhiều cơ hội để kết hợp tạo ra các giá trị mới.

Tại khu vực công, dữ liệu mở mang lại rất nhiều lợi ích. Ở góc độ chính trị, dữ liệu mở làm gia tăng sự minh bạch và trách nhiệm giải trình của các cơ quan nhà nước; thúc đẩy nhận thức chính trị, khả năng tiếp cận thông tin và sự tham gia của người dân. Về mặt xã hội, dữ liệu mở có thể giúp tăng cường sự hòa nhập xã hội và hỗ trợ khả năng ra quyết định của các cá nhân. Việc sử dụng lại dữ liệu mở cũng mang lại lợi ích kinh tế. Dữ liệu mở có tiềm năng sáng tạo để tạo ra việc làm, hàng hóa và dịch vụ mới trong nền kinh tế số.

Từ các lợi ích trên, dữ liệu trong chính phủ số sẽ được xây dựng và duy trì trên các nguyên tắc cơ bản là: mở phải được coi là mặc định, bảo đảm sự sẵn sàng cho tất cả mọi đối tượng tiếp cận sử dụng; được duy trì đầy đủ về số lượng, được làm sạch và có chất lượng chính xác về thông tin; mở để tạo ra sự minh bạch và thúc đẩy kiến tạo.

Bộ Thông tin và Truyền thông (tổ chức "Lễ ra mắt Nền tảng phát triển Chính phủ số Flex Digital"

Quá trình chuyển đổi số sẽ tạo ra một hệ sinh thái dữ liệu mở. Nó sẽ bao gồm nhiều đơn vị cùng tham gia vào chuỗi giá trị của dữ liệu gồm: thu thập/tạo dữ liệu, tổng hợp dữ liệu, phân tích dữ liệu, và cung cấp dịch vụ-sản phẩm tới người dùng đầu cuối. Mỗi một đơn vị có thể đóng góp vào một hoặc nhiều công đoạn tạo ra giá trị của dữ liệu. Như vậy lúc này chính phủ sẽ chỉ đóng vai trò như là một nền tảng, thực hiện kết nối các tổ chức, doanh nghiệp cùng tham gia vào trong chuỗi giá trị của hệ sinh thái dữ liệu mở.

Xu thế công nghệ của dữ liệu mở và triển khai ứng dụng

Cách tiếp cận tổ chức, xây dựng các cơ sở dữ liệu trong chính phủ số sẽ có sự khác biệt với cách làm của chính phủ điện tử. Thay vì chú trọng vào phát triển các hệ thống ứng dụng rời rạc thì xây dựng một cơ sở hạ tầng dữ liệu mở sẽ phải là ưu tiên hàng đầu. Cơ sở hạ tầng dữ liệu này phải có khả năng tạo ra một hệ sinh thái mở. Do đó nó phải xây dựng trên cơ sở bảo đảm 4 yêu cầu: (i) có đầy đủ tính pháp lí, (ii) được chia sẻ dùng chung cho nhiều tổ chức, (iii) thống nhất về ngữ nghĩa của dữ liệu trong khai thác, (iv) và có sự liên thông về công nghệ sử dụng giữa các hệ thống.

Từ các yêu cầu đặt ra, bộ quy tắc FAIR (Findable-Accessible-Interoperable-Reusable) sẽ được áp dụng vào việc xây dựng các cơ sở dữ liệu để cung cấp dữ liệu mở. Nó quy định dữ liệu tạo ra phải có thể dễ dàng tìm thấy, truy cập, tương hợp và tái sử dụng. Để có thể dễ dàng tìm thấy, dữ liệu mở cần phải được phân loại, đánh chỉ mục bằng siêu dữ liệu để phục vụ tìm kiếm trên các cổng dữ liệu. Từ kết quả tìm kiếm trên cổng dữ liệu, người dùng có thể tiếp tục truy cập dữ liệu theo nhiều hình thức khác nhau qua internet như qua trang web dùng giao thức HTTP, trên máy chủ FTP, trên mạng ngang hàng (P2P) hoặc dùng dịch vụ API để khai thác. Để bảo đảm tính pháp lí về quyền tự do tái sử dụng, được tái tạo và phân phối, dữ liệu mở sẽ phải được gắn với một loại giấy cấp phép có các quy định phù hợp (vd., CC-BY, ODbL,...).

Dữ liệu mở phải bảo đảm tính tương hợp tức là được biểu diễn bằng một định dạng mở và máy có thể đọc hiểu. Theo Tim Berners-Lee, có 5 mức độ thể hiện sự phát triển của dữ liệu mở. Dữ liệu mở liên kết (Linked Open Data) là định dạng được sử dụng ở mức độ phát triển cao nhất (5 sao). Đây là định dạng có nguồn gốc từ web ngữ nghĩa cho phép định danh dữ liệu bằng URI và biểu diễn ngữ nghĩa của dữ liệu bởi các bộ từ vựng được định nghĩa theo ontology.

Ảnh: minh họa

Sự khác biệt lớn nhất của dữ liệu mở liên kết là khả năng máy có thể đọc hiểu và xử lí tự động ngữ nghĩa của dữ liệu. Từ đó nó cho phép máy tính có thể tự động tích hợp nhiều nguồn dữ liệu thành một cơ sở dữ liệu mà không cần phải thực hiện chuyển đổi, làm sạch. Hơn nữa máy tính có thể kiểm tra được tính nhất quán về ngữ nghĩa của dữ liệu khi thu thập từ nhiều nguồn khác nhau. Để có dữ liệu mở liên kết, tư duy xây dựng các hệ thống thống thông tin sẽ phải dựa trên định hướng sử dụng ontology. Nó là tiền đề hướng tới sự hình thành các hệ cơ sở tri thức cho phép thực hiện tìm kiếm thông tin nhờ vào sự suy diễn. Đây chính là mấu chốt làm cho chính phủ số có thể trở nên thông minh hơn so với chính phủ điện tử.

Một ứng dụng phổ biến nhất hiện nay của định dạng dữ liệu mở liên kết là được sử dụng để biểu diễn thông tin có cấu trúc trên các trang web. Ngoài phần dữ liệu được định dạng bằng html, trang web còn được nhúng thêm phần dữ liệu có biểu diễn bằng định dạng json-ld. Nhờ đó các máy tìm kiếm như Google có thể đọc hiểu, phân tích ngữ nghĩa của thông tin đi kèm với nội dung trình bày trên trang web. Bộ từ vựng được định nghĩa tại schema.org được dùng như lược đồ dữ liệu thống nhất để biểu diễn thông tin trên tất cả các trang web. Chính vì vậy mà ngày nay các máy tìm kiếm đang ngày càng trở nên thông minh hơn. Nó có thể trả lời trực tiếp các thông tin mà người dùng có nhu cầu tìm kiếm (vd., thông tin về thủ đô của một quốc gia). Tất cả các thông tin trả lời cho kết quả tìm kiếm đều được trích xuất tự động từ các nội dung xuất bản trên web.

Tổng kết lại sự hiện diện của các bộ dữ liệu mở có thể được coi là một chỉ số đánh giá quan trọng cho mức độ sẵn sàng chuyển đổi số của chính phủ. Cổng dữ liệu mở đã được phát triển và ứng dụng ở rất nhiều nước trên thế giới. Tại Việt Nam cổng dữ liệu mở cũng bắt đầu được hình thành ở một địa phương (TP. Hồ Chí Minh, Đà Nẵng) và của quốc gia (https://open.data.gov.vn/). Tuy nhiên số lượng bộ dữ liệu mở được cung cấp còn ở mức rất khiêm tốn và không đầy đủ trong các lĩnh vực quản lý của nhà nước. Thậm chí vẫn còn có sự lẫn lộn giữa việc cung cấp tư liệu mở với dữ liệu mở.

Quản lý kết nối và chia sẻ dữ liệu số của các cơ quan nhà nước đã được cụ thể hóa bằng các quy định tại Nghị định số 47/2020/NĐ-CP của Chính phủ. Trong đó có một chương đề cập đến chính sách đối với dữ liệu mở. Đây là một hành lang pháp lí quan trọng để triển khai thực hiện chiến lược dữ liệu mở trong chuyển đổi số chính phủ. Về mặt kĩ thuật, chúng ta cần áp dụng ngay xu thế công nghệ dữ liệu mở liên kết trong xây dựng các hệ thống cơ sở dữ liệu. Nó sẽ mang lại rất nhiều hiệu quả, tiết kiệm được nhiều công sức, chi phí cần thiết để thực hiện việc tích hợp dữ liệu.

Ngày 4-12-2020, Bộ Thông tin và Truyền thông (TT-TT) đã tổ chức "Lễ ra mắt Nền tảng phát triển Chính phủ số Flex Digital" trong chuỗi sự kiện giới thiệu các nền tảng số Make in Vietnam. Flex Digital là một trong những nền tảng quan trọng theo định hướng tập trung triển khai phát triển chính phủ số dựa trên công nghệ mở.

Ưu điểm của nền tảng là tái sử dụng được các chuẩn công nghiệp phù hợp với xu thế phát triển công nghệ hiện có trên thế giới, trong đó có công nghệ về dữ liệu mở. Nền tảng FlexDigital cho phép đáp ứng được cách tiếp cận mới trong xây dựng cơ sở hạ tầng dữ liệu mở của chính phủ số. Đồng thời chính phủ có thể làm chủ được hoàn toàn về công nghệ, giảm được giá thành sản xuất và tạo nền tảng cho sự phát triển bền vững ở Việt Nam.

TS. Tạ Tuấn Anh