Báo chí Việt Nam chuyển mình với báo chí dữ liệu
Báo chí dữ liệu (data journalism) là việc sử dụng dữ liệu (số liệu, bảng biểu, thống kê, dữ liệu mở, API…) để phân tích, kể chuyện, minh họa bằng đồ họa, bản đồ, biểu đồ, tương tác… Hình thức này thường đòi hỏi kỹ năng xử lý dữ liệu, trực quan hóa và hiểu độc giả.
Khai thác dữ liệu để sáng tạo nội dung báo chí
Tại Việt Nam, nhiều cơ quan báo chí đã ứng dụng báo chí dữ liệu vào thực tiễn. VnExpress là tờ báo điển hành trong việc sử dụng dữ liệu trong tòa soạn. Ví dụ: phân loại dữ liệu thành nhiều nhóm (độc giả, hành vi, bài viết, quảng cáo, phản hồi) và sử dụng 3 hệ thống lõi để quản lý nội dung, độc giả, quảng cáo.
VnExpress ngay từ khi thành lập đã xác định vai trò không thể tách rời, có tính chất quyết định của công nghệ trong hoạt động đặc thù của loại hình báo chí điện tử. Việc áp dụng công nghệ phân tích dữ liệu, ngữ cảnh và máy học đã giúp tối ưu hóa nhân lực, tăng tốc độ xuất bản nội dung, cung cấp thông tin đầy đủ, chính xác, kịp thời, trực quan... hơn cho độc giả.
Theo đó, VnExpress xác định rõ data (nguồn dữ liệu) chính là "kho dầu thô" quý giá cần khai thác triệt để, nhằm đáp ứng nhu cầu thông tin ngày càng cao của độc giả trong thời đại chuyển đổi số.
Nói về hành trình của tòa soạn trong việc biến dữ liệu từ những con số thuần túy thành công cụ chiến lược, tại Diễn đàn Báo chí toàn quốc 2025, bà Nguyễn Thu Hương, Phó Tổng Biên tập Báo VnExpress cho biết, từ việc thống kê lượt truy cập ban đầu, đơn vị xây dựng dữ liệu để tạo nền tảng giải quyết 2 mục tiêu chính: phát triển độc giả và tăng trưởng doanh thu. Hiện nay, VnExpress sử dụng 5 loại dữ liệu (độc giả, hành vi, quảng cáo, bài viết, phản hồi) và 3 hệ thống (nội dung, độc giả, quảng cáo) để phân tích và hiểu sâu sắc độc giả. Cách làm này giúp quá trình điều phối sản xuất linh hoạt, khai thác tốt hơn chủ đề độc giả quan tâm, đồng thời tối ưu hiệu quả quảng cáo…
Bà Nguyễn Thu Hương cũng nhấn mạnh, dữ liệu không phải là “đũa thần”, sử dụng dữ liệu hiệu quả đòi hỏi phải thực hành liên tục, kiên trì, chấp nhận sai và sửa sai.
Báo Tuổi trẻ là một trong những tờ báo tiên phong ứng dụng báo chí dữ liệu. Tuổi Trẻ đã đầu tư mạnh vào nguồn nhân lực, đội ngũ kỹ sư công nghệ và hoàn thiện tòa soạn số. Hệ thống IMS của báo được tích hợp nhiều tính năng, hỗ trợ khai thác báo chí dữ liệu, trực quan hóa số liệu và truy vấn thông tin.
Ông Đặng Anh Tuấn, Phó Tổng thư ký toà soạn, Giám đốc Trung tâm Phát triển nội dung số Báo Tuổi Trẻ cho biết: "Đội ngũ kỹ sư công nghệ liên tục nghiên cứu và cập nhật các tính năng mới trong việc phân tích số liệu, ứng dụng trí tuệ nhân tạo để giảm thiểu quá trình truy vấn".
Minh chứng cho hiệu quả của việc ứng dụng báo chí dữ liệu là loạt bài "Xe Thành Bưởi vượt tốc độ đến 30.000 lần chỉ trong 3 tháng". Bằng việc thu thập và giải mã dữ liệu giám sát hành trình, phóng viên Tuổi Trẻ đã đưa ra những con số thuyết phục về số lần vi phạm tốc độ của hãng xe Thành Bưởi.
"Những số liệu trực quan, những biểu đồ chi tiết, hấp dẫn đã thuyết phục, tạo niềm tin cho bạn đọc", ông Đặng Anh Tuấn chia sẻ.
Báo chí dữ liệu được độc giả Tuổi Trẻ hưởng ứng và đánh giá cao, để lại nhiều tương tác tốt, cách phản biện cho những vấn đề bài báo nêu cũng chính xác, trực quan, đi thẳng vào vấn đề…
"Sự phân tích và trực quan hóa dữ liệu để tạo ra những bài viết có tính chuyên sâu, khách quan và dễ hiểu là rất cần thiết đối với báo chí hiện nay. Những bài báo dựa trên số liệu cụ thể, bằng chứng thuyết phục sẽ giúp nâng cao tính chính xác và khách quan, giảm thiểu sai sót và cung cấp thông tin chính xác hơn cho độc giả. Có thể nói, báo chí dữ liệu tạo lợi thế cạnh tranh cho báo chí số trong bối cảnh báo chí truyền thống gặp nhiều khó khăn. Báo chí dữ liệu giúp các tờ báo tạo ra nội dung độc đáo, thu hút nhiều người bằng các bài viết chuyên sâu", ông Đặng Anh Tuấn khẳng định.
Trong khi đó, Báo Nghệ An đã khẳng định vị thế tiên phong trong việc ứng dụng loại hình báo chí dữ liệu. Minh chứng là giải thưởng "Cơ quan báo chí có sản phẩm truyền thông sáng tạo về xây dựng Đảng và tác phẩm chuyên đề xuất sắc" tại Giải Búa liềm vàng 2024. Ông Ngô Đức Kiên, Tổng biên tập Báo Nghệ An nhận định: "Không thể đứng ngoài cuộc, phải trở thành người trong cuộc của báo chí dữ liệu".
Để thực hiện thành công các dự án báo chí dữ liệu, ông Ngô Đức Kiên cho biết, việc hợp tác với đối tác công nghệ giỏi và đối tác nội dung bảo đảm tính chính xác là hai yếu tố then chốt.
Ông Ngô Đức Kiên chia sẻ: "Chúng tôi không chỉ tìm kiếm những đối tác có năng lực kỹ thuật, mà còn phải là những người có cùng tâm huyết, cùng chí hướng, cùng khát vọng gìn giữ và lan tỏa những giá trị lịch sử, văn hóa của quê hương".
Có thể tổng hợp một số ví dụ về cách các tòa soạn đang dùng báo chí dữ liệu:
Biểu đồ, bản đồ, đồ họa để trực quan hóa thông tin, ví dụ trong thời kỳ COVID-19, việc tiêm chủng, ca bệnh…
Cá nhân hóa nội dung và quảng cáo dựa trên hành vi, dữ liệu độc giả; điều phối sản xuất bài viết dựa vào dữ liệu để biết chủ đề nào độc giả quan tâm nhiều hơn.
Hệ thống quản trị dữ liệu trong tòa soạn để theo dõi lượt xem, tương tác, phản hồi, phân tích thị hiếu người đọc.
Cơ sở tra cứu tư liệu và kho dữ liệu. Báo Thanh Niên có “thông tin tư liệu” cho người đọc tra cứu chuyên đề, nhân vật,... thongtintulieu.thanhnien.vn.
Một số xu hướng cần quan tâm
Báo chí dữ liệu sẽ trở nên phổ biến hơn, đi cùng với báo chí đa nền tảng, nội dung chuyên sâu, cá nhân hóa.
Các cơ quan báo chí ứng dụng trí tuệ nhân tạo, học máy (machine learning) có thể hỗ trợ thu thập, phân tích dữ liệu, dự báo, cá nhân hoá nội dung. Cùng với đó, các cơ quan báo chí, các cơ quan nhà nước, tổ chức cung cấp dữ liệu mở có thể phối hợp để có dữ liệu tốt hơn, minh bạch hơn.
Các cơ quan báo chí cũng cần đào tạo chuyên môn cho nhà báo dữ liệu, đặc biệt là về kỹ năng xử lý dữ liệu, phân tích, trực quan hóa, kể chuyện bằng dữ liệu.
Bên cạnh đó, quy định, chính sách liên quan đến quyền riêng tư, bảo mật dữ liệu cần được quan tâm hơn để tránh lạm dụng dữ liệu./.

