Nhà sưu tầm Nguyễn Phi Dũng: Kho báo không chỉ lưu giữ quá khứ mà còn tạo dữ liệu cho tương lai

16:40, 25/06/2026

Từ một người sưu tầm báo giấy, Nguyễn Phi Dũng đang góp phần gìn giữ và đánh thức những giá trị của lịch sử báo chí Việt Nam trong thời đại số. Hành trình lưu giữ hơn 400.000 tờ báo không chỉ là câu chuyện bảo tồn di sản, mà còn mở ra khả năng xây dựng một nguồn dữ liệu quý giá phục vụ nghiên cứu, giáo dục và khai thác bằng các công nghệ mới như AI.

Trong hơn một thế kỷ phát triển của nền báo chí Việt Nam, mỗi tờ báo không chỉ mang sứ mệnh truyền tải thông tin mà còn lưu giữ những dấu ấn của lịch sử, văn hóa và đời sống xã hội qua từng thời kỳ. Hơn 400.000 tờ báo mà nhà sưu tầm Nguyễn Phi Dũng dày công lưu giữ suốt nhiều năm qua là một phần trong kho ký ức ấy.

Ngày nay, khi chuyển đổi số và trí tuệ nhân tạo đang mở ra những phương thức mới để lưu trữ, khai thác và kết nối dữ liệu, những trang báo cũ cũng đứng trước cơ hội được "sống" thêm một cuộc đời mới. Không chỉ là hiện vật lưu trữ, chúng có thể trở thành nguồn dữ liệu quý giá phục vụ nghiên cứu, giáo dục và bảo tồn di sản báo chí cho các thế hệ tương lai.

Nhân dịp kỷ niệm 101 năm Ngày Báo chí Cách mạng Việt Nam, Tạp chí Tin học và Đời sống đã có cuộc trao đổi với nhà sưu tầm Nguyễn Phi Dũng về giá trị của báo chí truyền thống, vai trò của công nghệ trong bảo tồn di sản báo chí và tiềm năng ứng dụng AI trong khai thác các kho tư liệu lịch sử.

Nhà sưu tầm Nguyễn Phi Dũng bên một ấn phẩm báo chí trong kho lưu trữ hơn 400.000 tờ báo. Ảnh NVCC

Báo giấy đang có một “cuộc đời thứ hai”

PV: Hiện nay, khi phần lớn độc giả tiếp cận thông tin qua môi trường số, thậm chí qua các nền tảng AI và mạng xã hội, ông nhìn nhận như thế nào về giá trị của báo giấy và các tư liệu báo chí truyền thống trong đời sống hiện đại?

Ông Nguyễn Phi Dũng: Dù công nghệ số, mạng xã hội và trí tuệ nhân tạo đang phát triển rất mạnh mẽ, báo giấy vẫn giữ một giá trị đặc biệt mà khó có loại hình thông tin nào thay thế hoàn toàn được. Trong hơn một thế kỷ tồn tại và phát triển của nền báo chí Việt Nam, đặc biệt là báo chí cách mạng, mỗi tờ báo không chỉ là một sản phẩm truyền thông mà còn là một chứng nhân lịch sử.

Báo giấy tuy không phải văn bản pháp lý. Nhưng những trang báo đã phản ánh một cách chân thực đời sống kinh tế, văn hóa, chính trị, xã hội của đất nước tại thời điểm chúng được phát hành. Đó là những tư liệu gốc vô cùng quý giá, giúp các thế hệ sau hiểu được bối cảnh lịch sử, tâm tư, khát vọng và những sự kiện đã diễn ra trong từng giai đoạn phát triển của dân tộc.

Thực tế cho thấy, nhiều thông tin, hình ảnh, bài viết xuất hiện trên báo giấy cách đây hàng chục năm hiện nay không còn tìm thấy trên môi trường internet. Ngay cả khi có thể tìm thấy bản sao hoặc thông tin tương tự trên mạng, độ đầy đủ, tính xác thực và độ tin cậy cũng không phải lúc nào được đảm bảo. Trong khi đó, một tờ báo giấy nguyên bản chính là bằng chứng lịch sử có giá trị đối chiếu và kiểm chứng rất cao.

Tôi cho rằng trong thời đại số, giá trị của báo giấy không hề mất đi mà đang chuyển dần từ chức năng truyền tải tin tức hằng ngày sang vai trò lưu giữ ký ức, bảo tồn di sản và cung cấp nguồn tư liệu gốc cho nghiên cứu, giáo dục, truyền thông và lịch sử. Công nghệ số và AI không thay thế báo giấy mà mà giúp bảo tồn, số hóa và khai thác hiệu quả hơn những giá trị được tích lũy suốt hơn một thế kỷ qua.

Chính vì vậy, việc sưu tầm, bảo quản và số hóa các tư liệu báo chí truyền thống không chỉ là gìn giữ những tờ báo cũ, mà còn là gìn giữ một phần ký ức và lịch sử của đất nước cho các thế hệ mai sau.

PV: Sau nhiều năm sưu tầm và tiếp xúc với hàng trăm nghìn tờ báo thuộc nhiều giai đoạn lịch sử khác nhau, theo ông, điều gì làm nên giá trị bền vững của báo chí, dù công nghệ làm báo đã thay đổi rất nhiều?

Ông Nguyễn Phi Dũng: Theo tôi, điều làm nên giá trị bền vững của báo chí không nằm ở giấy in hay công nghệ truyền tải thông tin, mà nằm ở nội dung chân thực, tính nhân văn và trách nhiệm xã hội của người làm báo.

Trong mỗi giai đoạn lịch sử, từ thời kỳ đấu tranh giành độc lập, xây dựng đất nước đến thời kỳ đổi mới và hội nhập, báo chí luôn đồng hành cùng dân tộc, phản ánh hơi thở cuộc sống, ghi lại những sự kiện quan trọng, tôn vinh những giá trị tốt đẹp và góp phần định hướng dư luận xã hội. Chính vai trò đó đã tạo nên sức sống lâu bền của báo chí.

Khi nhìn lại những tờ báo đã xuất bản cách đây vài chục năm, thậm chí cả trăm năm, điều còn lại không phải là hình thức trình bày hay công nghệ in ấn, mà là những thông tin, câu chuyện, tư liệu và giá trị lịch sử được lưu giữ trên từng trang báo. Nhiều bài viết ngày ấy đến nay vẫn có giá trị tham khảo đối với các nhà nghiên cứu, nhà báo và bạn đọc.

Ngày nay, công nghệ số, internet và AI đã làm thay đổi mạnh mẽ cách thức sản xuất, phân phối và tiếp nhận thông tin. Tuy nhiên, dù báo chí được thể hiện trên giấy, trên màn hình máy tính hay điện thoại thông minh, thì những giá trị cốt lõi như tính chính xác, tính trung thực, tính khách quan và trách nhiệm với xã hội vẫn luôn là nền tảng quyết định uy tín của một cơ quan báo chí cũng như một tác phẩm báo chí.

Công nghệ có thể thay đổi phương thức làm báo, nhưng không thể thay thế được bản lĩnh, đạo đức nghề nghiệp và trách nhiệm của người làm báo. Đó chính là những yếu tố tạo nên giá trị bền vững của báo chí qua mọi thời đại.

Kho tư liệu báo chí đồ sộ của ông Nguyễn Phi Dũng không chỉ lưu giữ ký ức của báo chí Việt Nam qua nhiều thời kỳ mà còn là nguồn dữ liệu quý cho các hoạt động số hóa và ứng dụng trí tuệ nhân tạo. Ảnh NVCC

Từ kho lưu trữ đến kho dữ liệu

Hiện nay, ông Nguyễn Phi Dũng đang lưu giữ hơn 400.000 tờ báo với tổng trọng lượng gần 28 tấn, trong đó có nhiều đầu báo quý hiếm từ cuối thế kỷ XIX đến nay. Tuy nhiên, theo ông, bảo quản bản gốc thôi là chưa đủ nếu muốn những giá trị lịch sử ấy được lưu giữ lâu dài và tiếp cận rộng rãi hơn với cộng đồng.

PV: Vì sao ông quyết định triển khai dự án số hóa kho báo giấy và việc số hóa có ý nghĩa như thế nào đối với công tác bảo tồn di sản báo chí?

Ông Nguyễn Phi Dũng: Trong quá trình sưu tầm, tôi nhận thấy rằng dù được bảo quản cẩn thận đến đâu thì báo giấy vẫn là vật liệu hữu cơ, chịu tác động của thời gian, khí hậu, độ ẩm, côn trùng và nhiều yếu tố khách quan khác. Vì vậy, việc bảo tồn lâu dài không thể chỉ dựa vào lưu giữ bản gốc mà cần có giải pháp số hóa để tạo ra một "bản sao an toàn" cho các thế hệ mai sau.

Mục tiêu của việc số hoá không chỉ là bảo vệ nguồn tư liệu quý trước nguy cơ hư hỏng, thất lạc hoặc thiên tai, mà còn để biến kho báo từ một tài sản lưu trữ thành một nguồn dữ liệu có thể khai thác và chia sẻ rộng rãi cho cộng đồng.

Theo tôi, số hóa có ý nghĩa rất lớn đối với công tác bảo tồn di sản báo chí Việt Nam.

Thứ nhất, số hóa giúp lưu giữ nguyên vẹn nội dung của các tờ báo quý hiếm, hạn chế việc phải tiếp xúc trực tiếp với bản gốc, từ đó kéo dài tuổi thọ của hiện vật.

Thứ hai, việc xây dựng cơ sở dữ liệu số giúp tìm kiếm, tra cứu và đối chiếu thông tin nhanh chóng hơn rất nhiều so với phương pháp thủ công truyền thống.

Thứ ba, tư liệu số có thể được chia sẻ cho các nhà nghiên cứu, cơ quan báo chí, trường học, bảo tàng và những người quan tâm đến lịch sử mà không bị giới hạn bởi khoảng cách địa lý. Đặc biệt, trong bối cảnh công nghệ phát triển mạnh mẽ, kho dữ liệu báo chí được số hóa sẽ trở thành nguồn tư liệu gốc có giá trị để phục vụ nghiên cứu lịch sử, văn hóa, xã hội, đồng thời là nền tảng cho các ứng dụng công nghệ mới như trí tuệ nhân tạo, nhận dạng ký tự (OCR), phân tích dữ liệu lịch sử và xây dựng các thư viện số chuyên ngành báo chí.

Tôi cho rằng số hóa không phải là thay thế báo giấy, mà là một phương thức bảo tồn hiện đại để những giá trị được lưu giữ trên các trang báo có thể tiếp tục được khai thác, lan tỏa và phục vụ xã hội trong nhiều thập niên, thậm chí nhiều thế kỷ tới.

Khi AI có thể đọc 400.000 tờ báo


PV: Nếu trong tương lai, một hệ thống AI có thể đọc, phân tích và tra cứu toàn bộ hơn 400.000 tờ báo trong bộ sưu tập của ông, ông kỳ vọng điều gì?

Ông Nguyễn Phi Dũng: Tôi cho rằng đó sẽ là một bước tiến rất lớn đối với công tác bảo tồn và khai thác di sản báo chí Việt Nam.

Điều tôi mong muốn nhất là AI không chỉ giúp tìm kiếm thông tin nhanh hơn mà còn giúp kết nối, tổng hợp và làm nổi bật những giá trị lịch sử đang được lưu giữ trong hàng triệu trang báo. Thông qua đó, người dùng có thể dễ dàng khám phá sự phát triển của đất nước qua từng giai đoạn lịch sử, từ những năm tháng đấu tranh giành độc lập, thời kỳ kháng chiến, công cuộc đổi mới cho đến quá trình hội nhập và phát triển ngày nay.

Tôi hình dung rằng chỉ với một câu hỏi đơn giản, AI có thể giúp người dùng truy xuất hàng trăm, thậm chí hàng nghìn bài báo liên quan đến một sự kiện, một địa phương, một nhân vật hoặc một lĩnh vực cụ thể. Từ đó, người đọc có thể tiếp cận được bức tranh toàn diện hơn về lịch sử, thay vì chỉ nhìn nhận qua một nguồn tư liệu đơn lẻ.

Đối với lĩnh vực văn hóa, AI có thể giúp nhận diện và tái hiện những biến đổi trong phong tục tập quán, đời sống tinh thần, văn học nghệ thuật, giáo dục và các giá trị truyền thống của người Việt qua nhiều thế hệ. Những thay đổi trong ngôn ngữ báo chí, cách sử dụng từ ngữ, hình ảnh và cách phản ánh đời sống xã hội qua từng thời kỳ cũng sẽ trở thành nguồn tư liệu nghiên cứu vô cùng phong phú.

Đối với đời sống xã hội, AI có thể hỗ trợ phân tích các xu hướng phát triển kinh tế, đô thị hóa, khoa học công nghệ, đời sống dân sinh và những vấn đề xã hội được quan tâm trong từng giai đoạn lịch sử. Điều này sẽ giúp các nhà nghiên cứu, nhà báo, nhà giáo dục và cả thế hệ trẻ hiểu rõ hơn hành trình phát triển của đất nước.

Tuy nhiên, điều tôi kỳ vọng lớn nhất không phải là khả năng xử lý dữ liệu của AI, mà là việc công nghệ có thể đưa những giá trị đang nằm yên trong kho lưu trữ đến gần hơn với cộng đồng. Khi đó, mỗi tờ báo sẽ không chỉ là một hiện vật được cất giữ trên giá kệ, mà trở thành một phần sống động của ký ức dân tộc, góp phần giáo dục truyền thống, lan tỏa tri thức và truyền cảm hứng cho các thế hệ tương lai.

Tôi tin rằng khi kết hợp giữa nguồn tư liệu báo chí gốc và sức mạnh của trí tuệ nhân tạo, chúng ta sẽ có cơ hội kể lại câu chuyện hơn một thế kỷ phát triển của đất nước bằng một cách thức hoàn toàn mới, sinh động hơn, sâu sắc hơn và dễ tiếp cận hơn đối với mọi người.

PV: Theo ông, đâu là vai trò của AI và đâu là những giá trị con người không thể thay thế?

Ông Nguyễn Phi Dũng: AI và các công nghệ mới đang mở ra những cơ hội rất lớn cho công tác bảo tồn và khai thác các kho tư liệu báo chí. Với những bộ sưu tập có quy mô lớn như kho báo của tôi, gồm hơn 400.000 tờ báo từ nhiều giai đoạn lịch sử khác nhau, nếu chỉ thực hiện bằng phương pháp thủ công thì sẽ cần rất nhiều thời gian, nhân lực và kinh phí. AI có thể hỗ trợ ở nhiều khâu khác nhau.

Trước hết là nhận dạng ký tự (OCR), giúp chuyển đổi nội dung từ báo giấy thành dữ liệu số có thể tìm kiếm và tra cứu. Tiếp đó, AI có thể tự động phân loại theo thời gian, chủ đề, nhân vật, địa danh hoặc sự kiện; hỗ trợ phát hiện các tư liệu liên quan giữa những tờ báo được xuất bản cách nhau hàng chục năm.

Công nghệ cũng có thể phục hồi hình ảnh bị mờ, nâng cao chất lượng dữ liệu số và hỗ trợ dịch thuật, tóm tắt hoặc phân tích khối lượng thông tin rất lớn trong thời gian ngắn. Đối với người sử dụng, AI có thể giúp việc khai thác tư liệu trở nên thuận tiện hơn rất nhiều.

Thay vì phải mất nhiều ngày hoặc nhiều tuần tìm kiếm thủ công, người dùng chỉ cần đặt câu hỏi và hệ thống có thể nhanh chóng tìm ra những bài báo, sự kiện hoặc tư liệu liên quan từ hàng triệu trang dữ liệu đã được số hóa.

Tuy nhiên, dù công nghệ phát triển đến đâu, tôi cho rằng vẫn có những giá trị mà con người không thể thay thế. Trước hết là việc nhận diện giá trị lịch sử của tư liệu. AI có thể đọc và xử lý dữ liệu, nhưng để hiểu được ý nghĩa của một tờ báo trong bối cảnh lịch sử cụ thể, để đánh giá tầm quan trọng của một sự kiện hay để lựa chọn những tài liệu cần được ưu tiên bảo tồn, vẫn cần đến kiến thức, kinh nghiệm và góc nhìn của con người.

Bên cạnh đó, niềm đam mê, trách nhiệm và tình yêu đối với di sản cũng là điều máy móc không thể có. Chính những người sưu tầm, những nhà nghiên cứu, nhà báo, cán bộ lưu trữ và những người làm công tác bảo tồn mới là những người quyết định điều gì cần được gìn giữ cho tương lai. AI có thể là một công cụ rất mạnh, nhưng công cụ chỉ thực sự phát huy giá trị khi được định hướng bởi con người.

Vì vậy, tôi cho rằng tương lai của công tác bảo tồn tư liệu báo chí không phải là sự thay thế giữa con người và AI, mà là sự kết hợp hài hòa giữa hai bên. Con người cung cấp tri thức, tầm nhìn và trách nhiệm; còn AI hỗ trợ xử lý, lưu trữ và khai thác dữ liệu ở quy mô lớn. Khi đó, những giá trị quý báu của hơn một thế kỷ báo chí Việt Nam sẽ có cơ hội được bảo tồn và lan tỏa hiệu quả hơn đến cộng đồng.

Giữ ngọn lửa nghề trong thời đại AI


PV: Qua hành trình nhiều năm sưu tầm và lưu giữ hơn 400.000 tờ báo, ông nhìn nhận như thế nào về những giá trị mà báo chí Việt Nam cần tiếp tục gìn giữ trong thời đại chuyển đổi số và trí tuệ nhân tạo?

Ông Nguyễn Phi Dũng: Nhân dịp kỷ niệm 101 năm Ngày Báo chí Cách mạng Việt Nam (21/6/1925 - 21/6/2026), với tư cách là một người yêu báo, sưu tầm và lưu giữ báo chí nhiều năm, tôi xin gửi tới những người đang làm báo hôm nay sự trân trọng, tin tưởng và những lời chúc tốt đẹp nhất.

Các bạn đang sống và làm nghề trong một giai đoạn đặc biệt, khi công nghệ số, internet và AI đang làm thay đổi sâu sắc cách thức sản xuất, truyền tải và tiếp nhận thông tin. Đây vừa là cơ hội rất lớn, vừa là thách thức không nhỏ đối với nghề báo.

Tôi mong rằng người làm báo sẽ chủ động tiếp cận và làm chủ công nghệ mới, coi AI và các nền tảng số là những công cụ hỗ trợ đắc lực để nâng cao hiệu quả tác nghiệp, mở rộng khả năng tiếp cận thông tin và phục vụ bạn đọc tốt hơn. Tuy nhiên, dù công nghệ có phát triển đến đâu thì giá trị cốt lõi của báo chí vẫn phải được đặt lên hàng đầu, đó là tính trung thực, khách quan, chính xác và trách nhiệm đối với xã hội.

Qua hàng trăm nghìn tờ báo mà tôi đang lưu giữ, tôi nhận thấy rằng điều làm nên giá trị trường tồn của một tác phẩm báo chí không phải là công nghệ sử dụng để tạo ra nó, mà là sự thật được phản ánh, là tinh thần phụng sự Tổ quốc, phục vụ nhân dân và là dấu ấn của người làm báo đối với thời đại của mình.

Báo chí Việt Nam đã trải qua hơn một thế kỷ đồng hành cùng đất nước. Tôi tin rằng với bản lĩnh nghề nghiệp, đạo đức người làm báo và sự hỗ trợ của công nghệ hiện đại, thế hệ nhà báo hôm nay sẽ tiếp tục viết nên những trang sử mới, góp phần xây dựng nền báo chí chuyên nghiệp, nhân văn, hiện đại và giàu bản sắc dân tộc.

Xin trân trọng cảm ơn ông!