Phát hiện hàng nghìn nghiên cứu y khoa chứa tài liệu tham khảo giả
Một cuộc nghiên cứu do Đại học Columbia thực hiện được công bố mới đây đã gây sốc khi phát hiện gần 3.000 bài báo y khoa chứa tài liệu tham khảo giả. Kết quả nghiên cứu đang làm dấy lên lo ngại nghiêm trọng về độ tin cậy của nghiên cứu khoa học trong thời đại AI phát triển bùng nổ.
Một báo cáo khoa học gây chấn động vừa công bố trên tạp chí y khoa danh tiếng The Lancet cho thấy hàng nghìn nghiên cứu y sinh đã sử dụng các tài liệu tham khảo không hề tồn tại, trong bối cảnh trí tuệ nhân tạo (AI) ngày càng được sử dụng phổ biến trong hoạt động học thuật.

Kết quả nghiên cứu làm dấy lên nhiều tranh cãi về sự lạm dụng AI trong các bài báo khoa học. Ảnh: Pressmaster / iStock
Nghiên cứu do nhóm chuyên gia tại Columbia University School of Nursing thực hiện, sử dụng hệ thống kiểm tra tự động có hỗ trợ AI để rà soát khoảng 2,5 triệu bài báo y sinh được công bố từ ngày 1/1/2023 đến 18/2/2026 trong kho dữ liệu PubMed Central Open Access.
Kết quả cho thấy, trong tổng số 97,1 triệu tài liệu tham khảo đã được xác minh, có tới 4.046 trích dẫn giả xuất hiện trong 2.810 bài báo khoa học đã qua phản biện.
Đáng chú ý, tỷ lệ xuất hiện tài liệu tham khảo giả đã tăng hơn 12 lần chỉ sau ba năm. Nếu năm 2023 chỉ khoảng 1/2.828 bài báo chứa ít nhất một tài liệu tham khảo giả, thì đến năm 2025 con số này đã tăng lên 1/458 bài, và trong những tuần đầu năm 2026 là 1/277 bài.
Theo nhóm nghiên cứu, sự gia tăng mạnh bắt đầu từ giữa năm 2024, trùng với thời điểm các công cụ AI tạo sinh và mô hình ngôn ngữ lớn (LLM) được sử dụng rộng rãi trong hoạt động viết học thuật.
Tiến sĩ Maxim Topaz, trưởng nhóm nghiên cứu, cảnh báo phát hiện này có thể gây tác động trực tiếp đến bệnh nhân và hệ thống y tế.
Ông cho biết các bác sĩ và nhóm xây dựng hướng dẫn điều trị gần như không có cách nào nhận biết rằng những bằng chứng họ đang dựa vào thực chất không tồn tại.
“Một bài báo mà chúng tôi kiểm tra có tới 18 trong số 30 tài liệu tham khảo là giả. Nghiêm trọng hơn, một số trích dẫn giả này đã tiếp tục được các nghiên cứu khác dẫn lại và xuất hiện trong các tổng quan hệ thống phục vụ điều trị lâm sàng”, ông nói.
Nhóm nghiên cứu cho biết nhiều tài liệu tham khảo giả được tạo ra rất tinh vi, có tiêu đề nghe hợp lý, đúng định dạng học thuật, gắn tên các nhà khoa học có thật và có năm công bố hoàn toàn thuyết phục.
Một trường hợp điển hình là bài nghiên cứu năm 2025 về kỹ thuật phẫu thuật tiết niệu đăng trên một tạp chí ung thư truy cập mở. Trong số 30 tài liệu tham khảo của bài báo này, có tới 60% là bịa đặt hoàn toàn.

AI có thể trở thành trợ lý đắc lực cho các nhà khoa học nhưng không nên bị lạm dụng. Ảnh: Internet
Các chuyên gia nhận định hiện tượng này có thể xuất phát từ ba nguyên nhân chính gồm hoạt động của “nhà máy sản xuất bài báo khoa học”, hành vi gian lận học thuật có chủ đích và đặc biệt là việc lạm dụng AI trong viết nghiên cứu.
Theo nghiên cứu, các mô hình ngôn ngữ lớn thường có xu hướng tạo ra các tài liệu tham khảo “nghe có vẻ đúng” nhưng thực tế không tồn tại. Một số nghiên cứu trước đây từng ước tính khoảng 30-69% tài liệu tham khảo do AI tạo ra trong lĩnh vực y sinh là giả.
Điều đáng lo ngại là các tài liệu tham khảo giả rất khó bị phát hiện trong quá trình phản biện truyền thống. Nhóm nghiên cứu cho biết việc xác minh tài liệu tham khảo hiện chưa phải quy trình bắt buộc trong nhiều tạp chí khoa học.
Các bài tổng quan khoa học được xác định có tỷ lệ chứa tài liệu tham khảo giả cao hơn 57% so với các loại bài nghiên cứu khác. Đây là điều đặc biệt nguy hiểm vì các bài tổng quan thường được sử dụng để xây dựng hướng dẫn điều trị và chính sách y tế.
Báo cáo cũng phát hiện dấu hiệu liên quan đến các “nhà máy sản xuất bài báo khoa học”, những tổ chức thương mại chuyên sản xuất bài báo chất lượng thấp hoặc gian lận để bán cho giới nghiên cứu.
Trong một trường hợp, cùng hai tác giả xuất hiện liên tiếp trong 11 bài báo đăng trên một tạp chí phẫu thuật năm 2025, với hàng loạt tài liệu tham khảo giả liên quan đến công nghệ CRISPR, vaccine nano tích hợp AI và dấu ấn sinh học hệ vi sinh đường ruột.
Nhóm nghiên cứu kêu gọi các nhà xuất bản khoa học nhanh chóng áp dụng hệ thống kiểm tra tự động đối với tài liệu tham khảo trước khi bài báo được phản biện và công bố.
Các tác giả cũng đề xuất những cơ sở dữ liệu khoa học lớn bổ sung cơ chế đánh dấu mức độ tin cậy của tài liệu tham khảo, đồng thời yêu cầu rà soát lại các nghiên cứu đã xuất bản để đính chính hoặc rút bài nếu các trích dẫn giả làm ảnh hưởng đến kết luận khoa học.
Đáng chú ý, tại thời điểm cuộc rà soát được thực hiện, có tới 98,4% các bài báo chứa tài liệu tham khảo giả chưa bị nhà xuất bản xử lý.
Trong bài bình luận đi kèm nghiên cứu, Tiến sĩ Howard Bauchner và Tiến sĩ Frederick P. Rivara nhận định đây là dấu hiệu “rất đáng báo động” đối với tính liêm chính của khoa học toàn cầu.
Hai chuyên gia cảnh báo rằng niềm tin của công chúng vào khoa học đang suy giảm tại nhiều quốc gia, trong khi sự bùng nổ của AI lại tạo thêm nguy cơ xuất hiện các nghiên cứu thiếu trung thực nhưng ngày càng khó nhận biết.
“Học giả và tác giả nghiên cứu phải chịu trách nhiệm với toàn bộ nội dung bài báo, bao gồm cả tài liệu tham khảo”, các chuyên gia nhấn mạnh.
Vụ việc đang làm dấy lên tranh luận sâu rộng trong giới học thuật về mặt trái của AI trong nghiên cứu khoa học. Dù AI có thể hỗ trợ tăng tốc quá trình viết và xử lý dữ liệu, việc lạm dụng công nghệ này mà thiếu kiểm chứng đang tạo ra nguy cơ phá vỡ nền tảng cốt lõi của khoa học, đó là tính xác thực và khả năng kiểm chứng của tri thức.
