Sinh viên Mỹ phát triển ứng dụng ngăn đạo văn từ ChatGPT

18:09, 09/02/2023

Edward Tian, 22 tuổi, sinh viên năm cuối tại Đại học Princeton, Mỹ đã thiết kế ứng dụng có khả năng phát hiện văn bản được viết bằng ChatGPT, đặt tên là GPTZero.

Tian hiện đang học hai chuyên ngành Khoa học máy tính và Báo chí học tại Đại học Princeton, thuộc khối các trường đại học hàng đầu nước Mỹ, Ivy League. Nam sinh đã dành một phần thời gian trong kỳ nghỉ đông vào cuối tháng 12 vừa qua để lên ý tưởng và xây dựng ứng dụng.

Chia sẻ về động lực phát triển GPTZero, Tian cho biết: Kể từ khi ChatGPT ra đời, việc gian lận bằng cách sao chép câu trả lời từ siêu trí tuệ nhân tạo này ngày càng tăng. Tôi đã đọc nhiều tin tức về việc sinh viên “đạo văn” từ ChatGPT và đạt điểm cao. Nhiều giảng viên, giáo sư đại học cũng bất ngờ trước mức độ thông hiểu của nó.

“Có nhiều sự cường điệu và hào hứng xung quanh ChatGPT. Chúng ta xứng đáng được biết rằng một văn bản là do con người hay trí tuệ nhân tạo viết ra”, Tian giới thiệu về GPTZero trên mạng xã hội Twitter.

Kể từ khi ra mắt trực tuyến vào ngày 2/1, GPTZero đã thu hút hơn 30.000 người sử dụng chỉ trong một tuần. Ứng dụng này phổ biến đến mức đã bị sập do lượng người truy cập quá cao, khiến Tian phải mua thêm dung lượng lưu trữ trực tuyến Streamlit để duy trì hoạt động của GPTZero. Đến nay, ứng dụng có hơn trăm nghìn lượt tải.

Nhiều người sử dụng GPTZero là giáo viên phổ thông, giảng viên các trường đại học. Họ đã liên hệ với Tian sau một thời gian sử dụng và đánh giá cao những kết quả tích cực mà ứng dụng này mang lại.

Edward Tian hiện là sinh viên Đại học Princeton, Mỹ.

“Viết và tự viết là kỹ năng quan trọng vượt thời gian nên các tác phẩm do con người viết ra luôn có giá trị to lớn. AI có thể tạo chữ nhanh hơn, tốt hơn nhưng nó không thể thay thế con người. Chúng ta vẫn luôn yêu quý những tác phẩm do con người viết nên”, Edward Tian chia sẻ.

GPTZero xác định văn bản đầu vào được viết bởi bot (phần mềm tự động) hay con người dựa trên hai biến là sự phức tạp và sự đơn giản. Sự phức tạp đo mức độ ngẫu nhiên trong văn bản. Nếu văn bản đầu vào có nội dung không quen thuộc, nó sẽ gây nhiễu loạn cho AI và nhiều khả năng nó được viết bởi con người.

Tuy nhiên, nếu văn bản quen thuộc, có ngữ liệu trong cơ sở dữ liệu, hệ thống sẽ xác định nó được tạo ra bởi AI. GPTZero cũng đánh giá văn bản dựa trên việc so sánh các biến thể ngữ nghĩa trong câu.

Đơn cử, con người có xu hướng viết những câu dài, phức tạp đan xen những câu ngắn, câu chủ động xen lẫn câu bị động và thể hiện cảm xúc, quan điểm cá nhân. Nhưng trong văn bản do AI viết, các câu thường có xu hướng đồng nhất.

Trong một video ngắn giới thiệu về GPTZero, Tian đã so sánh một đoạn văn do con người viết trên tờ The New Yorker và một đoạn văn do ChatGPT. Kết quả, GPTZero có thể phân biệt chính xác tác giả của hai đoạn văn.

Tuy nhiên, Tian thừa nhận ứng dụng của nam sinh chưa hoàn hảo. Một số người dùng đã phát hiện lỗi và gửi phản hồi về cho Tian để chàng trai trẻ tiếp tục cải thiện độ chính xác của ứng dụng. Tuy nhiên, nhìn một cách tổng quan, công cụ này đã truyền tải được mong muốn cốt lõi của Tian là đem lại sự minh bạch cho AI.

Tian không phải người duy nhất muốn chống đạo văn từ ChatGPT. Chính OpenAI, công ty phát triển ChatGPT, cũng thông báo sẽ phát triển việc ngăn chặn đạo văn từ AI và các ứng dụng bất chính khác.

Nhiều cơ sở giáo dục từ phổ thông đến đại học ở Mỹ, Anh, Pháp... thông báo đã chặn quyền truy cập ChatGPT trong khuôn viên trường. Đồng thời, các trường sử dụng nhiều phương pháp kiểm tra, đánh giá thay thế việc viết luận như kiểm tra miệng, kiểm tra trên lớp, làm việc nhóm...

Minh Thùy (T/h)