Sinh trắc học giọng nói và mống mắt: Bước tiến nhận dạng số hay thách thức quyền riêng tư

09:01, 03/11/2025

Trong kỷ nguyên số, dữ liệu sinh trắc học - đặc biệt là giọng nói và mống mắt - đang trở thành “chìa khóa” nhận diện cá nhân trong nhiều lĩnh vực từ ngân hàng, giao thông, y tế tới quản lý dân cư. Thế giới đã chứng kiến cả thành công lẫn cảnh báo về quyền riêng tư, bảo mật và nguy cơ deepfake. Việt Nam hiện cũng bước vào giai đoạn thử nghiệm và chuẩn hóa, đòi hỏi phải học hỏi kinh nghiệm toàn cầu để cân bằng giữa tiện lợi, an toàn và pháp lý.

Sinh trắc học - công cụ nhận dạng của thời đại số

Giọng nói (voice biometrics) và mống mắt (iris recognition) là hai dạng sinh trắc học được ưa chuộng nhất trong xu hướng “không chạm” (contactless authentication).

Ảnh minh họa.

Giọng nói của mỗi người chứa hàng trăm đặc trưng độc nhất về tần số, cao độ, nhịp thở, cộng hưởng khoang miệng, khiến nó gần như không thể trùng lặp. Mống mắt - cấu trúc tròn màu trong mắt lại mang đặc điểm ổn định suốt đời, thậm chí còn chính xác hơn cả vân tay.

Chính nhờ đặc tính này, sinh trắc học đang được ứng dụng mạnh mẽ trong các lĩnh vực: Hàng không: nhận dạng hành khách tại cổng xuất nhập cảnh; Ngân hàng: xác thực khách hàng qua tổng đài, eKYC khi mở tài khoản; Dịch vụ công: định danh điện tử, cấp giấy tờ, bảo hiểm xã hội.

Nhưng đi cùng với đó là câu hỏi: dữ liệu sinh trắc học có an toàn tuyệt đối không? Và nếu bị lộ, liệu có thể “thay” được như mật khẩu?

Kinh nghiệm thế giới: tiện lợi đi cùng hiểm họa

Ấn Độ là quốc gia tiên phong với hệ thống định danh quốc gia Aadhaar, thu thập vân tay, mống mắt và khuôn mặt của hơn 1,3 tỷ dân. Aadhaar giúp người dân nhận trợ cấp, vay ngân hàng và đăng ký dịch vụ công chỉ với một mã số duy nhất. Tuy nhiên, nước này từng đối mặt với cáo buộc rò rỉ dữ liệu, khiến chính phủ phải siết quy định về chia sẻ và mã hóa thông tin.

Các Tiểu vương quốc Ả rập thống nhất (UAE) thì áp dụng nhận dạng mống mắt trong kiểm soát xuất nhập cảnh từ năm 2001. Hệ thống này phát hiện hàng chục nghìn trường hợp gian lận nhập cảnh, với tỷ lệ sai sót gần như bằng 0, minh chứng cho độ chính xác vượt trội của công nghệ mống mắt.

Ảnh minh họa.

Ở Mỹ, ngân hàng CitiBank và Wells Fargo triển khai nhận dạng giọng nói giúp khách hàng xác thực chỉ trong vài giây khi gọi tổng đài, tiết kiệm đến 70% thời gian.

Anh với hệ thống “Voice ID” của HSBC phục vụ hơn 15 triệu khách hàng, từng được ca ngợi là “bước tiến trong an ninh ngân hàng”. Tuy nhiên, năm 2023, phóng sự của BBC cho thấy, một giọng nói nhân tạo do AI tạo ra đã qua mặt được hệ thống. Sau vụ việc, HSBC và nhiều tổ chức tài chính buộc phải bổ sung liveness detection, công nghệ phát hiện giọng thật và giọng giả.

Chính phủ Australia cũng từng thử nghiệm xác thực giọng nói trong hệ thống myGovID, định danh điện tử của chính phủ nhưng đã tạm ngừng để kiểm toán lại sau cảnh báo về rủi ro deepfake.

Liên minh châu Âu (EU) xếp dữ liệu sinh trắc học vào nhóm “đặc biệt nhạy cảm” trong Quy định Bảo vệ dữ liệu chung (GDPR). Mọi tổ chức chỉ được thu thập mống mắt, giọng nói khi có mục đích rõ ràng, sự đồng ý minh bạch và công dân có quyền rút lại bất cứ lúc nào.

Nhật Bản là quốc gia ứng dụng mống mắt sớm trong hàng không. Tại sân bay Narita và Haneda, hành khách chỉ mất 15-20 giây để làm thủ tục xuất cảnh, đạt độ chính xác trên 99%. Nhật Bản cũng yêu cầu các nhà cung cấp phải tuân thủ tiêu chuẩn mã hóa dữ liệu quốc gia và lưu trữ trong máy chủ nội địa.

Singapore triển khai SingPass Face Verification, kết hợp khuôn mặt và mống mắt cho hơn 4 triệu công dân. Đạo luật Bảo vệ dữ liệu cá nhân (PDPA) yêu cầu tất cả dữ liệu sinh trắc học phải được mã hóa, lưu trong lãnh thổ Singapore, và chỉ sử dụng đúng mục đích đã thông báo.

Kinh nghiệm quốc tế chỉ ra 4 yếu tố cốt lõi để sinh trắc học hoạt động bền vững: Khung pháp lý rõ ràng, bảo vệ dữ liệu nhạy cảm; kết hợp nhiều lớp xác thực thay vì phụ thuộc vào một yếu tố duy nhất; lưu trữ dữ liệu dưới dạng mẫu mã hóa (template), không giữ ảnh hay giọng gốc; cơ chế giám sát độc lập và minh bạch với người dân.

Việt Nam: Từng bước hoàn thiện khung pháp lý và hạ tầng

Việt Nam đang triển khai hệ thống Cơ sở dữ liệu quốc gia về dân cư và định danh điện tử (VNeID), trong đó có lộ trình thu thập dữ liệu mống mắt bên cạnh vân tay và khuôn mặt.

Các ngân hàng Việt Nam như Vietcombank, MB, TPBank... đã tích hợp sinh trắc học (khuôn mặt, giọng nói, vân tay) trong eKYC và giao dịch điện tử.

Ngân hàng Nhà nước đang nghiên cứu quy định riêng về xác thực sinh trắc học cho giao dịch rủi ro cao nhằm ngăn gian lận tài chính, nhất là trong bối cảnh tội phạm sử dụng AI giả giọng ngày càng tinh vi.

Công nghệ deepfake giọng nói đang lan nhanh tại Việt Nam. Một số vụ lừa đảo qua điện thoại sử dụng giọng nói nhân tạo khiến người dân mất cảnh giác. Đây là lời cảnh báo rằng việc ứng dụng voice biometrics cần đi kèm giải pháp kỹ thuật chống giả mạo và tăng cường tuyên truyền nhận thức.

Ngoài ra, vấn đề quản lý dữ liệu mống mắt, lưu trữ ở đâu, thời gian bao lâu, ai được quyền truy cập… cũng đang được giới chuyên gia đề xuất phải quy định thật chi tiết trong luật.

Năm 2023, Nghị định về bảo vệ dữ liệu cá nhân chính thức có hiệu lực, quy định rõ dữ liệu sinh trắc học thuộc nhóm “nhạy cảm”, chỉ được xử lý khi có sự đồng ý tự nguyện, rõ ràng. Việc chuyển dữ liệu ra nước ngoài phải có sự cho phép của cơ quan quản lý. Đây được coi là bước tiến lớn giúp Việt Nam bắt kịp tiêu chuẩn quốc tế như GDPR (châu Âu) hay PDPA (Singapore).

Thu thập mống mắt là quy trình mới đối với Luật căn cước 2023. Việc thu thập thông tin sinh trắc học mống mắt để làm cơ sở đối soát, xác thực thông tin của mỗi cá nhân; hỗ trợ trong những trường hợp không thu nhận được vân tay của một người (trong các trường hợp khuyết tật, vân tay bị biến dạng...). (Ảnh: phunuvietnam.vn)

Được biết, Bộ Công an đã hoàn thành xây dựng Dự thảo quy chuẩn kỹ thuật quốc gia sinh trắc học giọng nói, sinh trắc học mống mắt và đang lấy ý kiến đóng góp của các cơ quan, tổ chức, cá nhân…

Theo đó, Dự thảo quy chuẩn kỹ thuật quốc gia sinh trắc học giọng nói quy định rõ điều kiện về độ tuổi và tình trạng giọng nói của công dân. Trong đó, độ tuổi lấy mẫu lần đầu phải từ đủ 6 tuổi; các lần lấy mẫu cập nhật dữ liệu vào độ tuổi từ 14 - 25 tuổi, 25 - 40 tuổi, 40 - 60 tuổi.

Công dân cam kết thời điểm thu nhận sinh trắc học giọng nói không có dấu hiệu bất thường về giọng nói, sức khỏe và tâm lý bình thường và ký xác nhận vào văn bản cam kết.

Sinh trắc học giọng nói và mống mắt là nền tảng của xã hội số an toàn, thuận tiện. Nhưng công nghệ chỉ thực sự bền vững khi được đặt trong khuôn khổ pháp lý nghiêm ngặt, có giám sát độc lập và sự tin tưởng từ người dân.

Việt Nam đang ở giai đoạn “chọn đường” giữa một bên là cơ hội số hóa toàn diện, bên kia là yêu cầu bảo vệ quyền riêng tư cá nhân. Nếu kết hợp được kinh nghiệm quốc tế với các giải pháp nội địa hóa, chúng ta có thể xây dựng hệ thống sinh trắc học vừa hiện đại, vừa nhân văn, phục vụ cho mục tiêu phát triển số quốc gia./.