Facebook công bố dữ liệu gỡ bỏ nội dung vi phạm từ 19/10/2019 đến 20/3/2020

Thùy Chi 08:19, 18/05/2020

Mới đây, Facebook đã công bố Báo cáo thực thi Tiêu chuẩn cộng đồng với nhiều nội dung gỡ bỏ đáng chú ý.

Nhân viên kiểm duyệt cho Facebook sang chấn tâm lý, kiện Mark Zuckerberg và yêu cầu phải bồi thường 52 triệu USD
Chế độ dark mode trên Facebook đến với mọi người dùng toàn cầu
Facebook dùng trí tuệ nhân tạo để chống lại các nội dung mang tính thù hận

Theo đó, báo cáo thực thi Tiêu chuẩn cộng đồng lần thứ năm cung cấp dữ liệu về công tác thực thi chính sách của Facebook từ tháng 10/2019 đến tháng 3/2020 (Q4/2019 – Q1/2020). Báo cáo cũng lưu ý không bao gồm toàn bộ khoảng thời gian đại dịch COVID-19.

Giờ đây Facebook có thể chủ động phát hiện tới 90% nội dung gây thù ghét và gỡ xuống trước cả khi ai đó báo cáo – con số này tăng từ 24% khi mạng xã hội này công bố báo cáo lần đầu tiên vào năm 2018.

Còn với Instagram, hãng đã tăng tỷ lệ phát hiện chủ động nội dung về tự tử và tự gây thương tích lên 89,7% trong Q1 – cải thiện hơn 12 điểm kể từ báo cáo lần trước; khối lượng nội dung đã xử lý tăng 40%. Facebook cũng đã đưa vào các bộ dữ liệu mới, với số liệu về 12 lĩnh vực chính sách trên Facebook và 10 lĩnh vực chính sách trên Instagram.

Trí tuệ nhân tạo (AI) và Ngôn từ gây thù ghét

Techsignin thông tin, tiến bộ của Facebook trong việc phát hiện ngôn từ gây thù ghét phần lớn nhờ vào những tiến bộ trong AI gần đây của hãng trên một số lĩnh vực:

Hiểu biết đa ngôn ngữ: khả năng xây dựng các phân loại từ có thể hiểu cùng một khái niệm trong nhiều ngôn ngữ – và việc học trong một ngôn ngữ có thể cải thiện hiệu suất trong các ngôn ngữ khác. Điều này đặc biệt hữu ích cho các ngôn ngữ ít phổ biến trên internet.
Toàn bộ bài viết hoặc sự hiểu biết đa phương thức: khả năng đào tạo không chỉ trên văn bản hoặc hình ảnh riêng biệt mà còn đặt chúng cùng nhau để hiểu toàn bộ bài viết. Công nghệ này hiện được sử dụng ở quy mô phân tích nội dung.
Hôm nay, Facebook cũng mở nguồn cung cấp bộ dữ liệu memes mang tính thù ghét đầu tiên chứa hơn 10.000 ví dụ mới tạo ra về nội dung đa phương thức (văn bản và hình ảnh) để giải quyết thách thức toàn ngành về sự thù ghét. Những nỗ lực này sẽ thúc đẩy cộng đồng nghiên cứu AI phát triển hơn để thử nghiệm các phương pháp mới, so sánh thành phẩm và đánh giá kết quả của họ để đẩy nhanh việc phát hiện ngôn từ gây thù ghét đa phương thức.

Mặc dù Báo cáo thực thi Tiêu chuẩn Cộng đồng lần này không bao gồm toàn bộ phạm vi của đại dịch COVID-19, Facebook muốn chia sẻ thông tin cập nhật về tiến trình trên một số lĩnh vực chính – trí tuệ nhân tạo và thông tin sai lệch.

Trí tuệ nhân tạo (AI) và dịch COVID-19

AI là công cụ quan trọng để ngăn chặn sự lan truyền của thông tin sai lệch, bởi nó cho phép Facebook tận dụng và mở rộng quy mô công việc của đội ngũ kiểm chứng thông tin độc lập, những người kiểm duyệt nội dung trên nền tảng.

SimSearchNet (SSN): Khi một nội dung bị các đối tác kiểm chứng thông tin độc lập bên thứ ba của Facebook dán nhãn là thông tin sai lệch, SSN có thể phát hiện các kết quả gần như tương tự – ví dụ: khi ai đó đã cố tình thay đổi nội dung để qua mặt hệ thống của Facebook. SimSearchNet đang kiểm duyệt hàng tỷ bức ảnh mỗi ngày để tìm các bản sao của thông tin sai lệch hoặc gây hiểu lầm đã bị gỡ xuống.
Khớp hình ảnh cho quảng cáo: Facebook đã xây dựng các phân loại thị giác máy tính mới để giúp thực hiện chính sách cấm tạm thời quảng cáo và rao bán khẩu trang y tế và các sản phẩm khác. Vì đôi khi mọi người sửa đổi quảng cáo của các sản phẩm này để cố gắng qua mặt hệ thống của Facebook, nên mạng xã hội này còn sử dụng thêm tính năng đối chứng dựa trên đặc điểm địa phương để tìm các trường hợp nội dung bị chỉnh sửa. Trong nhiều trường hợp, Facebook đã chủ động hành động – trước khi bất kỳ ai báo cáo. Các mô hình dựa trên kết quả khớp mẫu hiện đang tự động từ chối hàng ngàn quảng cáo hàng ngày với độ chính xác rất cao.

Tiến bộ của Facebook trong thông tin sai lệch về dịch COVID-19

Trong tháng 4, Facebook đã áp dụng nhãn cảnh báo với khoảng 50 triệu nội dung liên quan đến thông tin sai lệch về dịch COVID-19 trên Facebook, dựa trên khoảng 7.500 bài viết của các đối tác kiểm định thông tin độc lập của hãng.
Nhãn cảnh báo giúp hạn chế tới 95% số lần người dùng nhấp vào xem nội dung đó.
Kể từ ngày 1 tháng 3, Facebook đã gỡ bỏ hơn 2,5 triệu nội dung không trả phí bán khẩu trang, nước rửa tay, khăn lau khử trùng bề mặt và bộ kit thử nghiệm Covid-19.
Để hỗ trợ xử lý vấn đề này, Facebook đã dựa vào công nghệ thị giác máy tính mà hãng đã sử dụng trong nhiều năm để phát hiện và loại bỏ nội dung bán vũ khí và thuốc phiện.

Thông tin về Báo cáo thực thi Tiêu chuẩn cộng đồng của Facebook được đăng tải tại: https://about.fb.com/news/2020/05/community-standards-enforcement-report-may-2020/

Thùy Chi (T/h)