Công bố giải cuộc thi nhận diện văn bản trên biên nhận tiếng Việt - MC-OCR tại hội nghị IEEE-RIVF 2021

09:58, 04/12/2021

Trong hai ngày 2 - 3/12/2021, Hội nghị quốc tế thường niên tại Việt Nam về xử lý Công nghệ Tính toán và Truyền thông RIVF 2021 (RIVF International Conference on Computing and Communication Technologies on Research, Innovation and Vision for the Future) diễn ra tại Học viện Kỹ thuật Quân sự (ĐH Lê Quý Đôn), kết hợp diễn đàn trực tuyến. Hội nghị RIVF quy tụ các nhà nghiên cứu hàng đầu trong và ngoài nước tham gia và có các bài tham luận khoa học chất lượng cao được công bố trên IEEE Xplore.

Trong khuôn khổ hội nghị, lần đầu tiên cuộc thi MC-OCR với chủ đề Nhận Diện Văn Bản Trên Biên Nhận Tiếng Việt (Mobile-Captured Image Document Recognition for Vietnamese Receipts) được tổ chức, theo sáng kiến của công ty công nghệ DopikAI và các nhà nghiên cứu của nhóm VNDAG. Là sân chơi dành riêng cho các nhóm/công ty nghiên cứu về Trí tuệ nhân tạo (AI), cuộc thi đã nhanh chóng thu hút được hơn 150 đội thi và ghi nhận khoảng 1285 bài dự thi gửi về chỉ trong vòng một tháng, trong đó có các tên tuổi lớn như SamSung, Bach Khoa AI, SUN AI Team v.v.     

Thử thách MC-OCR dành cho các đội thi năm nay là xây dựng mô hình và xử lý nhận dạng trên hơn 2.000 hoá đơn tiếng Việt có cấu trúc và bán cấu trúc, yêu cầu nhận diện đầy đủ các trường thông tin cơ bản của một hoá đơn là “Người bán”, “Địa chỉ người bán”, “Thời gian mua hàng” và “Tổng chi phí”. Tuy nhiên, chị Hà - CEO của DopikAI cho biết độ khó của thử thách này nằm ở việc hoá đơn được chụp từ các nguồn chất lượng trung bình như điện thoại, laptop, máy tính bảng và muôn vàn các cấu trúc hoá đơn khác nhau. Ngoài ra, các đội chơi không chỉ bắt buộc nhận diện được dữ liệu trên ảnh mà còn phải đánh giá được chất lượng của hình ảnh đó, nếu độ phân giải của ảnh thấp, hoặc chất lượng đọc thông tin từ ảnh đầu vào không cao, phần mềm sẽ tự động đưa các xử lý phức tạp hơn hoặc loại bỏ. Chính vì những lý do này, để kết quả đạt được cao nhất, các đội thi cần kết hợp cả hai lĩnh vực thị giác máy tính và xử lý ngôn ngữ tự nhiên - chị Hà cho biết sau cuộc thi.

Trải qua hơn hai tháng nỗ lực giải bài toán trên, gần như đa số các bài dự thi chung kết đều được đánh giá cao và được đăng trên các tạp chí khoa học chuyên ngành quốc tế về AI, ban tổ chức đã lựa chọn ba đội thi xuất sắc nhất là  SDSV AICR (SamSung Vietnam), DataMining VC (VCCorp), UIT CS AIClub (Trường ĐH Công nghệ thông tin, ĐHQG TP Hồ Chí Minh). Ngoài ra, BTC cũng trao giải danh dự cho đội BK_OCR (Đại học Bách khoa Hà Nội). Đội đạt giải nhất đã xử lý bài toán với độ chính xác xuất sắc cho cả hai bài toán của cuộc thi. Trưởng nhóm của đội SDSV AICR cho biết “Đây là cuộc thi thực chiến về AI chưa từng có tại Việt Nam với tầm cỡ thế giới. Dữ liệu BTC cung cấp cũng lớn hơn nhiều so với dữ liệu của bài toán tương tự trên thế giới, như dữ liệu SROIE tại ICDAR 2019. Nhiều đội thi gạo cội tham gia cũng như độ khó của thử thách cao nhưng lại rất thú vị với đội”. Đại diện đội đạt giải cũng chia sẻ thêm rằng, cuộc thi như thế này nên tiếp tục tổ chức vào các năm sau để các đội nghiên cứu về AI khắp toàn quốc có dịp cọ xát và học hỏi lẫn nhau.

Một số hình ảnh tại lễ trao giải và trình bày giải pháp tại hội nghị RIVF 2021:

Đội SUN_AI báo cáo giải pháp tại hội nghị RIVF 2021.

Đội BK_OCR báo cáo tại hội nghị RIVF 2021.

Kết quả chung cuộc của cuộc thi MC-OCR công bố tại hội nghị RIVF 2021.

Giải thưởng cho đội đạt giải nhất từ nhà tài trợ DopikAI và chứng nhận.

Đại diện BTC, TS Vũ Xuân Sơn (ĐH Umea, Thuỵ Điển) cho biết: “Cuộc thi đã đưa ra một tập dữ liệu đủ lớn với các thang đánh giá theo chuẩn chung. Từ đó giúp các nghiên cứu sau này có thể tiếp tục đào sâu về mặt giải pháp và so sánh hiệu năng. Ngoài ra, các đội đạt giải cũng đã mở mã nguồn giải pháp. Điều này đóng vai trò rất quan trọng trong việc thúc đẩy các nghiên cứu sau này.” Chi tiết về các giải pháp mở và cách truy cập dữ liệu được cập nhật ở trang chủ của cuộc thi https://www.rivf2021-mc-ocr.vietnlp.com.

MC-OCR là cuộc thi trong khuôn khổ Hội thảo RIVF - sự kiện khoa học quốc tế uy tín lần thứ 15 tại Việt Nam với sự tham gia của các nhà nghiên cứu khoa học hàng đầu thế giới và Việt Nam. Mặc dù tổ chức trực tuyến do dịch bệnh, RIVF đạt được kết quả to lớn với những bài tham luận khoa học cực kỳ chất lượng. Các kết quả đạt được đánh dấu sự trưởng thành vượt bậc của các công ty nghiên cứu trí tuệ nhân tạo tại thị trường Việt Nam, ngày càng rút ngắn khoảng cách với Trí tuệ nhân tạo thế giới. Cùng với các chuỗi sự kiện thường niên về xử lý ngôn ngữ tự nhiên và tiếng nói của CLB VLSP (Vietnamese Language and Speech Processing), thuộc hội Tin Học Việt Nam, những hoạt động nghiên cứu khoa học gắn liền với các cuộc thi đã và đang đóng góp tích cực cho quá trình chuyển đổi số trong mọi lĩnh vực, ngành nghề và dịch vụ tại Việt Nam.

Thông tin của cuộc thi có thể xem tại:

●     Trang chủ: https://www.rivf2021-mc-ocr.vietnlp.com

●     Các bạn hứng thú nghiên cứu thêm về bài toán có thể tiếp tục tham gia thi tại https://aihub.vn/competitions/1

PV