Trích xuất nội dung văn bản từ hình ảnh nhanh chóng

00:00, 06/02/2011

I2OCR là một dịch vụ nhận dạng kí tự quang học mạnh mẽ có thể chuyển các văn bản, fax, ảnh chụp đã được scan thành định dạng văn bản thuần túy để bạn có thể chỉnh sửa với tốc độ làm việc cực nhanh và kết quả tốt mà không phải trải qua các quá trình đăng kí phức tạp. 

Đầu tiên bạn truy cập vào địa chỉ http://www.sciweavers.org/free-online-ocr. Trong mục Image bạn chọn File để sử dụng tập tin ảnh sẵn có trên máy tính hay chọn URLđể sử dụng liên kết ảnh trên Internet. i2OCR hỗ trợ rất nhiều các định dạng ảnh như TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM với file ảnh upload lên có dung lượng tối đa 10MB.Kế đến chọn ngôn ngữ ở mục Language xong nhấn nút Convert. Kết quả sẽ được hiển thị ở phần Download Text ở ngay bên dưới. Bạn bôi đen nội dung văn bản và sao chép vào các trình soạn thảo văn bản để xử lý. 
Dịch vụ này có thể nhận diện các tài liệu của hơn 30 ngôn ngữ phổ biến như tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, Ý, Nga, Trung Quốc.. và có cả Việt Nam. Tuy nhiên khả năng nhận diện Tiếng Việt thực sự chưa được tốt cho lắm. Ngoài ra để việc nhận diện được tốt nhất, ảnh phải có độ phân giải ít nhất 200dpi. 

Lê Trung Hiếu