Nhận diện văn bản sau khi đã quét...

08:40, 19/08/2008

XHTTOnline: Nếu bạn muốn chuyển nội dung trong văn bản, sách bài tập…. sang dạng số hóa để có thể lưu trữ thì cần phải có máy quét ( Scanner). Để không phải gõ lại nội dung đã quét vào ( thường nằm ở dạng ảnh) thì bạn cần một chương trình trích xuất dữ liệu để trích chữ trong hình ảnh và chuyển sang dạng văn bản có thể chỉnh sửa được ( ví dụ như sao chép sang Microsoft Word). Chương trình Kleptomania được cung cấp tại http://tinyurl.com/629m87 sẽ là trợ thủ đắc lực dành cho bạn +Hướng dẫn sử dụng: -Trong quá trình cài đặt, chương trình sẽ yêu cầu bạn cho nhận diện Font chữ trên máy tính để sau này quá trình nhận diện cho chính xác. ( đối với tiếng Anh thì chương trình hoạt động tuyệt vời, riêng đối với các ngôn ngữ có dấu, như tiếng Việt thì chương trình hoạt động rất kém. Hy vọng trong tương lai, chương trình thực hiện tốt việc xử lý văn bản tiếng Việt). -Sau khi cài đặt chương trình có biểu tượng tại System Tray ( hình dấu +) -Bạn nhắp phải chuột vào biểu tượng chương trình, chọn Properties. Tại khung bên trái, bạn nhắp chọn mục Rebuild font database để chương trình thực hiện việc nhận diện Font chữ ( nếu trong bước trên bạn chưa làm thì phải thực hiện lại trong bước này !). Để kiểm tra xem chương trình nhận diện được bao nhiêu Font, bạn chọn mục Font database report .Danh sách các Font chữ được nhận diện sẽ hiện lên trên màn hình.
 
 
-Tại mục Highlight text, chọn màu sắc khi lựa chọn ký tự từ hình ảnh quét. Tiếp tục chọn phím nóng khởi động chương trình trong các mục bên dưới( Shift-Ctril; Ctril_Alt…). Sau cùng chọn OK. -Tại hình ảnh muốn lấy dữ liệu, kích hoạt phím nóng, lúc này chuột máy tính sẽ thay đổi. Bạn chọn vùng văn bản cần lấy. Trong màn hình hiện ra , bạn chọn mục Copy Plain Text để sao chép nội dung. Bạn mở chương trình soạn thảo văn bản ra để dán vào.
 
Phạm Mạnh Cường