Phần mềm OCR- trợ thủ đắc lực của người dùng scanner

Trong CD-ROM cài đặt của scanner đều có kèm theo phần mềm nhận dạng ký tự OCR (optical character recognition), ví dụ như với scanner của HP là phần mềm OmniPage Limited Edition nhận dạng được tiếng Anh và Pháp. Ngoài ra, scanner của HP còn có kèm theo phiên bản Special Edition for Hewlett - Packard Scanner của phần mềm nhận dạng tiếng Việt VnDOCR , chỉ chạy trên các loại máy scanner của HP.

Phần mềm OCR là gì ?

Khi quét một trang văn bản bằng scanner, toàn bộ trang văn bản với chữ viết trên đó sẽ được biến thành một bức ảnh. Bạn chỉ có thể lưu trữ mà không thể sửa chữa, bổ sung hay ghi chú thêm. Phần mềm OCR như OmniPage hay VnDOCR sẽ nhận dạng ký tự trên văn bản và biến bức ảnh chứa chữ viết trở lại thành file văn bản bình thường. Với các văn bản in rõ, bằng các kiểu chữ bình thường, khả năng nhận dạng của OCR có thể lên đến 100%. Như vậy, thay vì phải tốn công ngồi đánh máy lại toàn bộ tài liệu dài hàng chục trang, bạn chỉ tốn vài phút cho việc quét, chỉnh sửa lại với OCR.

OmniPage – nhận dạng tiếng Anh và Pháp

Đối với văn bản tiếng Anh và Pháp, bạn có thể dùng phần mềm OmniPage kèm theo trong CD-ROM của scanner HP. Phần mềm này có giao diện đơn giản, dễ sử dụng.

Trong trường hợp cần quét nhiều trang liên tục, bạn có thể đặt ở chế độ tự động, mỗi lần quét trang tài liệu sẽ được chuyển trực tiếp sang dạng text để đỡ mất công thao tác thêm.

Nhận dạng tiếngViệt với VnDOCR

VnDOCR là phần mềm nhận dạng văn bản in tiếng Việt trên các kiểu font chữ như Arial, Avant, Helvetica, Time, Time New Roman, Courier với kích thước của kí tự từ 8 đến 72 điểm. Văn bản được quét sẽ được lưu lại theo định dạng file Word 6.0 (.DOC), .RTF và .TXT. Đối với các trang tài liệu in rõ ràng có cách trình bày đơn giản, font chữ chuẩn (ABC, VNI..) tỷ lệ độ nhận dạng chính xác đạt gần 99%.


PcLeHoan 1996 - 2002
Mirror : http://www.pclehoan.com
Mirror : http://www.lehoanpc.net

Mirror : http://www.ktlehoan.com