Categories

A sample text widget

Etiam pulvinar consectetur dolor sed malesuada. Ut convallis euismod dolor nec pretium. Nunc ut tristique massa.

Nam sodales mi vitae dolor ullamcorper et vulputate enim accumsan. Morbi orci magna, tincidunt vitae molestie nec, molestie at mi. Nulla nulla lorem, suscipit in posuere in, interdum non magna.

OCR 軟體介紹: ABBYY FineReader 11

今天同事丟了一張仿單給我
問我有沒有機會把它的內容轉成 text

看到這種密密麻麻的東西, 直覺一般 OCR 軟體的辨識效果應該不好

果然試了一下 Adobe Acrobat 9.0 Pro 跟轉成 TIFF 後丟給微軟的 Office Document Imaging 處理
大概都只能辨識出六成左右….

後來還是請出 Google 大神
原本還寄望 Google Docs 上的 OCR 可以幫忙
無奈 Google Docs 目前的 OCR 服務僅支援簡體中文

後來找到一套 ABBYY FineReader 11 專業中文版的軟體
上網下載了這個很胖的試用版軟體後
發現 OCR 的中文辨識率應該有超過九成

比較誇張的是, OCR 後連格式都大概還在

試用版每次只能辨識一個頁面, 急用又不想花錢的, 就一頁一頁處理
(可以先將 PDF 檔轉成 TIFF, 就會每一頁切成一個檔案來慢慢處理)
其實就算買也不貴, 一套這麼好用的軟體才賣 NT$ 2,300
對於需要大量 OCR 處理文字的人員, C/P 值是真的很高

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>