張秀常
我們?cè)谌粘5男畔⒒k公過程中,經(jīng)常利用OCR(光學(xué)字符識(shí)別)技術(shù),通過掃描儀或數(shù)碼相機(jī)檢查紙上打印的字符,并通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成數(shù)字化的文檔。但在實(shí)際使用過程中,絕大多數(shù)的OCR軟件只能識(shí)別單一語言,若遇到中文、英文或其他多種語言混合時(shí)就無法正確識(shí)別,甚至出現(xiàn)亂碼。此時(shí),我們只有反復(fù)變換語言再識(shí)別,或?qū)⑵浞指顬閱我徽Z言再整合成文檔,這樣不但操作步驟煩瑣,而且往往影響我們的工作效率。對(duì)于中英文混合識(shí)別的問題,有沒有一種更好的解決方案?下面,筆者將介紹一款OCR軟件——ABBYY FineReader,并結(jié)合具體實(shí)例加以闡述。