AI發展一日千里。
二三十年前知道有種軟件叫 OCR,可以從圖像認字,是抄考的一大利器。但那些軟件都很貴,我用的都是公益版。先後用過的有丹青、尚書等,準確度超過一半;後來改用 ABBYY,因為可以認 PDF 檔,效果也不錯,我用真金白銀也買過兩次。
如今一般 AI 模型都可以認字了,效果很好。我的研究也是抄考居多,所以 OCR 可以省去我不少工夫時間,而且電腦操作可減少失誤,不過免費而可靠的 APP 不多。認字質量較佳的有白描、CamScanner等,前者價錢相宜,後者年費幾百。而韓國軟件 vFlat 拍照後可以自動拉直漂白,也能認字,可惜效果只屬一般。
我做了三個 OCR APP,以 Claude, Gemini, 以及千問 (證明我愛國) API 為核心,在網上運作,電腦手機均可用,可以上載圖片或者手機拍照。我多數以 vFlat 拍照,漂白拉直後剪裁,然後上傳,效果不錯。
我以函牘舉隅一頁為例,結果是: 千問 100% 正確,但沒有標點;Gemini 99% 正確,而且包括標點;Claude 令人失望,不但版面混亂,最嚴重的是有些行的次序搞亂了。
使用者介面

函牘舉隅書影

千問結果

Gemini 結果

Claude 結果
