前年我參加了大學出版社的義工工作,就是清理及整理一批幾十年前在中國香港訂製運到紐絲綸的鉛字中文字粒。這批字粒是用來印刷一份紐絲綸華人農夫的消息報,除了價格、技術之外,也有些祖國消息。這報紙後來結業,字粒輾轉送到大學儲存。
為了提高整理效率,特別是幫助不懂中文的義工,我協助製作了一個輸入中文字就可以秒速找到它應放在哪個字粒木匣。我自鳴得意,但用家表示用筆劃輸入很困難,希望可以用手機拍照就可以,不必人手輸入。有電腦少年閞發相關程式,但辨錯率高。
昨天我想起不妨用AI,於是請AI寫了個網頁,可以用電腦拍字粒(不是直接拍,而是用印台先印出來,因為鉛字粒金屬反光,效果不佳),剪輯相關部分,辨認字體,自行到我已有的網站搜尋相關訊息,這樣不懂中文的也可以用。
結果成功了,但手邊沒有字粒可試,改天去出版社實戰一下。他們有千千萬萬的字粒要辨認,或者會有點用。
附圖是用機拍攝屏幕上的字(「活」),然後經AI在後台認字、自動粘貼到我原來的網站搜尋相關資訊。我也用過中文書的印刷字體,只要夠大及清晰,效果不錯,但字粒是否同樣準確要實地測試。
(2023.03.27補:昨晚通宵達旦搞這個,今早到下午也在搞,大致完成。我把先前做的幾個網頁一併作出以下改動: 1. 用了cloudflare workers的link, 不怕API外洩; 2. 用了三個 model 的 API, Claude Sonnet 4.6, Claude Haiku 4.5, 以及 Deepseek V3; 價錢、速度、水平有分別,一分錢一分貨吧,按實際需要使用。雖然費時不少,也有額外花費,眼睛也疲累,但自我感覺良好。)




















