趣味活字

星期三到圖書館做義工,辨認字粒。起初為了方便自己,想借用他們的活字配字簿來做個搜尋器,原意只是敝帚自珍,怎料他們原來已有個大計劃,還把我拉進群組,逢星期三Zoom開會半個鐘。我自知斤兩,他們都是讀電腦的,所以十分自卑。他們花了很多時間做認字軟件,我則利用真真不錯的白描(BaiMiao),幾分鐘就認完七千字,然後把横排的字變成直行的excel,利用excel加入各種其他資訊,化為csv格式,上傳MySQL作資料庫,再用PHP編製使用界面。感謝AI,我想做的大都能做出來,但只是知其然而不知其所以然,程式的原理仍是一竅不通。最花時間其實是校對,這我應該比他們強,因為我是學繁體字的。

上星期開會,討論怎樣用原稿核對我的認字結果。原稿有七千個中文字,我其實已看了兩遍,有些字,電腦體跟印刷體有別,例如「即」與「卽」,我會視作相同,但他們可能另有意見,於是我只好用「卽」而不用「即」,雖然99.9%的人應該會寫「即」。又例如有些字,筆劃不同,像「半」字,上面兩點印刷體作「八」,電腦字沒有,我只能選擇用「半」,否則這個常用字就變成沒有對應的電腦字。當然也有些字電腦字庫沒有,只能放棄。大概七千字中有一百個字是找不到對應的中文字。一言以蔽之,就是電腦字跟印刷字不同,注定有些字永遠不能用我的小玩意找出來。

主持人想搞個趣味版的校對玩意,我搞了一個,請大家也試試。網址是我的,因為串錯字,應該選polyglot, 但選錯了 polygot , 我打算不用了,剛好要搞這小玩意,就暫存此處。因為沒有買SSL,網址是 http 而不是 https, 如果出現警告, 說連接不安全,就只能信我了。Android機不會警告, 電腦也不會,但蘋果會。

http://polygot.org/funproofreading.php

無聊的時候我也會玩一會,畢竟意念是我的,AI替我實現。手機玩最方便,電腦隨機選出一個圖像,以及相應的中文字,看後選相似或不似,就會彈出第二個圖,隨時可不玩。如果想看看結果,可到這裡:為了製造效果,有些字明明是通用的,我都視作不同。
http://polygot.org/funexpertjudgment.php