這兩天為了搞一個小玩意,荒廢學業,頭昏腦脹。
用英文寫好中國故事,要跟國際標準,例如書目一般用芝加哥手冊。最新的芝加哥手冊第18版,說出版地毋須列出,漢字可不列出,於是可以想見將有一大堆這些東西 Deng Jianpeng. Qingdai minshi qisu de fangshi: yi Huangyan susong dangan wei kaocha zhongxin [Methods of Civil Litigation in the Qing Dynasty: Focusing on the Examination of Huangyan Litigation Archives]. Shehui kexue chubanshe, 2007.
老實說,如果拼音能代漢字,作為過渡期的漢語拼音方案早已成為歷史文件,但看來可能未來五十年漢字仍會保留。以前書目有漢字,懂的懂,不懂的看了漢語拼音也是不懂,取消漢字除了可以減字數篇幅外不知有何好處。
漢字轉拼音及英文,最好最快仍是 Google Translate, 好處是它的拼音跟正詞法,其他網頁多是一字一拼音,而且人名地名不會大寫。缺點有二: 漢語拼音是overlay, 不能直接複製,另外它有拼音符號,我不需要。
我請AI寫個程式,輸入漢字,就轉為符合正詞法的拼音,沒有列出調號 (用了 Python 的 Jieba) , 可惜它不懂把人名地名大寫,英譯直接調用 Google Translate, 並且根據 Title Case 列出英文書名 (芝加哥18版好像說5個字母以下的用細楷)。搞了兩天,Monica, Claude, ChatGpt 都未能寫出符合需要的網頁版。今午退而求其次,用 Python,很快就寫好,而且有靈活性,可以自行添加修改詞語 [例如我雖加了”清”, 但”清代”仍是細楷, 要自行補加,但改了下次就會自動變大楷]。缺點是不能在網上用(待考)。所花的時間,足夠我把所有書名修改好,或者說,真的本末倒置。不過,也有點滿足感,自我感覺良好。另外, 其實還有不少細節仍要用人工修訂。
可是對著電腦太久,有點暈眩。…
結果
Python 程式碼,加入一些具體要求,可以靈活些