數字人文

王東波主編:《數字人文教程 Python 自然語言處理》(南京:南京大學出版社,2022年), 181頁,人民幣40元。

對於數字人文,我是實用主義、拿來主義,總之,是用得著的,我懂用的,就拿來用。

這書顯然是我用得著,但我不懂用,只能奉若天書,束置高閣了。

數字人文,處理的是文本,這書由字詞起講,快速介紹字形字型字體編號等概念後,就進入繁簡互譯、字體自動辨識的內容。字之後是詞,包括如何自動分詞、自動標注詞性等。再後是文本提取、特徵(如情感、意境等)分類。最後是典籍的機器中英、文白翻譯。我每頁都翻過,但大概只能略懂最初的10頁而已。

所有程式都是用Python來寫的,即是說,只要學懂這種語言,就可以用機器處理不少字詞句段篇的辨識、分類、分析、翻譯等工序,省下腦細胞做更高深的研究,是治學神器。

可惜,我不懂。