思如泉湧

最近起來的時候總是思如泉湧,有好些新意念想實試試,趕快在紙上記下。聽說睡覺時大腦在重組思緒,或者日有所思,夜有所夢,醒來就有新意念。但願如此。

今午聽了一個Seminar,現場僅4人,網上大概有十個八個吧。這次主題是 digital humanities,台譯數位人文,大陸好像是譯作數字人文,中國香港當然沒有選擇餘地。主講的是法文的高級講師,他介紹了他參與的一項國際合作項目,是整理一位法國作家的書信。工作極其繁煩,基本上就是在文本加註釋,但註釋不是文字解釋,而是用電腦語言加註,例如作者姓名前後加標記。性質有點像網頁,但標記則較自由,所以叫xml, x是 extended 之意,即比網頁的 html 更具彈性。但為了同行之間能互相溝通,於是另有 TEI,即 Text Element Initiative, 作為國際通用標準。

例子是這個,貌似網頁,但標記是不同的。

一封幾十字的信,要用幾倍於字數的標記,例如日期,收信人等等,另外為存真貌,又要用標記標明某行在某角落等等,極端鎖碎。我估一封信要用幾天才能完成。至於是否有用,用的人當然認為十分有用,尤其在建構人物關係圖、地理活動範圍等有具體的時地人事資料的文獻,確可以建立更立體的面貌。不過窮一生之力,也不能做得太多這種工作,可能是勞而少功。當然,合作是出路,但這談何容易。

我聽這講座,是想用在我的研究上,因我的研究主體也是一堆書信,但我的書信都是經處理過的,時地人已無法確考,所以常用的關係圖、地理圖等全用不著。但我認為我的一堆書信身份仍是明確的,外國教士、本地神父、教徒、非教徒、衙差、狀師、地保、紳董等在信中屢屢出現,或者可以作些聯繫。

哈佛、中研院、北大共同創建了中國歷代人物傳記資料庫,可以從中一睹數位人文的成果。
https://projects.iq.harvard.edu/chinesecbdb/home