昨天下大雨,應該說是來紐西蘭以來最大的一場雨。幸好風不太大,可以打傘,但只可保住上半身,褲鞋襪全濕透。從山上的學校往下走,雨水沿馬路往下流。去水渠被平日狂風掃下的樹葉堵塞,馬路變成小河,只能大踏步走過去。
今天天氣好轉了,雖然仍未見太陽,但終算沒有再下雨。威靈頓大風,大風的好處是空氣相對清新,夏天不算太熱,衣物也算快乾。
今天全力把函牘舉隅電子化。之前介紹過的白描,真真不錯,但要接上它的伺服器,每次只可上傳50頁,而認字的速度也較慢,只能一次餵三五頁給它。今早它大顯神威,居然能以中國速度完成任務,於是我趁它表現突出就把全書給它認。每50頁1組,先從PDF檔拆出50頁,再變成50個JPG檔,再拉上去白描,一按制,兩三分鐘即可化為一個文字檔。
之後要校對,雖然認錯的字很少,但圈點多半認不出來,要人手添加,我就借此機會再讀一次,摘記要注意的地方。今天認了約13000字,我估要一至兩星期才能完成任務。
我把每一封信視為一項資料,分拆為若干元素放進Excel檔。我不是單純求個文字檔,我是要分析文字檔,所以要把每封信的元素拆開,例如有否結案,有否向上一級投函,誰人寫信,誰是他的對口單位等。完成後我會用php/mysql做個索引統計介面。教案的統計前人已有做過,最全面的是台灣的陳銀崑,但我想做的不是時間地點數量甚至類別,而是涉及的問題及交涉的方法。具體未有妙計,但輸入全文是第一步。
這裡要求每半年提交進度表,自訂三個目標,我的第一個目標就是把全書電子化,還加個 digital humanities 的名目以眩有司。