Category: 電腦

再度啟航

屢敗屢戰。

南遊續錄應該可以重新出發了。(第N次重新出發,後台由cyberPanel改為cloudPanel再改為aaPanel, 用 Apache 不是 Nginx 架構,似乎跟以前的操作較接近,特別是怎樣用密碼選擇性保護檔案。)

基地核心是 linux 的 ubuntu 版本,用 aaPanel 作後台管理,可以容納多個網址,只要有個註冊網址,就可以掛在我的服務器,全離岸操作。

現在可以免費申請 SSL 證書,即是說可以用 https,而讀者不會再看到網站不安全的警告字樣。不過這 SSL 要續期的,也是免費,在 dathorn 每張年費 45 美金,比較之下省回不少。

這個新基地在新加坡,應該比澳洲快一點。我是堅定支持中國香港的,可是我用的平價 Vultr 公司不支援中國香港,亞洲可選的機房只有新加坡、南韓、日本等,同級的 Digital Ocean 亞洲也只有新加坡機房。當然,中國香港可以用阿里雲、騰訊雲等,機房在祖國,硬件網速應該完勝,但收費稍貴,我還是用美帝的 Vultr 了。

*事實證明我仍是愛國的。剛才查了一下,aaPanel 是宝塔面板的國際版,據說國際版不用綁定手機號碼,所以內地不能用。

** 2024.12.20
過去寄人籬下,分租機房,一切有房東打點,滿以為獨立自主,定能無縫適應,但世事怎會如此順利?
建好基地後,先建南遊續錄,免費申請了 SSL,準備日後把南遊錄也搬來。然後把文言十二篇搬過來,因為這些材料是已陳芻狗,即使搞亂了也沒有所謂。起初一切正常,但慢慢問題陸續浮現,例如常用的工具未能安裝,不過有解決方法,可是用 regex 方法搜尋時卻出現問題。regex 是分析搜尋文字的利器,不是完全不能用,而是某些搜尋方法不能用,使我的分析能力大打折扣。我感到奇怪,程式沒有變,在別的地方能用,搬到這裡卻不能用,應該是機器設定的問題。請教 monica,確定是資料庫版本不同的緣故。到舊址查看設定,再在新基地用相同的版本重建,果然成功。此番移居,monica 居功至偉。技術問題雖然可在論壇發問,但有沒有答案、答案是否針對我的情況等都說不準。AI 則不然,你把具體的背景情況問題給它,它會不厭其詳就你的情況分析並作出建議。雖然我知道它也是在網上搜尋,但它搜尋廣泛深入快速,最重要的是綜合分析,省去我不少時間。ChatGPT, Claude.ai 不接受中國香港用戶使用,Perplexity在程式方面似不理想,還是 monica.im 可愛。這些 AI 通常是約美金20元一個月,我四款都用過 (其實還有POE),始終覺得 monica.im 較合用。它不算快,有時會死機, 但功能較多。例如我截圖給它,它可以認字;把單據影給它,它可以計算並分析;請它寫個php, python之類的程式,它能化繁為簡,並能美化外觀;使用電腦時遇到問題,例如設定、使用等,它能把問題重新編寫,變為具邏輯層次的小步驟 [這種把問題問得更好的方法,甚好],然後給予實際幫助;請它寫文章,它四平八穩,但帶點AI腔;請它搜集資料,雖然有時有腦霧,鹿馬不分,但也有我沒有發現的東西,可供進一步研究。Google給你海量資訊,AI給你整理綜合,生活更覺方便。但資訊真偽難辨,十萬里上下四方,五千載今來古往,獨立慎思明辨,拒絕迷信盲從,仍是千古不易之道。

***2024.12.20
新舊兩站成功合併,一站一制,開啟新時代,舊的會隨風而逝…
現在有兩個基地,一個在美,一個在新,都要$$,怎樣長期發展,充份利用,正在盤算中。美國的有專業房東打點,應較穩定安全,只是空間較少,申請SSL證書貴;新加坡整體較平,空間較大,SSL證書免費,可以享受獨立自主,但隨時因技術失誤一click勾銷。目前想到的有幾個計劃,handujuyu.org 無端被學校打壓,列作禁止連結的網站,一個吉網剛剛建成,內容空白,卻無辜受壓,不明白,而handujuyu.online續牌費是.org的一倍,不化算,已註冊了 handujuyu.cc,先重複建網,到南極學校試試,如果連結無問題,則廢舊用新。教會網曾申請過SSL,現在棄用,可能有人因此未能登入,但因網址在官方機構註冊,我要看看能否搬,謀定後動。女兒的網站也有SSL,比較重要,暫時不搬,乖乖付上SSL年費美金。以前的各版牢騷,會用新網址合併為一,重門深鎖,劃地為牢,藏之名山,孤芳自賞。新站用 Google Drive 備份,另手動備份放 One Drive,兩個 Drive 的本地版放在中國香港和南極四五部電腦內同步,一切一切又在 pCloud 歐洲深山的機器雙重備份,希望資料明日之後仍會存在。

居無定所

如果這裡久未更新,可能我已移居 南遊續錄 了… 請點擊下址…

https://45.76.120.223/

請移玉步

我開通了南遊續錄,最終大概可能會把南遊錄也轉移過去。

今後這裡應該可能不會更新了,讀者諸君,請移玉步。

(**剛建好,就死機,稍後又可以了,不穩定,看來獨立是不可行的了。決定銷毀基地,以下內容,只供憑弔:

這幾天一直在努力嘗試自建基地,原因有二:第一,貪過癮,試新東西。第二,小數怕長計,省錢。

過去近二十多年都是租用共享機器,好處是一切有人專人代管,毋須操心,缺點大概只有一個,貴。我已試過中國香港、美國多間公司,近十多年一直用 Dathorn.com,25.2美金一個月,22.5G容量,可搭建無限個網站,用cPanel控制,服務很好,也樂意解答問題。

本來不打算變換,但為了一個 https 的 s ,搞了很久,想走回頭路,發覺問題更多,於是萌生轉移陣地,讓機器獨立,自主運作。其實也不是完全獨立,仍要租用設備,現在澳洲雪梨建基地,只是不與人共用機器地址而已,而且可以免費有 https 的 s,毋須年費45美金。缺點不少:第一,要自行建設,我又建又拆,先後試過十幾次,暫時找到可行方案;第二,要自行維護,特別是保安與備份,國防外交向來由中央代辦,現在一切後果自行負責,有點擔心;第三,把舊有的檔案轉到新址,難度堪比移民,只能螞蟻搬家,甚至可能最終要新舊並存,所以起了個南遊續錄,舊的暫不廢掉。

現行方案每個月少於10美金,能否行穩致遠,不敢說。

系統布置

這是我的函牘舉隅資料系統,耗時不少,希望不會浪費心力。

它的主要功能是檢索,其中包括:

1. 速讀查閱: 閱讀材料時,只要用鼠標選擇詞語,可自動顯示萌典或漢語大詞典的釋義。例如遇到幾次「合詞」,不知究竟指什麼,用鼠標查閱,萌典沒有註釋,漢語大詞典則有,解作「聯名上書」,且有書證。

2. 檢索全文: 有分類及全文,也可以用正則表達式。例如信末常用 以XX而XX 的套語,我用 “以([^。]*?)而(.*?)(?=。)” 這個表達式即可全部檢出。可選顯示檢索結果前後二十字或全文。

3. 字彚生卒: 詞語有固定的英譯,人名及生卒也常用到,隨手筆記,一旦要用馬上檢得。

4. 筆記: 主力還是用卡片抄筆記,但網遊時有所發現,可及時記下,之後再跟進。

頭昏腦脹

這兩天為了搞一個小玩意,荒廢學業,頭昏腦脹。

用英文寫好中國故事,要跟國際標準,例如書目一般用芝加哥手冊。最新的芝加哥手冊第18版,說出版地毋須列出,漢字可不列出,於是可以想見將有一大堆這些東西 Deng Jianpeng. Qingdai minshi qisu de fangshi: yi Huangyan susong dangan wei kaocha zhongxin [Methods of Civil Litigation in the Qing Dynasty: Focusing on the Examination of Huangyan Litigation Archives]. Shehui kexue chubanshe, 2007.

老實說,如果拼音能代漢字,作為過渡期的漢語拼音方案早已成為歷史文件,但看來可能未來五十年漢字仍會保留。以前書目有漢字,懂的懂,不懂的看了漢語拼音也是不懂,取消漢字除了可以減字數篇幅外不知有何好處。

漢字轉拼音及英文,最好最快仍是 Google Translate, 好處是它的拼音跟正詞法,其他網頁多是一字一拼音,而且人名地名不會大寫。缺點有二: 漢語拼音是overlay, 不能直接複製,另外它有拼音符號,我不需要。

我請AI寫個程式,輸入漢字,就轉為符合正詞法的拼音,沒有列出調號 (用了 Python 的 Jieba) , 可惜它不懂把人名地名大寫,英譯直接調用 Google Translate, 並且根據 Title Case 列出英文書名 (芝加哥18版好像說5個字母以下的用細楷)。搞了兩天,Monica, Claude, ChatGpt 都未能寫出符合需要的網頁版。今午退而求其次,用 Python,很快就寫好,而且有靈活性,可以自行添加修改詞語 [例如我雖加了”清”, 但”清代”仍是細楷, 要自行補加,但改了下次就會自動變大楷]。缺點是不能在網上用(待考)。所花的時間,足夠我把所有書名修改好,或者說,真的本末倒置。不過,也有點滿足感,自我感覺良好。另外, 其實還有不少細節仍要用人工修訂。

可是對著電腦太久,有點暈眩。…

結果

Python 程式碼,加入一些具體要求,可以靈活些

新的應用

昨天又請AI(今次用 Claude.ai) 做了個新東西,就是在課文上標注歷屆試題。基本原理仍是php, mysql, 但加入了 java等. Claude.ai 不支援中國香港,我用不被承認的BNO身份才能使用。它比 Monica.im 快一點,而且編程能力偏強。

1. 首先用 Snipaste (免費,Windows store 有) 把一條題目擷取到剪貼板。

2. 貼在 web.baimiaoapp.com 認字,100%準確。

3. 在內部參考檔,用鼠標黃色高光課文相關文句,點擊,可以加試題、註釋、筆記等。

4. 在公開覽閱檔,http://chinesetext.org/ 打開課文,有標記的字句有綠色高光,點擊打開、再點擊隱藏。

*5. 2024.11.22補
又增加了一項功能,用鼠標highlight選擇字詞,會自動在萌典找定義並顯示出來。定義沒有包括例句,以保持版面簡潔,如果是速讀的話,應該夠用,但也有連接可以查看完整釋義。萌典古今漢語均有,不錯的。

我估這些功能應該有點有處,如果我仍在教書的話。

告讀者書

為省開支,本站11月24日起只用
https://namyauluk.org
而不再用
https://namyauluk.com
因為這個加這個 s 要 45 美金一年,省回的45美金,可以讓我交兩個月網站寄存費,或申請另外4個網址。

具體影響是:
你可能收到警告


解決方法是:
1. 手動重新輸入網址,包括開始的http://, 記得不是https://
https://namyauluk.org
2. 毋須理會警告,信我,繼續前進。

待辦事項

過去曾學過做 CRUD (create, read, update, delete),就是做個介面來增刪修訂資料庫的內容。我用來做學生習作電子紀錄,讓學生一按就知道有什麼功課,何時繳交等等。個人方面,也用來做讀書筆記、記事簿等等。但都是虎頭蛇尾,原因之一是介面複雜,而那些程式只是東抄西襲,不懂個中原理,想修訂也無從入手。

今天請AI做了這一個,配合蕃茄工作法,有響鬧裝置,覺得好玩。我又用相同的版面,復活了久沒更新的待辦事項、書刊情報、金句箴言等多個網頁。至於正確中文,因古德明已封筆,沒有新材料,沒有改動,而錯別字庫,因已退休,不必更新,放棄了。

康熙字典

字粒的網頁沒有再更新了,但加入了一個部首檢索的輔助網頁。

博文鑄字公司的活字配字簿分兩部分,出俗字是常用字,入俗字就是其他字。出俗字與入俗字的說明,我只在中國香港的香港非物質文化遺產資料庫找到資料,恭錄如下:
「執字師傅需整齊有序地進行檢字、排版、印刷等工序。中文字粒有「出俗字」和「入俗字」之分,「出俗字」指常用字,集中放在字架特定位置以便使用,而「入俗字」則按部首和筆劃排列。中文字粒的字體分七種大小規格,從最小的「六號」至最大的「特號」,加上楷書、仿宋等字型樣式。」
(https://www.hkichdb.gov.hk/zht/item.html?b83c12c6-d448-4a7f-983a-a3bb0e8b0a19)

博文鑄字公司 (簡介是紐絲綸大學圖書館製作的)

因為這本活字配字簿是根據康熙字典的部首排序的,所以我抄考了中大的漢字多功能字庫的漢字部首索引(→這裡),把康熙字典的214個部首替博文活字配字簿做了個索引,並且可以在出俗入俗字表之間切換,這樣就可以快速檢索收字較少的部首位置。

暫告段落

這個十二篇小玩意花了我不少時間,暫告段落了。其實我已謝幕,不會重出江湖,搞這個純粹是貪過癮。
http://chinesetext.org/

小玩意的功能有
1. 閱讀全文,用宋體字,可調大中小字體。如果歷屆試題有考過詞解語譯的詞句,會用綠色高光,點擊會有權威答案。(不過權威答案沒有做,只是隨意加了幾個,如 “是” “淘” “病” 等字。)

2. 正則檢索,其實也可以當一般字詞檢索之用。(例: “於是”) 正則檢索可列出全文,或只列出含該詞語的前後各十個字。只列上下文或較易閱讀及比較。

顯示全文

顯示上下文各10字

3. 正則檢索可以用複雜的方法搜尋,何如 “.璧” 可以搜得 “奉璧” “易璧” “沉璧” 等。”廉頗.{0,20}藺相如” 可以搜得廉頗與藺相如之間相隔0-20個字的字段。

又例如我想抽取所有 “…者…也” 句,正則表達式是:
[^。,;:!?「\n]{1,}者,[^。;?]{1,}也[,;。!?]
以下是 Monica.im 給的說明
[^…]
表示否定字元集,匹配除了括號內字元以外的任何字元。這裡排除了句號、逗號、分號、冒號、感嘆號、問號、左引號和分行符號。
{1,}
表示前面的模式可以出現一次或多次
者,
精確匹配”者”字後面跟一個逗號
[^。;?]{1,}
匹配除了句號、分號、問號以外的任何字元,同樣可以出現一次或多次

精確匹配”也”字
[,;。!?]
匹配其中任意一個標點符號(逗號、分號、句號、感嘆號或問號)

這個正規表示式主要用來匹配中文文言文中常見的”…者,…也。”這樣的句式結構。
這個正規表示式對於處理古文文字分析特別有用,可以用來:
提取定義句
分析文言文中的句式結構
自動標註或高亮特定的語法結構
輔助文言文學習和研究

如果您需要修改這個正規表示式來匹配更多或更少的情況,我們可以調整其中的規則。比如:
如果想要限制”者”前面必須至少有兩個字,可以將 {1,} 改為 {2,}
如果想要包含更多的標點符號,可以在方括號中新增
如果想要排除更多的字元,可以在否定字元集 [^…] 中新增