libtabe/src/tsi-src/tsi.src而在完成編譯與安裝之後,其二進位的詞庫資料檔是放在
$(prefix)/share/tabe/tsiyin/目錄下,檔名為 tsi.db 與 yin.db 就是。現階段如果要增加 新詞時,必須修改 tsi.src 並重新編譯與安裝它。底下我們說明該檔 的格式,至於編譯方式與安裝方式請參考 這裡。
tsi.db 中每一行描述一個詞,每行三個欄位,如下:
一了百了 6 ㄧˋ ㄌㄧㄠˇ ㄅㄞˇ ㄌㄧㄠˇ 一人份 12 ㄧ ㄖㄣˊ ㄈㄣˋ ㄧˋ ㄖㄣˊ ㄈㄣˋ 一刀 259 ㄧˋ ㄉㄠ 一刀兩斷 6 ㄧˋ ㄉㄠ ㄌㄧㄤˇ ㄉㄨㄢˋ第一個欄位就是詞本身,第二個欄位是數字,代表這個詞的詞頻,第三個欄位是 這個詞的完整注音碼。其中每個欄位間是以一個半型的空白鍵隔開,而第三個欄 位中每個字的注音之間,卻是以一個全型的空白鍵 (0xA140) 隔開,而且第一個 字之前與最後一個字之後都不能再有任何的全型空白,這一點要特別注意。
如果一個詞中有多種讀音,如上例第二個詞中,"一人份" 的 "一" 字可以讀成 一聲或四聲時,則這兩種讀音可以如上例完整列出來,請注意兩種讀音之間還是 以一個全型空白相連。
因此,如果您要加入一個新詞時,只要按照此格式加入即可。至於第二欄位的詞 頻部分,您可以直接填入 0 即可。而第三欄位的注音部分,您可填可不填,如 果不填的話,則在編譯時程式會試圖找出所有字的可能破音字組合,來補上第三 欄位。然而,我們建議您最好還是填一下第三欄位,原因是如果不填的話,由程 式自動補上可能會造成一些奇怪或根本不可能存在的讀音出現,而佔用系統資源。