詞庫檔 tsi.src 格式說明 (for libtabe-0.2 and above)

libtabe 的詞庫檔原始碼是放在:
	libtabe/tsi-src/tsi.src
而在完成編譯與安裝之後,其二進位的詞庫資料檔是放在
	$(prefix)/share/tabe/tsiyin/
目錄下,檔名為 tsi.dbyin.db 就是。現階段如果要增加 新詞時,必須修改 tsi.src 並重新編譯與安裝它。底下我們說明該檔 的格式,至於編譯方式與安裝方式請參考 這裡

tsi.db 中每一行描述一個詞,每行三個欄位,如下:

一了百了 6	ㄧˋ ㄌㄧㄠˇ ㄅㄞˇ ㄌㄧㄠˇ
一人份 12	ㄧ ㄖㄣˊ ㄈㄣˋ ㄧˋ ㄖㄣˊ ㄈㄣˋ
先見之明 17	ㄒㄧㄢ ㄐㄧㄢ4 ㄓ ㄇㄧㄥ2
一針見血 43	[ㄧ4,ㄧ] ㄓㄣ ㄐㄧㄢ4 ㄒㄧㄝ3
第一個欄位就是詞本身,第二個欄位是數字,代表這個詞的詞頻,第三個欄位是 這個詞的完整注音碼。其中每個欄位間可以是任意的半形空白鍵或 tab 鍵隔開。 注意到其中第一個與第二個詞條: 「一了百了」與「一人份」的第三欄位的注音 格式是與 libtabe-0.1 版的格式 相同的,也 就是說,這一版所能接受的格式是可以往前相容的,同時它也可以接受新的格式, 茲簡述如下:

因此,如果您要加入一個新詞時,只要按照此格式加入即可。至於第二欄位的詞 頻部分,您可以直接填入 0 即可。而第三欄位的注音部分,您可填可不填,如 果不填的話,則在編譯時程式會試圖找出所有字的可能破音字組合,來補上第三 欄位。然而,我們建議您最好還是填一下第三欄位,原因是如果不填的話,由程 式自動補上可能會造成一些奇怪或根本不可能存在的讀音出現,而佔用系統資源。