看板 TW-language 關於我們 聯絡資訊
剛剛去玩了一下, 發現我想錯了. 他並不是有語法標記的語料庫. 他只是在提供發音. 之所以斷成這樣: 資訊 工程 學 研究所 應該只是因為他有這些詞的錄音. 這跟語法的標記大概無關. 他還有文白可以選. 板大是選了白話音吧. 如果選文讀,他就念hak8. 總之他就只是提供發音. 至於什麼時候該念那一種音, 他就無能為力了. 這個就需要加上語法的標記才做得到. 附帶一提, oh8 不見得是動詞喔. "大學"在廈門跟南洋都是叫做 toa7-oh8 他們來念"資訊工程學"的話, 我相信應該也是有許多人會念成 chu1-sin3 kang1-theng5 oh8 吧 只是台灣習慣念成 hak8. ※ 引述《skylm (NA)》之銘言: : ※ 引述《Richter78 (The Enigma)》之銘言: : : 我剛剛輸入「資訊工程學研究所」 : : 結果被斷句成: : : 資訊工程 學 研究所 : : 那個「學」被當成動詞唸成 oh8 : : XDDD : 可見這個斷詞的系統還不夠成熟. : 我不知道他背後有多大的語料庫作基礎. : 但是這個斷法看起來, : 這個系統在語意訊息的標記上是不足的. : 所以"資訊工程"可以當成學習的主體. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.219.2
Richter78:原來如此 Orz 218.166.58.239 05/20
Asvaghosa:他們沒有文言音? 11/28 15:43