推 poseidons:收到! 辛苦了~ 01/15 04:16
wav 檔在這個目錄:
/home/kenneth/Speech/corpora/RM1/wav
raw (headerless PCM) 檔在這個目錄: (16 kHz, mono, 16-bit, Intel byte order)
/home/kenneth/Speech/corpora/RM1/raw
每個目錄底下各有五個子目錄, 對應到 training set 跟四個 test set
ind_trn109 -> training set, 3990 utterances
ind_feb89 -> test set for Feb.89 eval, 300 utterances,
這是我們預定的 test set
我挑了幾個檔案來聽, 大致上應該沒有問題... (不過你還是再挑幾個聽聽看)
接下來修那幾個檔案, down-sampling, FaNT 就交給你了
等你那邊準備好(你的) baseline MFCC feature (clean train/test) 後麻煩跟我說
我要把 model training 跟 testing 的流程試跑一遍
因為現在要做 8 kHz 的版本, 之前的 initial model 不適用
還要研究一下 single-pass retraining 比較好,
還是用 forced-aligned label 來 initialize 比較好
我兩種都會試試看
除了 initialization 以外,
其他的 scripts 大致上應該都可以直接沿用
等我確定比較好的方法以後
就會把後面的 HERest 跟辨識算正確率全部用 script 串起來
到時候你把 feature list 餵進來就可以了
暫時先這樣 再討論~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.230.27.73