看板 NTUEE_Speech 關於我們 聯絡資訊
wav 檔在這個目錄: /home/kenneth/Speech/corpora/RM1/wav raw (headerless PCM) 檔在這個目錄: (16 kHz, mono, 16-bit, Intel byte order) /home/kenneth/Speech/corpora/RM1/raw 每個目錄底下各有五個子目錄, 對應到 training set 跟四個 test set ind_trn109 -> training set, 3990 utterances ind_feb89 -> test set for Feb.89 eval, 300 utterances, 這是我們預定的 test set 我挑了幾個檔案來聽, 大致上應該沒有問題... (不過你還是再挑幾個聽聽看) 接下來修那幾個檔案, down-sampling, FaNT 就交給你了 等你那邊準備好(你的) baseline MFCC feature (clean train/test) 後麻煩跟我說 我要把 model training 跟 testing 的流程試跑一遍 因為現在要做 8 kHz 的版本, 之前的 initial model 不適用 還要研究一下 single-pass retraining 比較好, 還是用 forced-aligned label 來 initialize 比較好 我兩種都會試試看 除了 initialization 以外, 其他的 scripts 大致上應該都可以直接沿用 等我確定比較好的方法以後 就會把後面的 HERest 跟辨識算正確率全部用 script 串起來 到時候你把 feature list 餵進來就可以了 暫時先這樣 再討論~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.230.27.73
poseidons:收到! 辛苦了~ 01/15 04:16