[語音] 長文, RM1 轉好的語音檔在這

作者wazowski (ludan)

看板NTUEE_Speech

標題[語音] 長文, RM1 轉好的語音檔在這

時間Tue Jan 15 04:11:36 2008

wav 檔在這個目錄: /home/kenneth/Speech/corpora/RM1/wav raw (headerless PCM) 檔在這個目錄: (16 kHz, mono, 16-bit, Intel byte order) /home/kenneth/Speech/corpora/RM1/raw 每個目錄底下各有五個子目錄, 對應到 training set 跟四個 test set ind_trn109 -> training set, 3990 utterances ind_feb89 -> test set for Feb.89 eval, 300 utterances, 這是我們預定的 test set 我挑了幾個檔案來聽, 大致上應該沒有問題... (不過你還是再挑幾個聽聽看) 接下來修那幾個檔案, down-sampling, FaNT 就交給你了等你那邊準備好(你的) baseline MFCC feature (clean train/test) 後麻煩跟我說我要把 model training 跟 testing 的流程試跑一遍因為現在要做 8 kHz 的版本, 之前的 initial model 不適用還要研究一下 single-pass retraining 比較好, 還是用 forced-aligned label 來 initialize 比較好我兩種都會試試看除了 initialization 以外, 其他的 scripts 大致上應該都可以直接沿用等我確定比較好的方法以後就會把後面的 HERest 跟辨識算正確率全部用 script 串起來到時候你把 feature list 餵進來就可以了暫時先這樣再討論~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.230.27.73

推 poseidons:收到! 辛苦了~ 01/15 04:16