convolution的公式 不是就是h[k]x[n-k]?
你自己是不是把定義搞錯? 誤以為反向convolution?
接著在有修過語音方面的課 應該有教過LPC/ pitch等等...
該書用的就只是簡單的比較每個音的pitch罷了
由廣義想法 你可以把pitch想像成簡單的tone
而數字的單音都差蠻多 所以當然很好做...
這種簡陋的語音辨識 拿來做口語辨識應該會很慘吧
我記得真正的語音辨識又分母音子音抽取等等等 難多了 @_@
※ 引述《elvis5357 (zz)》之銘言:
: 自己對於信號有一點問題
: 因為我之前有看過ㄧ本專題本
: 題目是有關語音滑鼠
: 就是喊1.2.3.4
: 滑鼠會自動上下左右
: 在該專題本裡面
: 她們所使用的語音識別方法是我在別本書上沒看過的
: 其他的書可能都不外乎
: {
: 擷取特徵參數用MFCC
: 識別方法用的是DTW(Dynamic Time Wrapping) or HMM
: }
: 可是她們用的方法是把語音
: 先用樣本跟樣本反向的CONVOLUTION求得基準數值
: 然後在用輸入語音跟樣本反向CONVOLUTION求得的數值
: 兩個數值下去比較
: 然後越接近的就認定是那一個音
: 因為在信號系統的書上只看過CONVOLUTION
: 沒看過反向的CONVOLUTION
: 想請問這種方法的原理
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.133.134.198