精華區beta CSSE 關於我們 聯絡資訊
※ 引述《invalid (everlasting)》之銘言: : 常常在網路上看到他們徵求受測者(不知道是不是) : 一般來說這種東西大多是以類神經網路弄成的 : 也就是說要Train... : 要讓他聽的懂你說的話前要先訓練一下 : 不然錯誤率就是很高啊 : Train的好的話,當然就用的很順啊 : 不過問題就是就算是同一個人,有的時候聲音語調還是會差 : 更不用說取樣程序的問題了( 換了新的麥克風? ) : 要找出一個能夠通用的方法應該是大瓶頸吧... 這邊說的train, 不一定是類神經網路, 語音辨識有人是用類神經網路 在做, 但主流還是用hidden Markov model, 利用機率, 預先建好的資 料是某些人大量的原始資料統各個子音母音的參數, 這些參數是許許 多多的機率分布, 每一個人的聲音都不一樣, 所以這些參數要調整到 適合某個使用者. 大致上最基本的每個音的分別, 不算是很困難, 但是再上去怎樣組句 選字, 瞭解語意, 就牽涉到人工智慧, 是一個很困難的問題. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.132.247.198
kevin190:簡單的說, HMM只能讓電腦聽出聲音, 但卻不瞭解句子的意義 01/18 23:40