看板 DataScience 關於我們 聯絡資訊
如題, 深度學習首先最成功的應用是在連續大詞彙的語音識別上, 印象中是2011年吧, 往後更延伸出不同的模型架構, 從傳統的gmm-hmm到dnn-hmm, 以及chain-tdnn, 還有端到端的ctc架構, 除了上述的語音識別(ASR)之外, 還有關鍵詞識別(KWS), 說話人識別/聲紋識別,語音合成(TTS), 大概是這幾個方向(不討論NLP), 為何版上討論這些相關的主題如此之少? 語音市場小? 門檻比較高? 這陣子在看相關的文章都是對岸寫的。 ----- Sent from JPTT on my Sony G8142. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.199.75 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1550594296.A.A0E.html
f496328mm: 語音 google 幾乎做到完美了,串個python api就結束了 02/20 01:01
yiefaung: 這裡本來就不適合做深度討論 人太少了 社群生態起不來 02/20 01:27
j6cl3: 真的? 台灣菜市場日常對話能完美? 02/20 01:48
michellehot: 你可以把看到有趣的討論翻成繁體po上來 02/20 08:27
michellehot: 就會有人討論了 02/20 08:27
sma1033: 語音識別跟語音合成難度都偏高,業界會做的都很保密 02/20 09:40
sma1033: 一般程度的學生做出來的東西品質又都很爛,稱不上堪用 02/20 09:41
pipidog: 這版不是討論語音少,而是討論任何主題都很少 02/20 17:54
bobju: 太專業了 02/21 11:46
whsunset: 門檻比較高,做的人比較少,很多 work 不是 end-to-end 02/21 13:47
sma1033: 有價值的東西,資訊不會隨意流出來,語音相關技術很值錢 02/22 10:32
pups003: 1樓確定? 02/24 17:33
chobit199685: 語音技術很貴 尤其是音樂生成 因創作價格是信仰值 03/06 21:23
roccqqck: 沒公開讓別人transfer learning的 自然少人做 04/12 19:04
roccqqck: 稿很久也根本看不到別人車尾燈 04/12 19:06