[討論] 為何版上討論語音的很少？

作者ice80712 (打臉腦粉)

看板DataScience

標題[討論] 為何版上討論語音的很少？

時間Wed Feb 20 00:38:13 2019

如題，深度學習首先最成功的應用是在連續大詞彙的語音識別上，印象中是2011年吧，往後更延伸出不同的模型架構，從傳統的gmm-hmm到dnn-hmm，以及chain-tdnn，還有端到端的ctc架構，除了上述的語音識別(ASR)之外，還有關鍵詞識別(KWS)，說話人識別/聲紋識別，語音合成(TTS)，大概是這幾個方向(不討論NLP)，為何版上討論這些相關的主題如此之少？語音市場小？門檻比較高？這陣子在看相關的文章都是對岸寫的。 ----- Sent from JPTT on my Sony G8142. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.199.75 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1550594296.A.A0E.html

推 f496328mm: 語音 google 幾乎做到完美了，串個python api就結束了 02/20 01:01

推 yiefaung: 這裡本來就不適合做深度討論人太少了社群生態起不來 02/20 01:27

→ j6cl3: 真的? 台灣菜市場日常對話能完美? 02/20 01:48

推 michellehot: 你可以把看到有趣的討論翻成繁體po上來 02/20 08:27

→ michellehot: 就會有人討論了 02/20 08:27

推 sma1033: 語音識別跟語音合成難度都偏高，業界會做的都很保密 02/20 09:40

→ sma1033: 一般程度的學生做出來的東西品質又都很爛，稱不上堪用 02/20 09:41

→ pipidog: 這版不是討論語音少，而是討論任何主題都很少 02/20 17:54

→ bobju: 太專業了 02/21 11:46

推 whsunset: 門檻比較高，做的人比較少，很多 work 不是 end-to-end 02/21 13:47

推 sma1033: 有價值的東西，資訊不會隨意流出來，語音相關技術很值錢 02/22 10:32

→ pups003: 1樓確定？ 02/24 17:33

推 chobit199685: 語音技術很貴尤其是音樂生成因創作價格是信仰值 03/06 21:23

→ roccqqck: 沒公開讓別人transfer learning的自然少人做 04/12 19:04

→ roccqqck: 稿很久也根本看不到別人車尾燈 04/12 19:06