看板 Python 關於我們 聯絡資訊
我有一本英文單字書 mp3檔案, 每個檔案是一個章節全部單字+例子 每個章節的mp3檔案是 該單元的 單字唸完後 會再念一個例句, 在念下個單字&例句 後面依此類推 我想製作成anki 去複習單字, 我使用下面網址程式碼切割出來大致都沒問題 https://gist.github.com/shihyu/8199c1839c565169f7552e419d29b829 但單字發音之前會先念單字數英文發音, 我不想要念單字發音之前先念個英文數字 想不到有什麼方法可以切掉英文數字發音, 有使用過pydub 有什麼建議嘛? 下面兩個網址我想切割的單字檔案 http://www.mediafire.com/file/51427vdcsfkcjsh/0002.mp3/file https://www.mediafire.com/file/ln5knyhs1kzgr66/0077.mp3/file 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.157.77 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1570450421.A.DB6.html
sma1033: 這個問題的答案應該會依照「英文數字」的資料樣貌來決定 10/07 23:19
sma1033: 不同的「英文數字」會有不同的作法,放幾個樣本給大家看? 10/07 23:20
sma1033: 如果連資料長什麼樣子都沒不知道的話,很難推薦有效作法 10/07 23:21
※ 編輯: yshihyu (175.182.195.53 臺灣), 10/08/2019 20:40:25
sma1033: 開頭的英文數字跟後面的單字發音中間會有很明顯的停頓 10/09 19:29
sma1033: 最簡單的做法可以用振幅的波谷來分割切開就行了 10/09 19:31
sma1033: 更進階一點的作法可以用speech segmentation的套件像是 10/09 19:38
sma1033: 這種資料內容還滿規律的,理論上應該很容易做到才是 10/09 19:42
yshihyu: 我使用 inaSpeechSegmenter 可以分析出來, 10/11 21:27
sma1033: 唉唷,不錯喔~ 10/12 23:56