看板 Python 關於我們 聯絡資訊
請問版友, 若我有一隻五分鐘的mp4影片, 想要辨識影片中的人講話時的起始時間。 例如:00:02 大家好 00:03 很高興今天能夠參與此次會議 並不需要辨識語音內容再轉文字, 只要能抓到起始時間即可, 不知道有什麼套件可以達成這個任務呢? 感謝閱讀。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.149.99 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1558057351.A.8F7.html
sma1033: 若你的影片包含了除了人聲以外的聲音,那這個問題就很難 05/17 11:17
sma1033: 反之,若影片裡的聲音非常乾淨主要都是人聲,那人工抽抽 05/17 11:18
sma1033: Feature,自己調一下應該就可以做個7.8成 05/17 11:18
sma1033: 自動上字幕這種事情大家都想做,但是技術上還是存在瓶頸 05/17 11:22
jiyu520: Voice Activity Detection (VAD) 05/17 11:46