作者asid52714 (黑心人)
看板Python
標題[問題] 辨識影片中人聲起始時間
時間Fri May 17 09:42:29 2019
請問版友,
若我有一隻五分鐘的mp4影片,
想要辨識影片中的人講話時的起始時間。
例如:00:02 大家好
00:03 很高興今天能夠參與此次會議
並不需要辨識語音內容再轉文字,
只要能抓到起始時間即可,
不知道有什麼套件可以達成這個任務呢?
感謝閱讀。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.149.99
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1558057351.A.8F7.html
推 sma1033: 若你的影片包含了除了人聲以外的聲音,那這個問題就很難 05/17 11:17
→ sma1033: 反之,若影片裡的聲音非常乾淨主要都是人聲,那人工抽抽 05/17 11:18
→ sma1033: Feature,自己調一下應該就可以做個7.8成 05/17 11:18
推 sma1033: 自動上字幕這種事情大家都想做,但是技術上還是存在瓶頸 05/17 11:22
→ jiyu520: Voice Activity Detection (VAD) 05/17 11:46