作者secretfly (乂o賈霸死鬼o乂(Jquery))
看板Soft_Job
標題[討論] 做了一個替代typeless的開源語音辨識
時間Fri Jul 3 22:10:05 2026
來貢獻一下 為這個社會付出一下(?
我發現開源社群真的很棒 有人issue 有人PR的感覺真的很棒
緣起是之前typeless在脆上很紅 因為有分潤 所以一堆部落客在推廣
但後續又爆出資安疑慮 且收費也不便宜
所以我就網路上找了各種開源的語音辨識軟體研究一下
各種模型 以及該怎麼調整參數等等的
應該幾乎能做的功課我都做了 能試試看的模型我都試了
最後居然真的讓我找到滿意的效果!!!
於是打造出了SpeakSlow聲聲慢 速度超級爆炸快
模型使用 sherpa-onnx Paraformer
然後用本地規則去+標點(省下一個模型)
其中還有很多功能 我這裡就不多作介紹了
主要是windows版本在更新 Mac的話要通過朋友們回饋協助(暫時沒環境QQ)
官網:
https://jeffrey0117.github.io/SpeakSlow/
裡面也找的到REPO可以翻或是issues
也很開心
居然有被電腦王阿達寫文章介紹:
https://www.koc.com.tw/archives/646444
我完全不知道 是我自己google聲聲慢意外發現的
其實當初很早就想做語音辨識了 因為我有朋友耳朵不好 就有在雅婷逐字稿
後來該APP收費後他改用google的效果不好
那時候就有這個起心動念
這些一切技術都是建立在大家開源社群的貢獻 以及Claude Code的協助 很感恩
有興趣的人可以去裝來玩 也歡迎PR
我自己目前一天大概要講一萬字吧哈哈哈 因為vibe coding嘴砲流真的很爽
以上
謝謝各位前輩 終於明白開源社群的魅力是什麼了!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.165.243.219 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1783087809.A.7B4.html
※ 編輯: secretfly (1.165.243.219 臺灣), 07/03/2026 22:10:42
推 MoonCode: 07/03 22:17
推 Obama19: 別人提issue pr 只有一開始很爽 後面就知道累了 07/03 22:48
原諒我還太嫩 真的很開心捏
但確實剛剛才在社群上看到有人說一些不禮貌issue啥的
推 nashmvp: 推 07/04 00:11
謝謝 歡迎玩玩看欸!
推 abccbaandy: 累啥? 難道PR還會壓時程? 07/04 00:17
可能是指太多要看(?)求專家分享哈哈哈 開源真的很酷
※ 編輯: secretfly (1.165.243.219 臺灣), 07/04/2026 00:29:43
推 shane10222: 推 馬上試 07/04 00:53