作者cuteeleanor (長官好!!!!!!! )
看板AVEncode
標題Re: [請益] 使用SubToSrt的小疑問
時間Fri Mar 6 20:04:44 2009
※ 引述《nofearjohn (小基)》之銘言:
: ※ 引述《Isireath (Isas)》之銘言:
: : 我記得簡字好像有3種規格
: : 就向繁中的規格是BIG5一樣
: : 至於翻譯
: : 通常我不是用網頁的翻繁中功能
: : 就是直接找一個新的字幕
: 這裡分享一些自己的心得...
: 從sub裡面把字幕提出來之後...
: subtosrt實際上只是做一個OCR的動作...
: 為什麼會需要字字輸入...
: 因為中文字有很多字型...
: 有的時候會被壓扁一些...
: 有的時候會拉長一些...
: 對於subtosrt來說都是一個新字...
: 內建的字庫應該是用標楷體...
請問有方法可以解決這問題嗎??
我最近在識別一些DVD字幕 第一個步驟完成後
都是出現這種字體
圖:
http://gill2006.googlepages.com/2009-03-06_195940.jpg
導至於subtosrt 這軟體全部讀不出來
我的字庫有59萬字 應該是不至於一個字都辨識不出來吧
所以我查到這篇文章 我想應該就像n大說得這樣
當初字庫內建是標楷體 但是圖片內的字幕並不是標楷體
導致於系統判別出是新字.....
請問有方法可以讓圖片檔的字體跟系統內建的一樣嗎??
不然真的是會輸入到昏過去 ....
: 所以一遇到不同字體的時候你就得慢慢重新輸入啦...
: 而且還會有轉碼時"髮"會變成"發"這種狀況出現...
: 因為原始的字庫是簡體的...
: 輸入字的時候上面不是會有一行類似"甜美的果實來自於辛勤的勞動"之類的話...
: 就是這個意思啦...
有人有相關解決辦法嗎??
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 203.204.164.25
※ 編輯: cuteeleanor 來自: 203.204.164.25 (03/06 20:06)
→ esouxcon:不可能 作者講的 你在輸入字的時候 沒看到那些文字嗎? 03/06 20:07
→ esouxcon:你那個59萬字庫算啥... 網路上都嘛80萬的... 03/06 20:08
→ esouxcon:不過我自己的只有10萬... but 全部原生繁體字 03/06 20:08
→ esouxcon:你把bmp+srt壓成一個檔傳上來 我試試 03/06 20:10