精華區beta HOT_Game 關於我們 聯絡資訊
閒聊一下(下面還有正事)。 雖然我平常也是寫程式的,但寫OCR是第一次。也是第一次自己寫的程式, 可以讓這麼快的電腦 "發揮他的意義" (XD)。但這不是我的本行.... 坦白講我是一堂工程數學都沒上過,一節影像處理也沒學過。(核爆) 目前各位看到的效果,基本上是接近我個人的人力與物力的極限。 也就是說,這個東西未來能改進的有限,目前的辨識率大約是彩色30~34%,黑白1~3%。 (強制辨識率是包含一般辨識的) 如果有誰有心願意接手,我非常樂見;或是再開發一套屬於你的OCR。 我可以告訴你我所知道的事物(不過都是不學無術來的XD), 當然你至少必須有一點這方面的基礎。 磨了一個半月,程式功力是增進不少 :P 不過我覺得我做的也夠多了,真的很累。身體也被折磨了不少呢。 對了,OCR 打字兵器叫做 "想交女友",但是還是交不到,所以OCR外掛兵器就叫做 "人蔘" 吧? 比當歸大一點,沒什麼....(各位覺得怎樣? 不好聽再換...XD) ==================================== 廢話了這麼多,該辦正事了。 為什麼我要不厭其煩的測試這些數據? 坦白說現行的ocr有一個bug..... 有一段數據是錯誤的,只是被我手動recover掉了。 (recover時還覺得奇怪....程式的反應怎麼跟預期差這麼多 XD) 也就是說,現在的OCR的一般辨識的成功率fine tune是"賽"到的。 那,現在就是把數據調回來後重新fine tune。 不過真的tune不出來也不會死人啦,現在用的好好的 XD TESTTYPE3 http://www.happyupload.com/download.php?file=7cf14836eb35a8f97bb4230a1252eabe 希望多一點人參測。我今天為了測試已經累積打了五千張圖了,眼花手麻,如果測試的 人還是很少,東西很難tune出來... 那...我就不管了 Orz 一樣,打字就好,然後回傳兩個log檔。感謝...... (只有一個就傳回一個)... PS....回報完後請砍掉這兩個檔案以免重複回報...... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.53.73
alannlin:辛苦了,敬禮!(  ̄□ ̄)/ <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) 08/02 16:16
tigerking:辛苦了 現在的OCR已經很不錯了 08/02 16:18
kkreve:完了,小的手殘按到不該按的啦… 08/02 16:19
freddywey:上班中不可能打字,我先抓,晚上在打 08/02 16:19
kkreve:如果檔案被刪拜託wahaha99元帥再上傳一次,真的很對不起 08/02 16:19
tigerking:請問要打多少個圖之後再回傳log檔呢? 08/02 16:20
ryanchen:真的辛苦了 要打幾張圖再回傳比較好? 08/02 16:21
wahaha99:樓上...高興就好 但是不要太久orz 收件完畢就太慢了XD 08/02 16:21
hotahaha:辛苦了 <(_ _)> 08/02 16:22
xsonic:程式出現奇怪的錯誤 08/02 16:22
hotahaha:test2現在回傳還有用嗎? 08/02 16:22
wahaha99:....TEST2現在回傳....用不上了 orz 08/02 16:23
wahaha99:什麼樣的錯誤? @@ 08/02 16:23
wahaha99:因為TEST2回傳的人很少,所以我沒有特別公佈就處理了 08/02 16:23
windfin:wa大辛苦了 雖然某人學過工數1234但是連個鬼也寫不出來阿 08/02 16:22
hotahaha:我的也跑出錯誤了 08/02 16:25
wahaha99:目前預計收件到晚上十點? 這樣OK嗎 @@ 08/02 16:24
windfin:請保重身體 點點點大神會賜給你人蔘小蘿莉的 08/02 16:25
RobertFLCL:http://www.pixnet.net/photo/FLCL/60807182 08/02 16:26
juiljji:test2的log很短,我以為要多一點再回傳 囧 08/02 16:27
RobertFLCL:出現錯誤? 08/02 16:27
tigerking:打一百個OK嗎 會不會太少? 08/02 16:28
wahaha99:不是啊,那只是一個確認.....@@ 有錯誤的能回報一下嗎? 08/02 16:27
wahaha99:不會...有打就好...(但希望至少你能打到第一個錯誤為止) 08/02 16:28
hotahaha:http://0rz.tw/892Uq 錯誤圖 08/02 16:29
hotahaha:辨識出來owy 我改ovy送出 就錯誤了 08/02 16:29
xsonic:錯誤有出現過兩次 但是之後又沒出現了 08/02 16:29
tigerking:我剛剛也有打一個錯誤 改成程式要的英文才過關 08/02 16:30
tigerking:要不然也是跟之前大家回報的一樣 08/02 16:30
tigerking:這個版本的自動辨識率好像比Ver0.2低? 08/02 16:31
xsonic:印像中那個錯誤是轉形的時候發生的 (???->double) 08/02 16:30
RobertFLCL:http://www.pixnet.net/photo/FLCL/60807564 08/02 16:31
RobertFLCL:按了確定之後就變這樣囉~ 08/02 16:32
juiljji:之前打test2有五個錯,test3到現在還沒錯 08/02 16:35
tigerking:請問要怎麼存log檔以及回傳log檔 08/02 16:36
juiljji:關掉程式後,目錄內就有log檔了 08/02 16:37
tigerking:謝謝樓上 那剛剛程式果然是自己關掉的 所以沒有log檔 08/02 16:38
tigerking:我剛還以為我不小心把程式關起來了 08/02 16:38
hotahaha:不過因為錯誤而關閉的話沒有log 08/02 16:38
fire811:判斷錯誤 修改後 關閉+1 08/02 16:40
kkreve:判斷錯誤 修改後 關閉+1 08/02 16:45
tigerking:判斷錯誤 修改後 關閉+1 08/02 16:46
tigerking:我正常關閉程式以後還是沒有log檔耶XD 只有一個TOTAL 08/02 16:47
siriusmax:請問要打完要回傳什麼檔案嗎@@? 08/02 16:47
※ 編輯: wahaha99 來自: 218.166.53.73 (08/02 16:49)
wahaha99:已修正...請重新下載 (真是搞笑的BUG XD) 08/02 16:49
wahaha99:很抱歉造成困擾了 orz 08/02 16:50
hohiyo0213:敬禮!(  ̄□ ̄)/ <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) 08/02 16:51
※ 編輯: wahaha99 來自: 218.166.53.73 (08/02 16:52)
wahaha99:只有一個log檔就傳回一個就好 08/02 16:53
GOKUN:這篇被轉到2ch了 XDDD 08/02 16:54
tigerking:TotalRCV:65 Total Send:60 Total OCRed:6 Total sucs:6 08/02 16:54
tigerking:我打完之後只有跳出這個TOTAL 內容就是上面那個 08/02 16:55
tigerking:然後之前打了接近一百個 然後出現錯誤程式強制關閉 08/02 16:55
wahaha99:嗯...好吧 既然只有這樣那就這樣啦 XD 我會記錄下來的 08/02 16:55
tigerking:辛苦了 加油~XD 08/02 16:57
ryanchen:打了一百多個 判斷不同跳掉才看到這篇~一個檔案都沒留:( 08/02 17:03
wahaha99:sorry orz 08/02 17:07
tacototoro:把y修改成i送出就錯誤了... 08/02 17:10
wahaha99:樓上 ...請重新下載 sorry orz (原log保留繼續用) 08/02 17:10
ryanchen:wa大客氣了 我們只是幫忙打而已 搞兵器比較辛苦啦 08/02 17:14
alannlin:回報: http://0rz.tw/e82Y1 08/02 17:18
blestadsl:先回報bad.log http://0rz.tw/4b2Tu 08/02 17:24
apenguin:請問log檔要回傳到那裡?我是菜鳥... 08/02 17:23
wahaha99:內容很少可以寄站內信給我 或是上傳到happyupload 08/02 17:25
juiljji:BAD log好像沒累積 08/02 17:26
blestadsl:是有錯就回報,還是一陣子後一起回報? 08/02 17:28
wahaha99:少部份狀況不會加入BAD 就是錯誤長度不一致時 08/02 17:28
wahaha99:這種無法分析 orz 08/02 17:29
wahaha99:過一陣子再回報(請累積到一個量...除非你打算做別的事了) 08/02 17:29
※ 編輯: wahaha99 來自: 218.166.53.73 (08/02 17:30)
apenguin:happyupload file=4de3e87378b0192fd5cf918b2d17462 08/02 17:31
wahaha99:樓上你少一個字 orz 我沒法下載 08/02 17:39
apenguin:sorry file=4de3e87378b0192fd5cf918b2d174621 08/02 17:46
npcknr:回報log:http://tinyurl.com/yudflm 08/02 17:57
npcknr:回報BAD:http://tinyurl.com/23rxhl 08/02 17:57
wahaha99:樓上你的是TEST2的 Orz 08/02 18:04
windfin:http://myurl.com.tw/r75l 好像要先暖機 第一次開好lag 08/02 18:14
windfin:有時候自動焦點會取不到 08/02 18:16
apenguin:Total file=5bddc1bee2536603297bdf3ea9f43000 08/02 18:26
apenguin:BAD file=4c2aeb71a9b9d7b4c7ffd416015e44a6 08/02 18:27
apenguin:有把上一次LOG刪除後再重新打字...要去覓食了... 08/02 18:28
wahaha99:感謝各位 08/02 18:35
ryanchen:http://0rz.tw/872Tp 打了200個 08/02 19:19
kkreve:第一次測試回報 http://0rz.tw/ca2SX 這樣對吧? 08/02 19:33
kkreve:total log http://0rz.tw/412PM 希望有幫上忙 08/02 19:38
cherrywish:wahaha大辛苦啦,看到OCR成功認證瞬間真的很感動>///< 08/02 20:15
> -------------------------------------------------------------------------- < 作者: wahaha99 (成為鄉民中道的力量) 看板: HOT_Game 標題: Re: [雜文] 閒聊關於OCR二三事 & TESTTYPE3 (已修正) 時間: Thu Aug 2 20:44:53 2007 感謝各位的踴躍參與....收件到10點就好...目前資料已經差不多了 目前使用中的ocr系統是 12%辨識執行率 84%辨識成功率 今天新測的.... 10%辨識執行率 89%辨識成功率..... ......沒有決定性的差異..囧..還是必須交付程式去大量跑 orz 接下來仍有幫忙意願的請勾起 "工程模式" 收圖 就打字兼收圖檔 (log檔就不必了) 屆時請把收到的jpg打包傳給我 (越多越好!) 感謝! (包括 0.22版或TESTTYPE2都可以) --- 目標15%辨識執行率 90%辨識成功率 (有可能嗎?) 先去睡覺 orz 睡覺時間到了...(怪異的傢伙) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.53.73
bleach135: 敬禮!(  ̄□ ̄)/ <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) 08/02 20:46
juiljji: 敬禮!(  ̄□ ̄)/ <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) 08/02 20:46
juiljji:我剛睡醒 囧 08/02 20:47
K122324090:等等有日本小町DJ又會出現 你睡覺包准後悔 @@" 08/02 20:46
hatebus: 敬禮!(  ̄□ ̄)/ <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) <( ̄ㄧ ̄ ) 08/02 20:47
hatebus:萌町出現時間好像12點整? 08/02 20:47
hatebus:9 10 12 點都有 真是比浮I還浮 08/02 20:48