看板 Soft_Job 關於我們 聯絡資訊
※ 引述《Leon (Achilles)》之銘言: : : 第一步是做二值化, : : threshold的取法是先找中位數, : : 接下來利用低於中位數的值去計算平均值,標準差 : : 偶後利用這個平均值標準差產生threshold : : 這部分是因為每張圖片的亮度差很多,所以採用這樣的做法 : 這樣做會有嚴重的問題. : shot noise, 或是打光不均勻, 你會得到一個很差的 binary image 請教一個問題,是說類似這個情況嗎 http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712532&p=12 A是斷掉的,中間有一條白線 (註: 白線255, 底色是淺灰色 我放上去的圖底色是255) 當時確實也碰過,這邊是用heuristic的方式救回來 : 而且救不回來. : 一般的作法是先用 histrogram normalization, 感謝 這邊讓我學到一課!! : 解決亮度不均勻. : 再用 filter 幹掉 shot noise. 上面禁止使用filter的理由蠻多的 例如.... "雜訊不是不好,我要保留雜訊" "不要隨便加一道filter上去" 所以當我第一句話開口說要加上filter的時候,就直接打槍了 : 當然, 所有的作法都是 heuristic, 但是直接 make it into binary : 除非你有特殊的要求, 不然問題很多. 確實是有特殊要求沒錯 因為接手recognized的人想要一張二值化的圖來取某些特徵 而當時我的想法是 "既然都要二值化了,何不先做二值化,用二值化的圖來求出resize的縮放比例" 這邊誠如原po所講的,第一步沒做好,後面都是只能補破洞 因為後面的做法大概就是設一堆magic number,解決有限case 無法解決的,丟入辨識失敗,讓辨識失敗率能接受就好 (汗) 那篇paper不錯,因為接手這個案子的時候,我完全沒碰過OCR : 上面聽起來真是混亂. : 我的 comment 是, 你第一步做得不好, 後面應該就.. http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712531&p=11 類似這種感覺 一個P字旁邊有一個點,而我必須能把這個點移除. 這邊當時也是magic number解決有限case 假如L大方便的話,希望能得到您的建議 : 用 hough transform 是對的, 因為圖片 (鈔票) 很固定 : 你可以加入一些條件去限制住 bounding box 的範圍. 第二個問題的對象並不是鈔票,這邊我沒講清楚,很抱歉 http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712533&p=13 這是當時碰到的一個case 而我寫出來的code,會容易連同旁邊的框線也一併抓進來 例如灰色的方形,實際上edge比較強的反而是旁邊的黑框. 這邊自己的做法是,把圖片丟入一個轉換 ---- \ \ --------- 類似這樣的函數,讓灰色的方形的edge強度增強 (這邊原本是用tanh, 為了加速所以改成piesewise linear) 缺點是本來不應該有edge的地方,也會被加強edge,而抓出多餘的方形 http://www.wretch.cc/album/show.php?i=hidog&b=2&f=1135712534&p=14 這是另一個case 旁邊的黑線可以想像成是ㄧ維條碼 而我的code會在條碼區找到方形 XD (回去追hough line的資料,這些線確實組成了方形....) 綠色方形旁邊的黑點是圖片的一部分 這邊我的code會抓出多個方形,目前是回報最小的那個 框線跟方形的的距離最近大概是3~5pixel左右 而這邊,我當時沒辦法只靠自己思考想出解決方式的做法 (hough line報了一堆方形回來,必須精準的挑出哪些是正確的) : 我知道的都是一些很 advanced 的作法, computational power 要求都很高. : 舉個例子來說吧, 更難的人臉範圍 bounding 在 Iphone 上都做得那麼好了 : 你的問題, 也絕對有人已經處理過了. : So, keep google.. 感謝 :) 下面這邊算是閒聊吧 面試的時候我有提到,我沒有影像處理的經驗 主管當時說,沒關係,進來在學就好 進來後說,上班是工作,學習是下班後的事情 XD (不過這邊並沒有管到非常死, 只是常被念看一堆資料能幹嘛,找paper是回家的事情之類的) 這似乎是台灣常有的思維,請不起有經驗的,就隨便找一個人進來... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.160.171.183 ※ 編輯: hidog 來自: 118.160.171.183 (07/29 09:15)