※ 引述《hidog (.....)》之銘言:
: 第一個可能是我的工作整個要停掉
: 第二個可能是我之前得罪主管
: 得罪的原因大概是六月底,狀況大概有兩個
: 當初要做鈔票字體辨識,需要先做字體resize,讓字體大小變的一致
: 因為字體會有髒汙 有打光不均的問題 所以主管要我先做調整對比度
: 當時他丟了一個式子給我,類似 x^5 的式子,要我用這個式子去處理圖片
: 我弄了半天,跑出來結果就是不對,他認為是我程式有錯,要我繼續去追資料
: 搞了半天,是式子有問題,還需要做一個hyper tan的轉換,跟max,min的一個normalized
: 我將這件事情回報上去,只是當時我的講法有問題
: 我: "你這式子錯了"
: 主管: "你就這樣直接說我式子錯??"
: 這部分算是我自己講話技巧不好orz 太白目了
我的一些建議, 大家互相研究一下.
你這個問題是 OCR 的 pre-processing,
這在 image processing 裡面已經做到爛了..
幾個可能的方向:
1. 去 google 人家怎麼做的.
2. 用 test dat set, 去證明不同演算法的 performance.
: 另一部分是字體的resize, 主管要我用moment的方法去做
: moment出來的結果是三個量 m20, m11, m02
: 他要我用 m20, m02 去決定resize的比例
: 當時我一樣是怎麼做怎麼錯,最後研究發現
: 這個問題應該是 m20, m11, m02 一起看
: 但是這個方法不適合,因為這個方法是會抓出一個接近blob形狀的橢圓
: 但是橢圓有方向性,圖片大小是 22*32 , 圖片太小不適合旋轉
: (因為這個原始問題的resize動作只能是微調)
: 並且部分字體形狀也不適合抓成橢圓, 這部分自己有寫證明, 就不多談了.
: 這件事情當時大吵了一架,最後是我自己去土砲
: 因為圖片只有22*32,土砲不難
: 當時主管則是說 "我看別人都是這樣做的,明明就可以"
: 好吧,如果只是用他給我的式子,我是真的做不到,請把我火掉吧orz
這叫 skew detection..
用橢圓不太對, 應該用兩條 line 去 bound 住一行文字.
我查了一下, 網路上能夠 download 的文章
http://cdn.intechopen.com/pdfs/11405/
InTech-Preprocessing_techniques_in_character_recognition.pdf
這篇把大致上該講的都有提到.
: 而在這個之後,我的主管常常強調幾件事情
: "我幹這行十年經驗,一堆東西早就做到不要做了"
: "就是因為我比你強,所以我是你主管"
: "你認為你的做法很好? 哈"
: 離職前最後的起衝突也是差不多的情況
: 他提的方法有一個致命傷,而我直到離職後,也還是想不到一個很好的解決方式
: 最後我發現,他的個性大概是....
: 不能隨便說他錯 不能隨便質疑他的做法 就算一開始他說隨時歡迎挑戰他
: (這部分只能說我自己太嫩orz)
術業有專攻.
這時候你可以試著做一兩張投影片,
把你的結果用容易瞭解的方式 show 出來, 在討論一下各種方法的優劣.
讓大家在同一個基準上, 就容易理解.
--
趙客縵胡纓,吾鉤霜雪明。銀鞍照白馬,颯沓如流星。
十步殺一人,千里不留行。是了拂衣去,深藏身與名。
閑過信陵飲,脫劍膝前橫。將炙啖朱亥,持觴勸侯贏。
三杯吐然諾,五嶽倒為輕。眼花耳熱後,意氣素霓生。
就趙揮金錘,邯鄲先震驚。千秋二壯士,烜赫大梁城。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 76.170.77.110