推 kruz:你的data mining是想當miner還是想當研發mining方法的? 08/08 23:18
→ kruz:後者的話會需要很多理論上的基礎,前者的話要看你是想要mine那 08/08 23:19
→ kruz:個領域,那你基本上要對那個領域有足夠的熟悉度. 08/08 23:19
→ rampage:當miner。所以會這樣問也是想盡早培養target產業的knowhow 08/08 23:59
→ rampage:(金融業是好選擇?) 透過修課.實習等方法 08/08 23:59
→ rampage:老實說我還很不懂data mining在實務上的應用... 08/09 00:21
→ rampage:幫企業設計一個適合它們.專屬的搜尋系統? 08/09 00:22
推 kruz:data mining嚴格來說不是搜尋系統,你可能要花點時間做一下功 08/09 01:17
→ kruz:課,可以先看一下wikipedia的解說.如果是miner的話你要學的是 08/09 01:18
→ kruz:那個行業需要的資料跟走向.金融業看起來很好是因為他們是最早 08/09 01:19
→ kruz:(或是說很早)在做data mining的,其他行業現在也很常做,看你興 08/09 01:19
→ kruz:趣吧,因為你真的要知道那行的"relevent data"是什麼才可以. 08/09 01:20
推 duer:想學他的理論 跟他的應用我覺得這是不同的... 08/09 01:24
推 duer:就像有人說他在作search跟他真的是在研究如果seach更快更準!? 08/09 01:25
推 duer:所以我覺得你應該是想要知道data mining有哪些應用的工作吧 08/09 01:26
→ rampage:恩,對,想知道可能的工作型態! 謝謝樓上兩位的建議! 08/09 02:10
推 Baudelaire:對 application的開發/最佳化 跟研究是兩件事情 08/09 02:24
→ Baudelaire:不過這在某些領域很難細分 尤其是data mining 08/09 02:24
→ Baudelaire:或者ML 很多工程師都拿這些技能去工作 08/09 02:25
→ Baudelaire:應該說 你是寫classifier 還是研究怎麼作classifier 08/09 02:25
→ Baudelaire:不過拿search來作比喻也不完全對 至少YST就是個半研究 08/09 02:26
→ Baudelaire:機構 裡面有些人是用PhD的東西在實做 08/09 02:26
推 kruz:台灣的資管背景的話我覺得要做可以朝data security那方面,現 08/09 04:41
→ kruz:在很多都開始用machine learning. 08/09 04:42
噓 isaacc:資管這名字起的很差? 那你真的是白念了。IT是需要管理的。 08/11 01:34
→ isaacc:建議有機會去看看ISO20000/27001在寫些甚麼。 08/11 01:37
> -------------------------------------------------------------------------- <
作者: saltlake (SaltLake) 看板: Oversea_Job
標題: Re: [CS] 想做需要/能學到domain knowhow的工作
時間: Sun Aug 24 11:53:28 2008
※ 引述《rampage (愛樂)》之銘言:
: 如題
: 背景:
: 1. 大四,在台灣讀的是資管,未來會出國讀CS,暫定data mining方向
: 2. programming skill (跟其他讀資訊的學生比) 算普通
: 3. 對資訊與管理(<-我很不喜歡這樣講,但這樣說比較容易懂)都滿感興趣
: 4. 正在某大外商軟體公司實習
: 基本上我認為資管這名字起的很差,從來沒有資訊+管理這回事,
: 只有 資訊+生產工程 or 資訊+財會 資訊+ 稽核...etc
: 總而言之,就是有撰寫程式的能力,再加上某個領域的具體knowhow
: (具體knowhow代表不是什麼組織行為...之類的,我不是指組織行為不重要,但這種能力
: 是學生在課堂上尚難以培養的)
: sorry離題了,這篇不是要討論資管的內涵= =
: 我對"具體knowhow"的定義比較特別一點,希望是knowhow in 產業核心
: 而不只是knowhow in support. knowhow in 流程...
: 因為要學這些,不需要讀資管,不需要讀會計.經濟學.統計.作業研究....
: 我希望未來的工作可以符合下列條件:
: 1. 可應用/可建立 domain knowhow
: 2. 偏核心,不只是support
: 說了這麼多,只是想請各位前輩幫我verify一下...
: 基於上面的這些考量,我未來想研究data mining/knowledge engineering
: 這樣的選擇會是對的嗎^^" 讀data mining以後做的工作可以滿足我這樣的需求嗎?
簡單這麼講 資料探勘的核心知識基礎在於統計理論 主要的目的在於從海量
的資料庫當中建立能挖掘出有價值的知識的規則 如果把資料庫看作礦山 資
料探勘的目的就像探礦專家一樣致力於搜尋出相關規則幫助開礦者從許多低價值
的石頭裡面找出金礦或者鑽石 或者這就是為何這門學科被如此命名的原因 注意
是找出能找到金礦的規則 而不是利用某種已知規則去開礦
比方某個美女世家密藏有家族歷代美女的各種追求者的相關資料比方情書 情詩
家世 學歷 職業 嗜好以及後來與家族美女相處的狀況比如有沒有每天送花 幾年
以後開始禿頭或者在外面拈花惹草等等 透過足量的這些資料 資料探勘專家
能幫美女家族找出追求者的哪些表現跟日後哪些表現相關 從而幫助美女家族的
美女們利用這些規則找出最適合自己的夥伴
其實一個大家更熟悉的例子就是智力測驗或者各種心理測驗或者星座相命技巧
在這些不同應用方面的資料探勘專家透過其專業的統計相關知識建立起相關性
的規則 讓外行人能夠透過測量一些表面上沒啥關係的數據去得到自己有興趣
的推論
最後 因為這方面的核心理論在於建立統計相關性 也因此有一個基本的限制
那就是統計相關的存在不代表一定有物理上的因果關係或者唯一的因果關係
比方說地上濕了一片可能因為剛剛下過雨 也可能因為洒水車剛開過不久
又比如說某公司聘請資料探勘師研究發現該公司出品的超辣牌比基尼銷售量大增
的時候 恰巧也是某廠牌的超冰牌冰淇淋大賣的時候 而且同時是阿婆火鍋
生意最清淡的時候 如果因此推論只要讓阿婆火鍋不好賣而且超冰牌冰淇淋大賣
的話 就可以讓自己公司的超辣牌比基尼銷售量大增 那就會犯下最基本的統計
錯誤 :p
補充一些跟找工作相關的....因為一個資料探勘專家專精於從海量的任意資料
或者海量的某些類別資料去找出有用的規則 而資料的蒐集跟儲存都需要相當的
維他命 M 因此資料探勘專家恐怕得一定規模的公司才養得起 當然如果某資料
探勘專家具有刑案偵查方面的天份與興趣 或許可以自己開偵探公司 :p
※ 編輯: saltlake 來自: 66.57.241.68 (08/24 12:04)
> -------------------------------------------------------------------------- <
作者: pest (這些分鐘妳有沒有想過我?) 看板: Oversea_Job
標題: Re: [CS] 想做需要/能學到domain knowhow的工作
時間: Mon Aug 25 10:18:32 2008
※ 引述《rampage (愛樂)》之銘言:
: 1. 大四,在台灣讀的是資管,未來會出國讀CS,暫定data mining方向
: 2. programming skill (跟其他讀資訊的學生比) 算普通
: 3. 對資訊與管理(<-我很不喜歡這樣講,但這樣說比較容易懂)都滿感興趣
: 4. 正在某大外商軟體公司實習
: 基本上我認為資管這名字起的很差,從來沒有資訊+管理這回事,
: 只有 資訊+生產工程 or 資訊+財會 資訊+ 稽核...etc
: 總而言之,就是有撰寫程式的能力,再加上某個領域的具體knowhow
: (具體knowhow代表不是什麼組織行為...之類的,我不是指組織行為不重要,但這種能力
: 是學生在課堂上尚難以培養的)
: sorry離題了,這篇不是要討論資管的內涵= =
熊熊看到戰文,當然要來戰...啊..不是,來回一下。
我的背景跟你剛好相反,我是資工唸完走資管,雖然現在還是在做軟體民工。
你的理解是對的,資管本身並不容易成為一個具體的專長,確實也需要別的
專長作為支撐,所有的管理都會有雜而不精的缺點,但端看你怎麼自我加強。
大學部在上課時採用個案討論的機會比較少,同學們在業界的經驗也欠缺,
有時候上起課來就會覺得都是空談,但往業界看,如果資管本身真的不重要,
為什麼同樣導 ERP,有的公司成功、有的失敗?
為什麼同樣搞 CRM,有的公司業績大增、有的毫無起色?
為什麼 CMMI 弄到五級的公司不一定能做出比較好的軟體?
更擴大一點來看..
為什麼 Amazon 這種在 SWOT 分析中完全贏不過 B&N 的公司會後來居上?
為什麼無名小站的 BBS 打不過 PTT?
為什麼 eBay 在日、德可以很成功,在中、台、韓卻輸到得跟人合資?
這些個案的討論,算是資管教育中在 '管' 的部份的價值。
: 我對"具體knowhow"的定義比較特別一點,希望是knowhow in 產業核心
: 而不只是knowhow in support. knowhow in 流程...
: 因為要學這些,不需要讀資管,不需要讀會計.經濟學.統計.作業研究....
: 我希望未來的工作可以符合下列條件:
: 1. 可應用/可建立 domain knowhow
: 2. 偏核心,不只是support
: 說了這麼多,只是想請各位前輩幫我verify一下...
: 基於上面的這些考量,我未來想研究data mining/knowledge engineering
: 這樣的選擇會是對的嗎^^" 讀data mining以後做的工作可以滿足我這樣的需求嗎?
: <(_ _)>
如果真的要洗刷資管廣而不精的特色,說不定直接轉向應用統計還更好,
先前實習時的同事是哈佛統計所博士班,他對電腦的架構一竅不通,但是要分析
當機原因及預測當機發生機率,所以他常問我們諸如 'RAM 到底是做什麼的?'
之類很囧rz的問題,可是對於所有 data mining/machine learning 的方法
都很熟、並且可以看出別人設計的實驗缺陷,重要的是他能夠自己用 R
很快的把問題 model 出來,即使他完全不知道那欄位到底是什麼資料。
說到底,如果唸資管程式寫不好,沒辦法自己寫程式設計實驗,只能靠套裝軟體
設一設來進行分析,那麼對公司來說,價值就低很多了。
至於其他資管學到的技能,我覺得比較像是為未來作準備,很多武功短時間內
是真的用不到... *嘆*
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 60.248.4.16