看板 Soft_Job 關於我們 聯絡資訊
週五晚上剛好閒著,看你問的很雜亂 同是從別領域轉來資料分析這行的人來認真回你一下好了 資料分析這東西這幾年炒作的有點誇張,實際上又真的包山包海 所以不要聽個名詞就想進來,先搞清楚你真正想做的是什麼比較好 簡單說這行需要CS, 統計, 數學, 領域專業知識 但幾乎不可能有人全都精通,所以通常分幾種類型 1. 資料分析師: 這職稱最籠統了 從拉拉Excel到要會跑深度學習 都可以叫資料分析師 但一般來說顧名思義就是負責”分析”的 可以想像一堆資料好好的端到你面前 你要怎樣從中發掘有意義的資訊出來跟其他人報告 這方向統計是核心必要的能力 統計給你穩固的基礎去講一個結論有效還沒效,是否顯著,是否有意義。 至於你要用Excel還是SPSS還是R 就只是選擇工具的差異看公司需求而異 2. 資料科學家: 通常是比較偏向做模型的 會需要強大的Machine Learning能力 有辦法對資料訓練出好的模型來做商業預測 甚至模型本身就是產品 這方向數學底子和實際經驗兩者都非常重要 好的數學讓你能從底層去探討問題本質訓練出別人做不到的模型 好的實戰經驗讓你速度夠快做出堪用的模型,在商業戰場活下去 工具大多是R或Python。 可以參考上面討論AI的大神們的文章 3. 資料工程師: 簡單說就是資料總管 因為現在資料越來越大越來越多 所以光是”蒐集”、”儲存”、”撈取”、”清洗”資料 就已經是個無底深坑 怎樣撈的快撈的好、省空間省頻寬省機器省錢又不會壞 想辦法最快速提供上面兩位穩定、大量又乾淨高品質的資料來分析做出商業價值 這方向需要的是比較強的程式設計與軟體架構能力 關鍵字通常是SQL, Hadoop, Spark, Scala...等 --- 所以真的想跨入的話 可以想一下哪個方向比較符合你的興趣跟能力吧 找一個方向努力補足他的核心能力就可以開始面試了 當然你即使精通一種,實戰上通常另外兩種也要略懂略懂啦 另外...在台灣環境下 其實很多公司自己也不懂自己想找什麼人 就跟風要做個資料分析 尤其”資料分析師”這職稱最為混亂 這就只能面試的時候自己去搞清楚囉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.16.65 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1489765840.A.8C0.html ※ 編輯: BBSealion (114.25.16.65), 03/17/2017 23:53:56
f496328mm: 想問問看 資料科學家 必須自己寫ML嗎? 03/18 00:00
f496328mm: 我都是用別人寫好的 自己寫好難阿 03/18 00:01
f496328mm: deep learning更誇張 底層都是c++ 03/18 00:01
physheepy: 應該是不用自己寫但是要看得懂要會改吧 03/18 00:43
spiderway: 推這篇 跟我認知的90%像了 03/18 00:50
drajan: 要看職務內容 不然我遇過連SGD都不懂的資料科學家 林子大 03/18 00:52
drajan: 了 什麼鳥都有 03/18 00:52
drajan: 是有些DS會自己implement, 驗證過後再交給MLE或DE去寫分散 03/18 00:57
drajan: 式演算法。也有的就DS自己library套一下就上production了 03/18 00:57
drajan: ,現在業界的專業分工還不是很明確 03/18 00:57
kenshin528: 老闆請不起一整組人就得一個人幹這三種缺的事 03/18 01:18
kenshin528: 以一人單幹的情況來看,時間分配上工程>>分析>科學 03/18 01:19
Kazimir: 時間分配:找資料(70%) 整資料(20%) 工商(9%) 建模(1%) 03/18 02:27
blue1232: 小弟原po 雖然查過相關資訊 不過還是指實際在做的前輩 03/18 13:40
blue1232: 講解的比較清楚 小弟會依據前輩所說的 去仔細看看再決 03/18 13:40
blue1232: 定 非常感謝 03/18 13:40
mathrew: 個人覺得 2比3 難 , 因為3有廠商可以問XD 03/18 15:48
viper9709: 推這篇 03/19 17:15
BBSealion: 也有的時間分配會大量花在視覺話上面,不然主管看不懂 03/20 13:29
BBSealion: 只能說這行現在就還很亂,台灣又加倍的亂XD 03/20 13:30
BBSealion: 哪個難我認為很難說,完全看公司和看人 03/20 13:30
yichenfav: 推這篇!跟我現在待的公司職位分工很像~ 03/21 01:51