作者Wush978 (拒看低質媒體)
看板Soft_Job
標題Re: [請益] 值得花十萬到巨匠 學大數據軟體嗎?
時間Sun Dec 25 13:18:56 2016
※ 引述《s00771book (320)》之銘言:
: 想問問前輩們
: 目前小妹的工作只是個
: 用BI cognos 拉資料做數據分析的助理
: 再用Excel樞紐分析 寫寫函數
: 做報告給主管看的工作
: 薪水少之又少 也不算是一技之長
: 根本不足以與大數據相提並論
: 目前嚮往大數據工作的方向
: (也是很有未來的工作 大陸已經很成熟了)
: 查看了104人力銀行
: 大數據分析工作需要的條件:
: MS SQL 資料探勘 R語言 Hedoop
: 所以我去巨匠諮詢了一下
: 課程規劃師說要學 MCSA MCSE
: 再考微軟證照70-461.462.463.464.465
: 才算是完全學會這套軟體
: 和證明給面試官看
: 但是學費竟然快要十萬
: 想請問有在做這方面工作的朋友們
: 真的值得花這筆錢嗎?
: P.S.我只是個國立科大 企管+金融的學士而已
: 沒有漂亮的學歷 只能學一技之長補足自己
: 也不是資工 資管的科系的
: 希望前輩們能給我建議 謝謝你們>////<
如果要走數據分析(抱歉,我不太喜歡用大數據這個詞)的話,
從學R 入門也是一個方法。
資料科學有三個要素:programming, statistics, domain knowledge
我自己在台灣的職涯差不多是:
有programming --> 薪資為 n
有programming + statistics ( 差不多是 machine learning ) --> 2n
有programming + statistics + domain knowledge --> 4n
你目前已經在工作了,只要花心思就可以開始累積domain knowledge:
你們領域中在意的問題是什麼?哪些方向?各種問題的價值?... etc
Programming的話坊間已經有很多自學教材了。
我這邊推薦我與社群做的: R語言翻轉教室
http://datascienceandr.org
你可以自由的使用它做自學R 語言,大概會花你12-18小時。
教材中我自認寫的最滿意的是Data Engineer的那段,
感謝社群朋友的捐獻,拿一個利用Open Data計算房地產泡沫化指數的小專案當成作業
因為原始資料完全沒有清理,所以這個作業差不多是一個期末報告的難度
但是它非常的貼近實際做資料科學與Open Data相關工作的情境。
這個教材對沒有程式基礎的同學比較挑戰,
有問題,網頁的右下角有聊天室可以問我,
或是你也可以考慮先使用其他教材。
台灣的R社群中還有:
- ptt R_Language版的板主:andrew 的「R 演習室」
http://apansharing.blogspot.tw/p/r.html
- Tony Yao-Jen Kuo 與 Data Camp合作的教材:
https://goo.gl/KxjhIq
這套與R語言翻轉教室很類似,差異在:
- 是不用搞安裝環境,想嘗試可以更快開始嘗試
- 課程內容差不多是R語言翻轉教室RBasic的範疇,但是難度應該對新手更友善
(我最近正計畫要降低R語言翻轉教室的難度 ...)
R還有非常多其他的線上自學資源,族繁不及備載
其實你也不一定要學R, python 也是和R 一樣好的分析工具,網路上也可以找到很多
自學資源
我覺得你「能不能運用自學資源自學工具」其實是衡量自己Programming能力的指標。
如果不能的話,就先好好學一套工具,基本上就具備這個能力了。
最後分析的能力,我覺得這是自學比較難補充的部份。
如果數學夠好,就去啃書本吧。
另一種作法,是去分析的單位做Data Engineer,或是做研究助理,然後一邊工作一邊學
但是最好還是去補個與你想投入領域相關的碩士學位。
因為分析這種事情,很看個人的信譽、聲望,而且也離不開domain knowledge。
好的人做的分析報告,大家直接跳到結論。不好的人,就算你該做的都做了也沒人信。
要走這條路,一輩子也都要學習,共勉之。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.178.87
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1482643139.A.2E2.html
→ beaprayguy: 終於有人點出大數據不等於資料科學, 12/25 13:22
→ beaprayguy: 我超覺得一直強調大數據根本有事一一... 12/25 13:22
大數據是個定義不明確的詞彙,所以要介紹怎麼學大數據,
問100個人大概會有25個說法,然後就戰了。
相對來說,資料科學是比較定義明確的詞彙,
從公認的三個要素(programming, statistics, domain knowledge)分開來介紹,
也是比較好寫的。
→ YishengSu: 比較像統計工程? 12/25 13:26
推 neo5277: 2n挺吸引人的 ,4n也是 12/25 13:39
推 bronx0807: 推 12/25 13:41
※ 編輯: Wush978 (1.163.178.87), 12/25/2016 13:58:00
推 sivid: 推推 12/25 15:04
推 yahoo523: 吳大文必推 用過他的翻轉教室課程 很厲害!! 12/25 15:19
推 y800122155: 推學長! ....HW6還沒做完>< 12/25 15:21
推 cmelo1515: wush大就是帥 12/25 16:15
推 wuchihsu: 推推 12/25 17:09
推 Trick: 所以N是多少呢? 12/25 18:01
推 LMY8684: 朝聖推 12/25 18:27
推 kenshin528: 釣出神人 12/25 21:43
推 joker0634: 看到WUSH只好推了 12/25 21:57
推 babypanda: 推,資料科學 12/25 22:24
推 jakert123: 到底哪裡有開放的data可以讓人學大數據 12/26 02:14
→ beaprayguy: 開放政府 12/26 06:25
→ vn509942: 感謝分享 12/26 07:38
推 eric500g: 推 12/26 08:06
推 mirage7714: 推Wish大大 12/26 12:26
推 frankshih: 推 wush 12/26 23:31
推 snakeooxx: 朝聖 Wush <(_ _)> 12/27 00:57
推 powergreen: 推推推 12/27 08:35
推 cywhale: 推Wush大~ 12/27 12:31
→ cywhale: 借轉R版,謝謝囉~ 12/27 13:24
推 autumnal7: 推Wush 12/27 14:25
→ f496328mm: data部分 kaggle不錯 12/27 17:50
→ f496328mm: 基本上很難碰到大數據拉,光是設備,一般人就沒辦法 12/27 17:50
推 f496328mm: kaggle方面,我有做兩個題目,都有前10% 12/27 17:55
→ f496328mm: 分享給入門者 12/27 17:55
推 f496328mm: data有7千萬筆 可以慢慢玩 12/27 17:58
推 pig0038: 推推 12/27 19:25
→ pig0038: 一般能作data mining 就很不錯了 12/27 19:26
推 roger00: 推這篇 12/28 09:59
推 yanchenglin: WUSH學長就是神! 推推推 12/29 02:02
推 ConfusedDuck: 推推推~~ 12/31 08:36
推 machia: 05/10 21:02