作者branburg (瑞士捲)
看板studyabroad
標題Re: [問題] 想走Big Data的選系困擾
時間Sun Feb 1 03:06:57 2015
回原PO及版眾所討論的Big Data,甚至轉至會計與精算問題,
自己剛好都略有涉略,也稍會一些程式語言、統計及會計精算,
就用自己理解部分來做個回應。
關於Data Mining及Business Analyst是屬於Data Science的集合內,
當然Big Data也是屬於Data Science的範疇,
那Data Mining及Big Data的主要差異是什麼呢?
個人認知,主要是"Big",資料真的 "too big",
使得過去統計範疇的資料與決策分析,開始需要CS來協助處理。
簡而言之,就是「資料大到可以做動態決策(Dynamic Decision-Making)」,
當資料不斷地蒐集,資料所需要的空間及運算也就越來越大,
每秒都會產生出決策,最後導致一台電腦無法處理及運算,
這時,就必須仰賴Cloud Computing等等地CS技術,
藉由雲端科技同時動態地儲存大量資料,並且同時動態地產出決策。
最顯著的相近例子,就是Google隨時記錄個人的郵件及網頁瀏覽習慣等,
並且,逐步地達成客製化的服務,大家打開智慧手機,就有明顯的差異服務。
如果想要念Big Data,可考慮念什麼學校或什麼系呢?
首選是Stanford,因為Stanford的CS及Statistics都是世界頂尖,
可參考這網頁
https://statistics.stanford.edu/academics/ms-statistics-data-science
第二個選擇是可能是Washington,事實上,個人認為這學程內容比較符合Big Data
可參考這個網頁
http://www.cs.washington.edu/students/grad/specializedtracks/bigdata
上述兩個學程,都可以輔助去了解未來要如何修課及獲得實務經驗,
不管走Statistics或Computer Science,到最後所有事物都必須自我學習,
主要原因是,Big Data範疇常常是Statistics,Hacker及Social Science的交集。
這項技術成熟後,可以推翻許多過去理論的假設,例如特定分配等等。
用在精算上,"似乎"也可改變目前許多精算模型,
用在經濟上,"似乎"就可解決人是理性之相關假設所產生的問題。
近期所探究的技術,是Dynamic Networking的概念。
因為,不斷地抓取新資訊,個別分配會透過統計方法,
不斷地整合新的動態分配,進而獲得動態決策。
(目前有看到Baysian Method成功地使用在實務的例子)
就自己有限知識所了解到的,
是偏向Dynamic Non-Parametric Statistics + Baysian Method,
再用CS技術建置一個Automatic System去做到Dynamic Decision-Making。
通常學Statistics的人,往往無法處理Machine Learning等等問題;
通常學CS的人,往往對整合分配及資料蒐集產生些許障礙;
通常兩項都會的人,往往較缺乏運用在產業上的相關知識,
例如,股價預測,也需要了解相關國際金融、總體經濟及預測行為等知識。
至於精算及會計,如果沒有要走學術的話,
都可以透過考取證照方式,自修而成為會計師與精算師,
分別去美國的兩大協會,AICPA及SOA即可獲得相關資訊。
如果有接觸FSA、FCAS或是CPA的話,
有一定比例是念藝術、音樂出身的,所以學校科系並不是重點,
主要看重自學能力及長期努力的抗壓性。
念統計或精算碩士對精算實務幫助是什麼呢?
可能就是預備知識,如數理統計、可信度理論、存亡分析等等課程,
先獲得相關能力,之後減少未來學習考照的時間,
並透過部分報告或師資人脈,獲得實務經驗或研究主題的經驗。
提前了解保單訂價,準備金評估,保險公司財務或清償能力的評估,
甚至進入再保險領域,獲得巨災或風險移轉工具的工作機會。
關於念會計碩士對會計實務幫助呢?
也相同地,可先對審計、財報分析、商業環境及法規提前認識,
節省考CPA的時間,並且透過實習或人脈,
幫助自己於稅務或審計方面的職涯規劃,
也可能走向財務顧問或企業評估領域。
會計及精算的段落,只是協助了解兩者事實上有顯著差異,
但不可否認也有極大的交集,也就是IFRS 4 Phase II的範疇。
以上,如果有說錯,也麻煩各位大大給予一些提醒及修正囉!
希望有更多人可以投入Big Data領域內,協助整個產業發展。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.65.3.54
※ 文章網址: https://www.ptt.cc/bbs/studyabroad/M.1422731222.A.8DB.html
推 mike0227: 其實沒有"推翻"什麼東西 假設也不是拿來推翻的 02/01 05:59
→ mike0227: 數學跟統計上的新東西其實也沒有真的那麼多 02/01 05:59
→ mike0227: 最大的變化是現在的計算能力能做到以前很多不敢想的事情 02/01 06:00
→ mike0227: 原po的問題的話 我覺得要看個人興趣還有有沒有想繼續念 02/01 06:02
→ mike0227: master或PhD 如果沒有再加上出路考量的話當然CS好 02/01 06:03
→ mike0227: 個人是Math->CS 不過不是在做data 02/01 06:06
→ mike0227: 如果要繼續念 現在等於是在打底子 不論興趣的話 02/01 06:08
→ mike0227: 統計好比CS強來的吃香一點 因為CS領域變化太大了 02/01 06:10
推 mike0227: 另外 可以找Advanced Calculus先來念念看念不念的下去XD 02/01 06:15
也許入門Statistics是個選擇,可先把R language熟練,
再進階接觸Python,資料結構、Machine Learning等等。
推翻似乎真的不是很好的描述,原意是可能改變應用科學的假設。
舉例來說:有位致力於Non-cooperative Game的歐洲學者(似乎有諾貝爾獎)
他對"人是理性"的假設,便認為是Nonsense,
大約10年前,他就曾使用Networking的想法在處理經濟問題。
推 Ouranos: 推分享!這篇寫的好好,感謝原po! 02/01 11:48
推 handsomebear: data science首推NYU,analytics:NCSU,Austin 02/01 14:01
→ handsomebear: usf analytics也很猛,就業率號稱100%,年薪九萬 02/01 14:02
※ 編輯: branburg (42.65.3.54), 02/01/2015 17:04:13
推 frank11118: 推 謝分ㄏㄧㄤˇ 02/01 17:30
推 ryanlei: 感謝分享 02/01 22:33
推 SatGod: 專業推!! 原po 意思是選哪個都行,可是就都有得有失囉 02/01 23:29
推 robinhoodli: 可以多講一點 bayesian method 應用在實務上的例子? 02/13 14:22