Re: [請益] 台灣做大數據BIG DATA方面的公司多嗎?

作者DrTech (科技博士)

看板Soft_Job

標題Re: [請益] 台灣做大數據BIG DATA方面的公司多嗎?

時間Tue Apr 29 22:15:39 2014

※ 引述《Domos (沒事發發廢文)》之銘言： : ※ 引述《Su22 (裝配匠)》之銘言： : : 一直聽朋友說大數據BIG DATA很夯 : : Facebook,亞馬遜,GOOGLE都大量應用 : : 不過去人力銀行用關鍵字(BIG DATA,大數據,資料分析師...)搜尋一下 : : 台灣有關BIG DATA方面的公司/職缺好像不多? : : 且很多大集團大公司的職缺都沒有提到相關的東西 : : 大數據其實沒有那麼夯? : big data、hadoop很多公司，都是「常識」 : 早就行之有年，甚至很多問題，在學界都還無法解決 : 機台生產中產生的data，就是big data等級沒有 Big Data ，資料量不夠大，不代表你不會學到新東西阿，例如我雖然有玩 Hadoop 版的 MapReduce，後來我發現，真的沒用到什麼Big Data，於是乾脆吧 MapReduce 的技術移轉到一般的多核心資訊系統。在多核心系統下，做 MapReduce 運算。很多傳統程式，就可提升 10~60%的處理效率，何樂而不為。很多 Big Data 處理資料的概念也可用在一般系統阿，即使不是 Big Data 也會對你的系統幫助很大，改善你系統的一些缺陷若是有在用分散式系統的人， Hadoop Ecosystem 根本是寶山。很多原本只有在大公司的專門知識，沒想到這幾年都開源了，以前根本就拿不到這些資料來學習。玩 Hadoop 的人，我想許多人其實根本就對資料是否足夠大沒什麼興趣，從這些的 Open source 內，偷學些東西，用在自己的研發，衝擊一下自己僵固的腦袋，這才是玩 Hadoop Ecosystem 常看到的狀況吧。 ※ 編輯: DrTech (122.146.70.141), 04/29/2014 22:30:04

推 gmoz:推 04/29 23:42

→ eva19452002:可以自己寫程式random產生虛擬big data來做練習嗎？ 04/30 08:06

推 aresa:樓上幹嘛這樣浪費時間和生命 04/30 12:41

→ aresa:不如寫隻蜘蛛去爬YAHOO爬兩個月，再對抓下來的資料研究研究 04/30 12:41

→ aresa:最後再拿著你的研究去投YAHOO，這樣還實際多了 04/30 12:42

→ DrTech:看用途，練習寫程式，或練習些工具，用模擬資料很平常的 04/30 19:23

→ DrTech:只不過把現實生活中遇到的問題拿來解，會比較有熱誠做下去 04/30 19:24

推 rifiz:可以用KDD來練習很多公司在上面有放類現實問題 05/01 03:23

推 popcorny:網路上很多test data可以抓來玩。random比較沒感覺.. 05/01 12:35

推 stana:如果要產生"random"資料可以參考YCSB 05/05 11:34