→ beaprayguy: 終於有人點出大數據不等於資料科學, 12/25 13:22
→ beaprayguy: 我超覺得一直強調大數據根本有事一一... 12/25 13:22
大數據是個定義不明確的詞彙,所以要介紹怎麼學大數據,
問100個人大概會有25個說法,然後就戰了。
相對來說,資料科學是比較定義明確的詞彙,
從公認的三個要素(programming, statistics, domain knowledge)分開來介紹,
也是比較好寫的。
→ YishengSu: 比較像統計工程? 12/25 13:26
推 neo5277: 2n挺吸引人的 ,4n也是 12/25 13:39
推 bronx0807: 推 12/25 13:41
※ 編輯: Wush978 (1.163.178.87), 12/25/2016 13:58:00
推 sivid: 推推 12/25 15:04
推 yahoo523: 吳大文必推 用過他的翻轉教室課程 很厲害!! 12/25 15:19
推 y800122155: 推學長! ....HW6還沒做完>< 12/25 15:21
推 cmelo1515: wush大就是帥 12/25 16:15
推 wuchihsu: 推推 12/25 17:09
推 Trick: 所以N是多少呢? 12/25 18:01
推 LMY8684: 朝聖推 12/25 18:27
推 kenshin528: 釣出神人 12/25 21:43
推 joker0634: 看到WUSH只好推了 12/25 21:57
推 babypanda: 推,資料科學 12/25 22:24
推 jakert123: 到底哪裡有開放的data可以讓人學大數據 12/26 02:14
→ beaprayguy: 開放政府 12/26 06:25
→ vn509942: 感謝分享 12/26 07:38
推 eric500g: 推 12/26 08:06
推 mirage7714: 推Wish大大 12/26 12:26
推 frankshih: 推 wush 12/26 23:31
推 snakeooxx: 朝聖 Wush <(_ _)> 12/27 00:57
推 powergreen: 推推推 12/27 08:35
推 cywhale: 推Wush大~ 12/27 12:31
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: cywhale (140.112.65.48), 12/27/2016 13:23:27
→ cywhale: 推一下Wush大在soft job版發的文~(應不用修前面推文吧~ 12/27 13:26
→ Wush978: 其實我只是想繼續推教材啦,哈哈哈 12/27 13:55
→ Wush978: 這邊已經有置底了 12/27 13:55
→ f496328mm: 請問,學machine learning,需要自己寫演算法嗎? 12/27 17:48
→ obarisk: 你問的演算法是那個層次的演算法? 12/27 21:28
推 f496328mm: 因為我目前都是用其他人寫好的packages 12/28 00:21
→ f496328mm: 未來工作 , 不知道需不需要 , 自己寫ML 12/28 00:22
→ Wush978: 如果是一般的情況,可能不用自己會寫算法 12/28 00:58
→ Wush978: 我的情況是資料量大,一般ML套件都不能用,所以要自己能 12/28 00:58
→ Wush978: 寫才能跑得動 12/28 00:59
→ Wush978: 如果一般套件能跑出好結果的話,我也傾向用一般套件先做 12/28 00:59
→ Wush978: 兩種工作內容(找精準的算法、寫算法)在大公司可能是分 12/28 00:59
→ Wush978: 開的職位或部門 12/28 00:59
推 f496328mm: 感謝 12/28 11:29
推 psinqoo: 實在不想說~~ 有些公司要找神人 會資料庫、分析、演算法 12/29 08:53
→ psinqoo: 開那種爛價格~~ 農曆年我會整理一下這些公司資訊 12/29 08:53
→ clansoda: 想請問wush大,什麼樣的定義叫做資料大呢 12/29 10:01
→ clansoda: 而為什麼自己寫的跟library裡面的速度上會有差異 12/29 10:01
→ clansoda: 作者應該也有考量過這些問題吧,我目前跑起來在e1071 12/29 10:02
→ clansoda: 裡面的svm速度確實不是很理想,這跟library本身有關嗎 12/29 10:02
推 f496328mm: svm超級慢 幾萬筆就掛了 12/29 20:26
→ f496328mm: library有些是用 c++ 寫 當然快很多 R很慢的 12/29 20:27
→ f496328mm: 推薦你用xgboost 比svm快很多 吃的ram也小 12/29 20:28
→ f496328mm: 還可以CPU全開去跑 12/29 20:28