看板 Soft_Job 關於我們 聯絡資訊
想請教從事 資料分析、ML 相關工作的各位, 比較常用 R 還是 Python ? 因為我上網搜尋相關工作,比較常看到必備需求中包含 Python ,幾乎沒有 R 因為 R 比較偏向學術嗎? 我上網GOOGLE到這幾篇 R, Python Duel As Top Analytics, Data Science software – KDnuggets 2016 Software Poll Results https://goo.gl/DQNEvq SAS, R, or Python Survey 2016: Which Tool Do Analytics Pros Prefer? https://goo.gl/sJUubT R vs Python for Data Science: The Winner is http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html 都是 R 使用率大於 Python 所以想請教各位,謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.88.36 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1500088140.A.802.html
ruokcnn: 都有人用啦 只是派森商品化能力強些07/15 11:14
johnny78615: Python 07/15 11:23
besmartAE: Python07/15 11:58
CaptainH: R是垃圾07/15 12:54
Murasaki0110: python沒有對手07/15 12:55
Morphee: Python07/15 13:11
xsssxxzz: R是垃圾?怎麼會有人下這種評語? 07/15 13:16
red0210: Python07/15 14:00
vfgce: R就不好入門,和傳統程式語言差異很大,且非常不建議用迴圈..07/15 14:27
vfgce: 對於寫慣迴圈的人,非常不順手,python接近一般程式語言,且07/15 14:28
Rocker5566: python比較潮07/15 14:29
vfgce: 程式效率也比R好些,自然用的人多一點...07/15 14:29
vfgce: 用於資料分析,R語法簡潔許多,因為本來就是為統計分析設計..07/15 14:33
vfgce: 內建就是向量式計算及內建矩陣運算...07/15 14:34
所以是因為Python跟傳統程式語言相近 所以比較多人用? R用於資料分析簡潔許多 但效率上or商品化方面 還是大輸Python? 聽大家都是Python 有點想跳Python 目前我大多是用R作資料分析(非工作)
testPtt: 一邊學校多教spss,lisrel 07/15 14:46
grimmq427532: 有人開釋啦,這種評語不是大神就是蠢才07/15 14:50
※ 編輯: f496328mm (36.229.88.36), 07/15/2017 14:57:24
seallol: 兩個都學,先學python再學R07/15 15:25
Wush978: 看領域:資工人偏P,統計人偏R。這裡資工人偏多吧,業界07/15 15:38
Wush978: 資訊部門也是資工人比較多07/15 15:38
Telemio: python開源的資源比R多很多啊 你現在用pandas numpy做分07/15 15:45
Telemio: 析 ML DL的套件也幾乎都是用python開發 R現在的優勢很小 07/15 15:45
Telemio: 吧 而且python很多才多藝 又好寫07/15 15:46
Wush978: R的開源資源也不小呀,沒必要貶R吧。07/15 15:49
Wush978: 我覺得R開源界推的tidyverse概念整理資料很漂亮07/15 15:50
Wush978: ggplot2也是R的開源界推出在資料視覺化很有影響力的套件07/15 15:51
Wush978: Rstudio也是與R整合的很好的IDE07/15 15:53
Wush978: Python的開源界雖大,但是不像R的開源界專注在資料處理07/15 15:55
Wush978: 上,因此一些資料應用在工具上的創新,R不一定比Puthon07/15 15:55
Wush978: 慢07/15 15:55
testUI: Python07/15 16:00
yenyu0304: 有必要這麼偏低R嗎?個人覺得R避開迴圈,用矩陣運算取07/15 16:14
yenyu0304: 代,速度並不會比python慢喔07/15 16:14
vfgce: 呃,R的速度嚴格來說還是比優化的numpy要差.....07/15 16:38
vfgce: R最大的優勢是語法簡潔,及統計方面的功能強大, 07/15 16:40
Wush978: 是嗎?有更換R的預設blas再比較嗎?07/15 16:40
vfgce: 對於同時有統計及機器學習需求的人,R是不錯的選擇... 07/15 16:41
vfgce: 換過了,資料一大,R就慢了下來....07/15 16:42
Wush978: R core team在選用運算套件上,正確性的權重比速度大很07/15 16:43
Wush978: 多07/15 16:43
dreamnook: 看來又要變成不要刪文討論串了XD07/15 16:43
drak4dd: Python,你學 R 後會瞭解,你終究要學 Python07/15 16:45
Wush978: 不過R的函數只能pass by value,所以資料量一大,沒注意07/15 16:49
Wush978: 到這點速度就慢了。我自己看過兩者底層的C資料結構,不 07/15 16:49
Wush978: 覺得兩者的效能會差很大。通常原因在別的地方。07/15 16:49
vfgce: R就偏functional language,不去變動原始資料,計算完傳回07/15 16:55
vfgce: 新的,記憶體耗用大,資料大一點就變慢了07/15 16:56
這點R使用data.table,應該是不會創造新的, 另外我目前用R做資料分析,處理最大有到10GB的data,不知道算不算大
Wush978: 針對原Po來說,我強烈建議你學一學Python,對你的視野與07/15 17:31
Wush978: 職涯都會有很大的幫助。你會看到一些與R不同的工具與觀點07/15 17:32
Wush978: 況且以現代來說,R+Python 會比 R or Python 來的有競爭07/15 17:32
Wush978: 力07/15 17:32
Wush978: 以深度學習來說,像Rstudio包的那些關於keras的R套件你就07/15 17:33
Wush978: 可以不用碰了,直接學Python/keras就好了。這未來都會比07/15 17:33
Wush978: 只堅守R來的更好07/15 17:34
感謝大大,目前是ML靠R,DL靠Python, 不過R資料整理方面有很多高階函數,非常方便 另外有試過R整理好資料,輸出給Python去建模, 同樣使用XGBoost,Python沒有特別快,因為底層都一樣吧 看過很多資料視覺化處理,都是用R
vallwesture: R太慢了07/15 18:06
rodion: 泛用選python 專精選R07/15 18:11
rodion: 不過學python根本不須那麼多考慮 因為python太簡單好學了07/15 18:11
vfgce: data.table格式不是R原生,很多套件不援.07/15 18:26
vfgce: 有時還是得再轉成data.frame,用到類神經這種,R真的太吃力.. 07/15 18:27
vfgce: python類神經跑mnist識別幾分鐘就跑完了,R的類神經來跑.... 07/15 18:29
vfgce: 要一到兩小時.數據不大時,用R真的很享受...但數據大時.... 07/15 18:30
vfgce: 還是考慮一下python. 07/15 18:31
vfgce: 我現在也是兩個用,雖然比較愛用R. 07/15 18:33
DL還是Python強些
lukelove: 不管你是cs/math都建議學一下python 不然就像上面所說07/15 19:09
lukelove: 面試就先被cs噴R太慢 雖然事實上R也能做的很高效 如wus07/15 19:09
lukelove: h大之前文章所示 但如果沒有很懂R底層應該做不到07/15 19:09
感謝,近期會去學學Python,其實都有在摸Python, 會試著用Python重新做之前分析過的 data
Philcat: 長知識07/15 19:35
roymond: R的套件遠比python來得豐富也多很多....07/15 19:42
roymond: DL的部分Tensorflow & keras也有R的package可以使用 07/15 19:43
roymond: 使用哪個語言做分析,主要看自己的熟悉度與適應程度 07/15 19:44
roymond: 比較哪個語言好,實在沒有必要,有些人的發言實在是....07/15 19:45
主要是上網找一些 data mining 相關的 job 必要條件幾乎都是 Python, R 很少QQ
eddy50811: 各有優缺點 如果要靠這行吃飯的話就兩個都學吧 07/15 20:43
eddy50811: 樓樓上 有些人的言論就別在意了 到哪都有這種人的07/15 20:44
celestialgod: 用台灣的相關工作要求來看R or Python??07/15 21:51
celestialgod: 那些老闆跟人資也根本不懂到底R跟Python區別07/15 21:52
celestialgod: 就去問IT的,IT當然回Python阿(攤手 07/15 21:52
celestialgod: 而且你出去工作,老闆只care你有沒有產出吧 07/15 22:12
celestialgod: 管你用什麼工具.... 07/15 22:12
celestialgod: 除非他是一間有規模的公司,裡面已經有既有的架構了07/15 22:13
celestialgod: 但是你如果能夠fit既有架構,要用什麼也不是問題07/15 22:13
OK 感謝大大回覆
nfsong: Python 为何能坐稳 AI 时代头牌语言07/15 22:43
nfsong: facebook這個 http://pytorch.org/ 有支援GPU運算 07/15 22:44
nfsong: 感覺實用上應該只有python了 除非nvidia 也有開發R 07/15 22:45
nfsong: https://github.com/pytorch/pytorch07/15 22:53
nfsong: https://goo.gl/aWnLxs wiki Comparison_of_deep_learnin07/15 23:03
a9601268787: 我覺得學py可以跨領域做很多事情 選R路太窄了07/16 00:15
artopll: R 跟Python 都只是工具 在業界不要被工具侷限07/16 11:46
profiles: 學C++不好嗎?各領域都能用07/16 12:49
red0210: 沒有各領域吧,資料分析有人用 C++ 嗎07/16 13:19
fantasywater: 以實務來說 R很難拿來和企業內部的系統介接,一個 07/16 13:28
fantasywater: 不能production的東西,實在是頻頻被企業打槍,還是07/16 13:28
fantasywater: 學python吧!!07/16 13:28
fantasywater: 如果學R還要搞懂底層,那你到底是做分析還是做工程07/16 13:32
fantasywater: ,cs也不會為為了你去搞懂R底層,R沒有不好,只是 07/16 13:32
fantasywater: 實務上太多工程問題很難解.. 07/16 13:32
瞭解,因為要跟他人合作,python會比較有優勢
Wush978: R 為什麼很難跟企業內部的系統介接? 很多人這麼說,但我 07/16 15:02
Wush978: 還沒聽過真正的理由,好像只是因為台灣懂R的人少? 07/16 15:02
fantasywater: 真要說原因的話 R 原本就不是為了和其他系統整合介 07/16 15:47
fantasywater: 接設計的語言 當其他的語言介接的套件都很成熟 R 07/16 15:48
fantasywater: 可能還要從基本的輪子開始造起 又時間是重要的資源 07/16 15:49
fantasywater: 通常不會等 R 去發展這些基本的介接模組 07/16 15:50
primary: python進步速度很快也好上手但data viz和cluster之類的我 07/16 17:23
primary: 都會用R 07/16 17:23
Wush978: 你能舉例嘛?我串過很多服務到R, 都很順阿 07/16 19:56
Wush978: 資安方面有openssl / digest 等套件直接套用 07/16 19:56
Wush978: web 方面 oauth 2.0 也有httr等套件可以直接調用 07/16 19:56
Wush978: database方面,有RJDBC/RODBC等套件可以直接串 07/16 19:56
Wush978: 聽你們的論述,我覺得台灣業界覺得R不好串是因為台灣業界 07/16 19:56
Wush978: 對R不熟悉 07/16 19:57
感謝大大開釋,也就是說,只要好好學 R,實際上可以做到很多事, 資安web都有套件使用,蠻厲害的, 未來台灣業界熟悉 R 後,應該會更接受 R ※ 編輯: f496328mm (36.229.88.36), 07/16/2017 21:01:53
Wush978: 可能大家的印象還停留在2010 年前後的R吧,那時候的R的確 07/16 21:28
Wush978: 缺很多串系統需要的工具。但現在是2017,有許多商業公司 07/16 21:28
Wush978: 幫助R補上這一段了 07/16 21:28
truehero: 我有現成系統 當然是看R或python誰比較好接 07/16 21:29
truehero: 不會反過來以rR為主體來往外接阿 07/16 21:30
fantasywater: 實際上我們選擇的時後也不是只有比較有沒有套件可以 07/16 22:06
fantasywater: 用這麼簡單而已,更進一步還會比較套件是否成熟,是 07/16 22:06
fantasywater: 否好維運,還有大家是否容易接受等等更多的原因, 07/16 22:06
fantasywater: 很遺憾的 現實的環境就是不會等R來慢慢證明他的能耐 07/16 22:06
fantasywater: ,有更好用更成熟的工具可以選擇,為什麼要為了R而R 07/16 22:06
fantasywater: 呢?更多的情況是專案剛起步用R提案就被客戶打槍了. 07/16 22:06
fantasywater: . 07/16 22:06
polola6212: python cp值高太多了 07/16 22:07
fantasywater: 我的建議是,既然R的強項是分析, 就把分析的部分包 07/16 22:11
fantasywater: 裝起來讓其他的語言調用就好,其他的部分讓更適合 07/16 22:11
fantasywater: 的語言及工具來發揮,才更能發揮綜效 07/16 22:11
fantasywater: 我不是很喜歡評斷語言的優劣,因為本來就各擅勝場, 07/16 22:36
fantasywater: 我們公司在world wide也是要求 junior 在 R python 07/16 22:36
fantasywater: 至少要會一種,senior 就是都要會,我出自良心的 07/16 22:36
fantasywater: 建議,如過是工作導向,我強烈建議先學python,因 07/16 22:36
fantasywater: 為我在臺灣看到的狀況就是先學 python 比較不吃虧 07/16 22:36
感謝 看來 Python 真的要好好學學 也謝謝大家這麼熱烈的回覆 長知識 ※ 編輯: f496328mm (36.229.88.36), 07/16/2017 22:40:22
Wush978: 我覺得你們討論的好怪。如果客戶的分析團隊就是用R,那當 07/17 11:32
Wush978: 然就是要串R阿,怎麼會有所謂「等R證明能耐」的問題呢? 07/17 11:32
Wush978: 總之我是期待你們具體指出R那部份不好串,而不是這樣打 07/17 11:33
Wush978: 高空,一下說要重新造輪子,一下又說套件不成熟,沒有具 07/17 11:33
Wush978: 體事蹟... 07/17 11:34
benson1212: 其實我想問 無經驗非新鮮人有可能轉到資料科學領域嗎 07/19 20:45
benson1212: ?感覺都要有經驗或相關研究碩博士… 07/19 20:45
tsoahans: 很難吧 這領域很重視理論和數學,除非你有一些比賽經驗 07/23 03:28