看板 DataScience 關於我們 聯絡資訊
感謝原 PO 的分享,我也來分享一下我自己的學習清單 ==== 前言 ==== 去年因緣際會知道了有關大數據、資料科學、機器學習這些領域 本來考慮要去參加資策會的課程,但自己要在家帶小孩 如果參加課程,小孩要找保母,整個機會成本太高,因此決定自學先 網路課程現在幾乎是隨手可得,想要自學的人根本不怕沒有教材可以學習,但是五花八門 的課程中,怎麼去選擇就是一個很重要的問題了。 我自己是一個門外漢,因此在選擇課程以及安排上面花了蠻多時間,以下大多是我看過或 是大概瀏覽過覺得不錯的課程,就推薦給想要自學又不知道怎麼開始的朋友們吧~ ==== 概論 ==== 由於自己雖為國立大學數學系畢業,但畢業非常多年,加上自己也非科班出身,因此想要 先了解整個領域的範疇、概要,之後再開始針對各個科目分進合擊。 PS : 初期我自己都以大數據為出發點,所以上的課都是大數據概論取向,但再其中其實 對於資料科學、AI、機器學習都會講到。 1. [ Coursera ] 大數據分析:商業應用與策略管理 (Big Data Analytics: Business Applications and Strategic Decisions) 這門課是台大與玉山銀行合作開的線上課程,與其說是課程,我認為比較偏向講座,在這 過程中可以對大數據、機器學習等在商業上的應用。這堂課可當作補充資料來上,會有一 些實務應用上的概念,當然,如果沒時間也不一定非得要上。 2. [ Coursera ] Big Data Specialization University of California, San Diego 開設的這們課程,我個人還蠻推薦的,尤其是對 跨領域、無先備知識的學習者來說,可以在這一系列課程中很快速地對整個領域有蠻深入 的理解。 3. [ Book ] 精通 Python 4. [ Book ] Python 資料科學學習手冊 這兩本都是 O’REILLY 的經典書籍,我必須坦白說我沒有完整的看完,精通 Python 我 針對資料科學的部分有完整看過,然後做習題,但裡面很多章節稍微跟資料課學無關的我 幾乎都暫先跳過,而資料科學學習手冊我是都拿來當工具書翻閱。( 所以我 coding 能力 還是一樣很差XDDDDD ) ==== Python ==== 第二階段我開始以 Python 為主進行學習,因為我自己 coding 能力幾乎是 0,這個部分 必然要作為初期學習的重點項目。另外,雖然說這是第二階段,但其實這部分跟上述的概 論課程我幾乎都是同時期一起上課。( 不過我坦承到現在我自己的 coding能力還是很差XDD ) 1. [ Coursera ] Python for Everybody Specialization 這門是 University of Michigan 所開設的 Python 專項課程,完全從 0 基礎開始上課 ,上完以後可以可以進行一些初階的程式作業我想是沒有問題的,這堂課並沒有太多針對 資料科學的部分,主要是以各領域都會用到的基礎工具為主。Charles Russell 的上課方 式我超喜歡,喜歡友去上課方式的人我想也會跟我一樣喜歡這門課。 2. [ Coursera ] Applied Data Science with Python Specialization 一樣是 University of Michigan 開設的,這專項課程我作為上門課程的接續課程。前面 幾堂會針對 python 在資料科學中會用到的模組、方法進行概略式的瀏覽,後面則會針對 視覺化、機器學習等領域做較為深入的介紹。整個課程較上一門來說困難度增加不少,因 為我自己有做手寫筆記的習慣,這門課的許多東西在我現在 coding 遇到問題時都還能翻 閱筆記作為工具書使用,我覺得受益不少。 3. [ Coursera ] Fundamentals of computing Rice University 所開設的課程,之前應該也是在論壇看見推薦的,但課程難度較高,目 前我也是暫時先擱置還未進行這課程的學習。 ===== Machine Learning ===== 1. [ YouTube ] 機器學習基石 & 技法 (Machine Learning Foundations and Techniques) 台大林軒田教授所開設的機器學習課程,在 Coursera 與 YouTube 軍可以免費觀看課程 內容。這門課主要以基礎的機器學習演算法為主,但雖然說世紀處演算法,但內容包含的 數學比重較重,啃下來的確會有點困難,但整個課程的安排的確非常流暢,老師的講述也 算是蠻清楚。而且教授對於課程教學十分用心,如果在 YouTube 或是 Coursera 上面提 問,教授 (或助教) 都會盡可能地回覆。( 即使課程已經是兩三年前的課程了,現在也都 會看到教授的回覆,非常用心。 ) 2. [ YouTube ] Machine Learning — 李宏毅 台大李宏毅所開設的機器學習課程,一直以來都是台灣及中國學習者極力推薦的中文課程 之一。課程內容與時俱進,每一年都會將最新的機器學習、深度學習的演算法、模型加入 到課程內,讓學習者能夠跟上整個領域的發展。數學的比重比林軒田教授的課程低,而且 多了許多有趣的範例及講述,上課起來輕鬆不少。然而,影片內容我個人覺得安排較為紊 亂,可能是每一年的課程進度剪接而成,在某一些地方的銜接度較差,這是上課時稍微讓 人困惑的地方。不過瑕不掩瑜,這門課程我認為還是非常值得花時間上的。 [ 補充 ] 最近中國一些人將李宏毅的課程整理成一個 github 專案,完全複刻課程內容 ,包含了課程中的所有 demo 以及課程作業內容,非常值得大家在上課的同時做參考使用 。 [ 補充 ] 李宏毅另外有一門課程 " Machine Learning and having it deep and structured ",會更深入講解機器學習的演算法跟架構,這也是後續上完 Machine Learning 後可以深入補充的課程。 3. [ Coursera ] Machine Learning — Andrew Ng 由 Stanford University 的吳恩達教授所開設的課程,這已經是全世界公認的經典了, 不過已經花了大半年上完前面兩門課程的我,可能要稍作休息,待日後有機會再來進行這 門課程的學習。 4. [ YouTube ] Large-Scale Machine Learning 清大吳尚鴻所開設的課程 (http://www.cs.nthu.edu.tw/~shwu/courses/ml/),忘了在哪 看見推薦的,我有上去大概看了一下,就學習論的部分我覺得講解的蠻清楚,就也是有空 可以再回頭來看看。 ===== Mathematics ===== 整個 Machine Learning 所涵蓋的數學領域其實是很廣的,有一些甚至不是數學系四年會 碰觸到的部分,而且某些部分甚至都是數學系、所一整學年的課程,我認為不用太糾結每 一個數學細節,找到一個可以說服自己的方式就好。( 當然,如果你真的想走演算法這條 路,要求就要再提高ㄧ些 )。如果有時間我會建議可以把機率統計以及線性代數的部分上 過一次(我大學機率統計實在學得慘不忍睹),我認為這兩個領域如果可以上手,就會輕鬆 許多。 1. [ 清大開放式課程 ] 機率論 2. [ 清大開放式課程 ] 統計學 3. [ 清大開放式課程 ] 數理統計 這三們都是清大鄭少為老師所開的課,基本上他的機統普遍受到許多人的推薦,我自己有 看過前面幾堂的機率論,我認為條理清楚,講義也很詳細,這是我真的很想找時間上的課 程。 4. 線性代數 這個部份我目前暫時沒有重新上課的打算,大學教授上的非常好,我的筆記也都還留著, 就可以來回對照著參考,如果有推薦的課程也可以讓我知道,一起推薦給所有人參考看看 。 ===== 補充資料 ===== 這裡推薦幾個我認為很有幫助的學習途徑,有些是課程,有些並不算是。但我認為都可以 在上面這些基礎課程以外作為增強實力的補充教材。(備註 : 這裡我選出來的都是比較廣 泛性的平台,但 Medium 或是ㄧ些個人部落格也有很多非常棒的補充資料可以看,但這樣 的資料多且雜,我就暫時沒收在下列推薦名單中。) 1. AI 研習社 ( https://ai.yanxishe.com/ ) 不得不說,中國在這領域的發展真的比台灣快而且豐富,當我在學習過程中找尋中文資料 時,九成都是從中國的論壇或是部落格中找到,台灣在這方面的分享上面的確比較少。 AI 研習社我會建議大家可以去他的線上課程看,裡面有幾個大師級的課程 ( 重點是有簡 中字幕XD ),例如 Hinton 的課程我就會想要找時間來看一下。裡面還有一些資料、論文 整理的部分,大家也是可以上去晃晃看。 PS:它有一門「機器學習必修之數學基礎」系列課程其實我還蠻有興趣的,但是學費不便 宜就… 2. CSDN博客 ( https://blog.csdn.net/ ) 不管閱讀論文還是課程上面有疑問,絕對可以針對同一件事情再上面找到非常多樣化的解 釋。上面我曾經說過,很多時候不要拘泥,找到一個能說服自己的方式就好,通常我都會 在許多不同的解釋當中選擇一個我比較理解且能接受的方式作為我對這件事情的理解。 3. 知乎 這有點像是中國版的奇摩知識+ (?),針對一個問題也可以看到底下有許多不同角度的切 入,我覺得這樣的學習其實蠻不錯的。當我在找資料的時候,只要是CSDN跟知乎我都會點 進去看一下,許多時候都會有不錯的收穫。 4. reddit/MachineLearing ( https://www.reddit.com/r/MachineLearning/ ) reddit 的 Machine Learning 版裡面有許多的神人,還潛伏了許多論文的作者在裡面, 時不時會有一些很新的論文發表、成果發表還有許多有趣的討論在裡面,我覺得可以收藏 起來看。 5. 微博公眾號 好,我知道這部分爭議很大,如果真的很介意的可以跳過這一 part。 我完全沒有在用微博,但為了ㄧ些公眾號的訂閱我才開始使用。許多公眾號會把很新的 AI 新知、或是一些知識整理放出來,雖然品質參差不齊,但也不得不說有時候真的能撿 到一些不錯的好文章。另外,覺得閱讀reddit 全英文資料很吃力的,有時候大概在 reddit 上面發表一兩天之後公眾號就有簡體中文的說明出來,我覺得有時候偷吃步其實 也是蠻可以的啦XDDDDD。還有一個公眾號會每天發送各種領域最新的論文內容出來,如果 閱讀論文速度很快的,可以從這樣的公眾號中拿到很多最新的論文資訊。 =======END======= 以上是我自己的一些學習資訊,也提供給大家參考看看 當然還有很多非科班出身必須要修的 例如資料結構跟演算法等等 我目前還沒有什麼概念,如果有人有推薦課程也希望不吝分享讓我知道一下 -- 聽眾散去了,希爾伯特卻仍留在講台上, 他等著看自己是否已經運用有利的例子,優越的論證, 以及具誘惑力的23個問題, 塑造他期盼見到的未來..... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.98.201 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1565639939.A.F2F.html
kumitang: 推分享 08/13 04:31
y956403: 好奇這樣學完能找到什麼類型的工作 08/13 06:18
st1009: 推推 08/13 06:46
sxy67230: 台灣的情況下,還是要補個碩班學歷,要不然就是Kaggle競 08/13 08:21
sxy67230: 賽的成績,要不然很難找到好的DS相關工作。畢竟DL跟ML 08/13 08:21
sxy67230: 的門檻比較高,就算是資工很多新的算法還是要搭配碩班 08/13 08:21
sxy67230: 的課程,像隨機程序、消息理論這類高階統計、資訊理論 08/13 08:21
sxy67230: 的課程。 08/13 08:21
sxy67230: 忘記了,還有電腦視覺,這門課以前我的學校也是開給碩班 08/13 08:23
sxy67230: 的,現在不知道有沒有下修。 08/13 08:23
st1009: 是說板上有一些徵才訊息,有啥工作可以參考 08/13 08:50
WilliamLFY: 幫推分享 08/13 09:25
fishstay: 推分享 08/13 09:31
DaLanPaa: 上過基石和李宏毅的課 其實不用再浪費時間看吳恩達在cou 08/13 14:59
DaLanPaa: rsera的課了 08/13 14:59
DaLanPaa: 太簡單又太舊了 只適合給初新者入門 08/13 14:59
filialpiety: 推推 08/13 18:09
teamo123: 吳恩達的影片真的超舊,看到影片右下角的時間有嚇一跳 08/13 18:10
aocaoef: 推分享,我本身非二類組科系畢業,所以線代的部分是聽清 08/13 18:54
aocaoef: 大趙啟超老師的課程,調理清晰又不會太難,適合一三類組 08/13 18:54
aocaoef: 的學生~~ 08/13 18:54
yougigun: 推 ps cousera 上也有 andrew 開的deep learning 的課也 08/13 19:14
yougigun: 不錯 08/13 19:14
sxy67230: 吳恩達的課要去看他的新課程,課程不難,但是光是看採訪 08/13 19:32
sxy67230: hinton、pieter、Ian Goodfellow就值了 08/13 19:32
sxy67230: 然後要上Coursera 的課建議每個都要跟著課程步調實作 08/13 19:34
sxy67230: 然後吳恩達下半年好像還有新的課程,直接教tf2.0的,比 08/13 19:37
sxy67230: 較針對不想懂太深理論的開發者面向,可以報名 08/13 19:37
goldflower: if you don't understand, that's totally fine 08/13 23:18
Kazimir: 線代最受好評的課應該是MIT的18.06 austin在edx上的那門 08/14 08:53
Kazimir: 課教得很乾 不過作業設計的很好 08/14 08:53
h5904098: 推原po分享 另外線代部分可以參考交大周志成教授的blog 08/15 20:53
h5904098: 內容範圍蠻廣的 但推導細節跟概念講的很清楚也很直觀 08/15 20:53
erre: 感覺還是掰陳直接call svm比線性回歸比較AI 08/16 11:46
futri752: 推分享 08/16 20:45