[轉錄] 史上最完整機器學習自學攻略！我不相信

作者ruthertw (督人無數就是我)

看板deeplearning

標題[轉錄] 史上最完整機器學習自學攻略！我不相信

時間Tue Feb 13 17:31:19 2018

史上最完整機器學習自學攻略！我不相信有人看完這份不會把它加進我的最愛 https://buzzorange.com/techorange/2017/08/21/the-best-ai-lesson/ 2017/08/21 問耕／編譯整理【我們為什麼挑選這篇文章】我們知道很多 TO 的讀者都有相關需求，過去我們分享單堂課程比較多，這次我們看到這篇非常完整的總整理，從上課到作業，還有課外實作全部都包裹了，相信一定會很大程度的幫到大家。（責任編輯：林子鈞）這篇文章的作者為 Andrey Nikishaev，他既是一個軟件開發者，也是一個創業者。如何成長為一名機器學習工程師？經常有人這麽問，而這篇文章就嘗試回答這個問題，其中會談到關於機器學習的方方面面，從簡單的線性回歸到最新的神經網絡。你不僅將學習如何使用這些技術，還將學習如何從頭開始構建它們。這個指南主要面向計算機視覺（CV），這也是掌握一般知識的最快方式，從 CV 中獲取的經驗可以簡單地應用到機器學習的其他領域。我們將使用 TensorFlow 作為框架。這些課程需要你會 Python，雖然不要求你是大師，但至少要懂基本的知識。（另外，都是英語授課）溫馨提示，學習知識與動手實踐相結合效果更佳。 1. 課程 1.1 約翰霍普金斯大學的實用機器學習課程總共 4 周，用戶評分：4.4（5 分制，下同） 1.2 史丹佛大學的機器學習課程總共 11 周，用戶評分：4.9。授課教師是大名鼎鼎的吳恩達。上面兩節課，會教給你數據科學和機器學習的基本知識，並為下面的學習做好準備。 1.3 CS231n：面向視覺識別的卷積神經網絡總共 16 個課時，目前已更新為 2017 春季的最新版本。李飛飛是這節課程的導師。現在才算步入正軌。這是網上最好的機器學習與計算機視覺課程。 1.4 Google 講深度學習整個課程大約耗時三個月，導師為 Google 首席科學家 Vincent Vanhoucke，以及 Google Brain 的技術負責人 Arpan Chakraborty。在這個課程中，將會教授深度學習的原理、設計可以從覆雜的大型數據集學習的智能系統、訓練和優化基本的神經網絡、CNN、LSTM 等。選修課。你可以只看其中練習的部分。 1.5 CS224d：面向自然語言處理的深度學習總共 17 個小時。選修課。推薦給那些需要用到 NLP 的同學。課程內容也很棒。 1.6 深度學習電子書 Leonardo Araujo dos Santos 整理的深度學習電子書。選看。這是一本涉及諸多機器學習領域的好書。 2. 練習這部分給了一堆教程和項目的清單，你應該逐一嘗試並了解它們的工作原理，以及考慮如何進行改進提升。這個列表的存在，只是為了增加你對機器學習的興趣，所以遇到一些困難也別氣餒，當你準備好就可以隨時上手練習。 2.1 TensorFlow 上的簡單練習 Kadenze 學院出品，總共 5 個課時。 2.2 Tensorflow 菜譜這部分內容來自 Nick McClure 的電子書《TensorFlow Machine Learning Cookbook》。 2.3 Tensorflow-101 教程部分這是一個用 Python 和 Jupyter Notebook 編寫的教程。試圖為 TensorFlow 初學者提供盡可能的詳細解釋，希望對大家有用~ 2.4 快速風格遷移網絡這個教程展示了如何使用神經網絡，將名畫的風格遷移到任何一張照片上。 2.5 圖像分割這是一個使用 TensorFlow 實現的完全卷積網絡。作者 Marvin Teichmann 還提供了如何把這部分代碼集成到你的語義分割管道中的示例。 2.6 使用 SSD 實現物體識別物體識別最快（也是最簡單）的模型之一 2.7 面向物體識別和語義分割的快速掩膜 RCNN 2.8 強化學習非常有用，特別是當你想搭建一個機器人或者下一個 DotA AI 時。 2.9 Google 大腦團隊的 Magenta 項目這個項目旨在通過神經網絡創造出色的藝術和音樂作品。 2.10 深度雙邊學習實時圖像增強一個很棒的圖像增強算法，來自 Google。 2.11 自動駕駛汽車項目想造一輛自動駕駛汽車嗎？這是一個很好的入門。 3. FAQ 如果中途卡住了怎麽辦？首先，你得明白機器學習不是 100% 精確的東西，大多數情況下只是一個很好的猜測，並且需要大量的調整疊代。大多數情況下，想出一個獨特的點子是非常困難的，因為你的時間和資源將耗費在訓練模型上。所以，不要自己想解決方案。去搜索論文、項目，以及求助他人，積攢的經驗越多，你會幹的越好。給幾個可能有用的網站： http://www.gitxiv.com http://www.arxiv-sanity.com https://arxiv.org https://stackoverflow.com 為什麽論文不能完全解決這個問題，為什麽論文有些地方是錯的？很遺憾，並不是所有的科技人員都想把他們的成果公之於眾，但他們都需要發表論文來獲得「名」或者「利」。所以一些人可能只發布部分素材，或者給出錯誤的公式。所以找到代碼永遠比找到論文更有用。哪裡可找到最新的資料？參考上面推薦過的幾個網站，尤其是 gitxiv.com，不僅僅能找到論文，而且還能找到代碼，所以特別實用。我應該用雲計算還是桌機/筆記本電腦？雲更適用於有大量計算需求的情況。對於學習和測試來說，使用桌機／筆記本電腦要便宜得多，當然前提是配有支持 CUDA 的顯卡。比方，我自己就用一個筆記本訓練模型，顯卡是帶有 690CUDA 核心的 GTX GeForce 960M。當然，如果有免費的雲資源可用，當然要用。如何更好地調整超參數？訓練的主要問題是時間。你不可能一直坐在那看著訓練數據。因此，我建議你使用 Grid Search。基本上，只需要創建一組超參數和模型架構，然後一個接一個的運行，並保存結果。這樣就能晚上訓練，白天比較結果，找到最有希望的那個。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.92.132 ※ 文章網址: https://www.ptt.cc/bbs/deeplearning/M.1518514290.A.816.html

推 GGrunrunder: 推 02/14 17:35

推 psp123456e: 推 02/14 18:06

推 st1009: 推 02/14 20:33

推 aaaba: 推 02/15 09:38

推 howayi: 感謝這篇介紹gitxiv 02/20 00:55

推 delvinnew200: 推個 02/23 12:06

推 DeepLearning: 跪推 02/25 00:59

推 francis5478: 推 02/26 22:36

→ dongogo: 推推 02/26 22:44

推 mystage: 推 02/27 11:40

推 chungyiju: 02/27 23:52

推 UCCUplz: 推 02/28 00:43

推 CH2STUPID: 推 02/28 23:24

推 avmm9898: 推 07/05 11:30

推 ststchu: 推 07/09 10:16

推 anarch: 推 03/01 15:19