精華區beta NTUcourse 關於我們 聯絡資訊
※ 本文是否可提供臺大同學轉作其他非營利用途?(須保留原作者 ID) (是/否/其他條件): 是 哪一學年度修課: 102-1 ψ 授課教師 (若為多人合授請寫開課教師,以方便收錄) 廖世偉 λ 開課系所與授課對象 (是否為必修或通識課 / 內容是否與某些背景相關) 資工所 網媒所 為選修 δ 課程大概內容 Big Data: Opportunities & Challenges Computation: MapReduce Hadoop In-Memory Computation : Spark Graph Computation: Pregel & HAMA Distributed Storage: GFS Distributed DB:Google's Big Table & HBase Distributed DB:Dynamo & Cassandra Data Warehouse: Hive & Shark Analytics: Google's Drmel & Drill Analytics: Big Explorer Tech Trend 以上轉自ceiba上的課程大綱。 就我自己上完的經驗,然後現在回想, 除了作業中有碰過的MapReduce & HAMA外, 其餘所有的東西都只剩下一些概念,然後知道這些名詞, 我想以後真的需要用到時,才會再深入去研究。 Ω 私心推薦指數(以五分計) ★★★★ 想從老師的Lecture中深入了解那些系統 (做不到) 想從老師的Lecture中了解系統的概念 ★★★ 想認真做個final,並與老師深入交流 ★★★★★ 想隨便混學分 (學不到什麼) 總結 ★★★★ η 上課用書(影印講義或是指定教科書) 上課用書,但推薦這本網路上的e-book Urs Holzle and Luiz Andre Barroso. The Datacenter as a Computer, Morgan & Claypool Publishers,2009 μ 上課方式(投影片、團體討論、老師教學風格) 投影片上課,老師會在台上講解系統的設計的原理, 然後常常會直接講code。 老實說,大部分的時候我都聽不懂,老師在台上講的東西不知所云。 我想老師他是懂得其內涵的,但是可能沒有表達得讓學生可以懂。 σ 評分方式(給分甜嗎?是紮實分?) Midterm: 30% Programming assignments & Hands-on: 35% Final project (proposal, oral presentation, report): 35% 期中平均60,標準差很大 分數還沒出來,不知道 ρ 考題型式、作業方式 考試 :問答題、手寫程式題,好像是助教出的題目, 所以非常的偏非常的細,例如要手寫spark版的Kmeans, 然而對於spark,老師只有帶過spark官網的sample code, 作業中也沒使用過; 又或是會考到很細的什麼MapReduce的combinor, 誰寫普通的MapReduce考慮過這個東西?? 我在上課方式那裡有講到,很多那麼細的東西, 我上課的時候就沒有真正聽懂,所以當時在考期中的時候, 就很憤憤,覺得為什麼要考這麼細,而不考一些大的架構。 不過最後,助教改得還算寬鬆,我的分數也就還好。 作業x2:程式作業,MapReduce & HAMA 是用這兩種framework寫跟PageRank相關的演算法。 環境必須自己架設,例如HAMA, 不過MapReduce好像可以用停機很久的國網中心。 作業差不多花我2天的空閒時間可以完成, 從裝環境到跑sample code,到改code,debug。(我是資工系大四。) Final Presentation: 每組有12分鐘時間報告, 3分鐘Q&A。 ω 其它(是否注重出席率?如果為外系選修,需先有什麼基礎較好嗎?老師個性? 加簽習慣?嚴禁遲到等…) 基礎要會寫程式,最好是Java。 因為我實際跟老師聊過,老師他是一個好人, 會想認識學生並真正記得你是誰, 他也會關心你的研究,並會給予一些方向上的建議。 我覺得可以看出,老師是有料的,只是在台上表現不出來, 無法講得讓人聽得懂,然後閒話太多,但是實際跟老師單獨談話, 卻不會覺得老師閒話很多,看老師的email也覺得老師是個有條理, 邏輯清晰的人。 所以,我覺得老師是個強者,也是個想認識學生的好老師, 只是在台上的時候表達不出來。 第二次作業的時間差不多在期中考後2-3禮拜due, 所以可以說留了相對充裕的時間來做Final Project, 這點我覺得是相當不錯的,只要找到好隊友, 並提早穩定開始做,最後出來的成果都不會太差。 關於final project presentation, 這個部分我要大大稱讚老師的厲害, 老師從業界找了不少評審,大概有10個以上, 使得場面變得相當正式與盛大, 例如有些組別報告完他們自己設計的資料庫, 就會有一些業界前輩很積極地過去交流, 我覺得這基本上是挺好的一件事, 各取所需,提供更多的機會等等。 加簽都收。 出席沒差。 Ψ 總結 這門課我不甚滿意的部分有,助教出題、 沒有公用Hadoop Cluster可以讓學生用、老師講課讓人不太懂 但是為什麼我仍會給予★★★★的評價,主要基於2點。 1. 老師是個好人,私下與他接觸,可以學到很多, 而且老師在final project presentation的時候找來了很多業界評審 ,我覺得老師是真的有實力有料。 2. 我自己這組的final project,很早就開始做, 所以自己在這門課,也是有學到不少東西, 寫了不少code,並把MapReduce應用在我們的project中, 還是很有收穫。 最後,老師下學期有要開,Android虛擬機及編譯器, 老師是Android系統code的實際貢獻者,一定很強大。 有興趣的同學可以考慮! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.16.156 ※ 編輯: nkfly 來自: 140.112.16.156 (01/13 20:14)
hsnuconan:哇!這麼好的課 我下學期一定要修Big Data應用 01/13 23:10
WCLab:樓上老師愛將 最喜歡跟老師一起沖鋒了 01/13 23:48
WCLab:走過路過千萬不要錯過喔 喜歡都可以試聽看看 01/13 23:52
Carlchen:\Big Data/ \Android/ 01/13 23:57
lsc36:下學期想修他的Andriod系統 XD 01/14 01:46
bowlbone:加簽有都收嗎? 第一堂看到盛況後就退了...orz 01/14 07:31
KernelChen:樓上一堆亂推文 請不要誤導別人 01/14 10:38
KernelChen:然後原po也不是一路唸上來的 半路出家是能給什麼有用的 01/14 10:39
KernelChen:資訊? 01/14 10:39
QDR18:修課有一定風險 學分投資有過有當 選課前應詳閱公開說明書 01/14 15:38
deicide218:一到五樓都是他Lab的學生是嗎囧 01/14 23:48
samyyhh:一事歸一事 扯原PO半路出家也太過分了吧 01/15 01:32
drliao:有鼓勵有指教的評價,最真,才可幫台灣衝鋒BigData或Androi 01/15 10:25
drliao:我改進:去年在史丹佛教CS243時,每週有recitation hours幫 01/15 10:29
drliao:沒跟上的同學,所以沒收到有沒跟上的指教,下學期加這hours 01/15 10:31
drliao:請大家勿人肉搜索一到五樓,我不知。每個修課學生都是菩薩 01/15 10:37
drliao:不敢有“愛將”想法。謝謝。 01/15 10:38
ikeaven:這門課給我的感覺就像一家學習吃到飽的餐廳,提供豪華餐點 01/16 09:24
ikeaven:需要衝鋒挑戰的,有深度;需要認識業界技術的,有交流; 01/16 09:26
ikeaven:需要更多時間修其他課的,不點名;需要分數的,有空間 01/16 09:27
ikeaven:如果這不是值得選的一門課,那甚麼是值得選的課 ?? 01/16 09:39
chanhou:請問需要先修什麼課程嗎?本身修過C++可以嗎? 01/27 13:55
drliao:Understanding of programming is necessary but not suffi 01/30 09:06
drliao:cient. Reviewing of my course slides on BigData Systems 01/30 09:06
drliao:is strongly recommended. Plus, read related course mate 01/30 09:07
drliao:rial in data mining, machine learning, information retr 01/30 09:08
drliao:ieval. Happy New Year and Happy reading during 寒假。 01/30 09:10