推 hilorrk:我知道master必須informed其他worker location of data啦. 08/24 06:28
→ hilorrk:用MapReduce當然就不可能像以前寫MPI還要在code裡切割分配 08/24 06:29
→ hilorrk:我的意思是..由master傳輸process和location受限於master 08/24 06:30
→ hilorrk:網路是沒辦法的吧?相較下來map task從DFS讀取大量data及運 08/24 06:31
→ hilorrk:算才是真正的平行所在?(當然還包括reduce) 08/24 06:33
→ hilorrk:至於map worker的grouping及reduce worker的merge要如何實 08/24 06:41
→ hilorrk:現 這又是另一個問題了...確實有看到不少model就是了 08/24 06:42
→ hilorrk:不知我的概念是否還有哪裡有需要指正的地方? 08/24 06:58
推 ledia:哈哈, 別擔心, 你是對的, 對拒絕學習的人可以不用這麼認真 08/26 09:43
推 ledia:MapReduce 只是雲端的一小部份, 如果像某些人想要又拿來傳 08/26 09:46
→ ledia:資料, 又拿來解決 synchronization, 還真是浪費了 MapReduce 08/26 09:47
→ ledia:message passing, voting, dynamic routing 等等 08/26 09:50
→ ledia:這些 building block 沒概念, 抱著 MapReduce 一直玩, 還說 08/26 09:50
→ ledia:別人不能承認錯誤 ? 噗哧 XD 08/26 09:51
→ yauhh:hilorrk,文章並沒有明確講由master傳一個process出去,事實上 08/26 20:01
→ yauhh:的確不這麼做,因為每一台電腦的Pid不一樣. 08/26 20:01
→ yauhh:ledia,我說你啊,你沒有指出我有什麼錯啊. 我在談的就是 08/26 20:02
→ yauhh:MapReduce的Framework,而不是特定工作. 是你自己一直把問題 08/26 20:03
→ yauhh:牽到map的層次而已. 你知道我講mapper是指map master嗎? 08/26 20:03
→ yauhh:而我的確指出你的錯誤,只是你還是要嘴硬不想回一句"抱歉錯了 08/26 20:04
→ yauhh:只能說,因為我還關心著MapReduce,所以目前文章還是反覆讀, 08/26 20:04
→ yauhh:實作也正在默默進行. 這些過程全都不干你的事. 08/26 20:05
→ yauhh:反正你有MQ server就滿意了. 08/26 20:06
→ hilorrk:的確啦..我說傳送process不是很嚴謹 應該是從user的程式 08/26 20:12
→ hilorrk:fork出一個process在worker上~不過也不能用每一台電腦的 08/26 20:12
→ hilorrk:pid不一樣來說啦 畢竟一個worker上可能有多個task~ 08/26 20:13
→ hilorrk:我的重點在於 挺好奇y大所說的從master傳輸(assign?)task 08/26 20:16
→ hilorrk:給map worker時如何作到您所意指的"分散式資源分配" 08/26 20:16
→ hilorrk:就我認知當中 這點的確得依賴於master對外傳輸的速度@@ 08/26 20:18
→ hilorrk:還有請兩位息息怒..交流上難免會有意見不同處 我相信L大和 08/26 20:19
→ hilorrk:Y大在資訊領域都有很深的見解 希望能就技術層面來討論就好 08/26 20:20
→ hilorrk:不要傷了皇城之內的和氣啊XD(誤 08/26 20:20
→ yauhh:最後這不用管,反正該有的分寸我自己也會抓好. 養新板不容易 08/26 20:29