推 gmoz:感謝:) 09/07 16:58
→ yauhh:出處在哪? 09/07 20:10
→ yauhh:你跳出來說他們做的仍然慢,但卻沒有相對快的方案,有何意義? 09/07 20:20
→ hilorrk:y大的意思是@@? l大說的這些在MapReduce paper裡都有解釋 09/07 20:49
→ hilorrk:吧..而且不太懂您第二句話是質疑哪一點||? 09/07 20:50
→ yauhh:因為這些都是用想出來的不是嗎? 根本沒有很明確知道node的性 09/07 21:10
→ yauhh:質是如何,就一定要說這種計算一定有這種狀況.那這話聽聽就好 09/07 21:10
→ yauhh:等哪位真的有在用的,有明確的經驗分享,再聽聽看有沒有道理. 09/07 21:11
→ yauhh:像第二點說"很可能算回來的資料也不一定對",要講為什麼他也 09/07 21:12
→ yauhh:不見得講得出所以然. 09/07 21:13
→ yauhh:程式你自己寫的,放出去算卻擔心不一定對?? 當做是Java2K嗎? 09/07 21:13
→ yauhh:hilorrk我想你指的是他第一段,paper有解釋. 但我吐槽的是第 09/07 21:25
→ yauhh:二段之後的部份,看起來是自己延伸出來的. 09/07 21:27
→ hilorrk:在redundant storage裡是有verification的機制啦... 09/07 21:42
→ hilorrk:不過在straggler裡的確沒有看到類似的東西@@ 09/07 21:43
→ hilorrk:不過我想l大主要是想說"straggler"不一定是machine crash 09/07 22:12
→ hilorrk:只要是超出預定時間 (其他worker做完的正常時間)都算是 09/07 22:12
→ yauhh:MapReduce並沒有說要把產出資料的複本彼此比對. 加入彼此比 09/07 22:33
→ yauhh:對就變成另一種大量工作,而如此會做不完. 09/07 22:33
→ yauhh:MapReduce也沒有說給straggler定一個預期時間去估喔,他們只 09/07 22:34
→ yauhh:說,送出去結果節點不能工作了,就重送到別的活動節點. 在文章 09/07 22:35
→ yauhh:中,你也看過,並沒有提到對任何指派有個預估的時間. 事實上, 09/07 22:35
→ yauhh:對一份工作開始要預估時,那就麻煩了---這可是親身體驗. 09/07 22:36
→ yauhh:然後,"複本彼此比對"這個延伸概念很荒謬.原典並沒有這樣講, 09/07 22:41
→ yauhh:他自己生出這個有問題的概念,接著因為生出的問題而卡住,又 09/07 22:41
→ yauhh:反過來說是MapReduce的問題. 這種思考過程不對的. 09/07 22:42
→ yauhh:而且至少有二個複本拿出來比對,一比對有差錯,誰是真的?? 09/07 22:53
→ hilorrk:我不是說要去做估計的動作啦 我的意思是straggler是相對於 09/07 22:59
→ hilorrk:在正常時間完成的task 不一定是crash的machine... 09/07 23:00
→ hilorrk:我記得實作的方法是在MapReduce快結束的時候把剩下還沒結 09/07 23:01
→ yauhh:straggler如果不是當機而是其他情況,有何差別? 對主控端來說 09/07 23:01
→ hilorrk:束的task(有可能是straggler的)backup一份到好的worker上 09/07 23:02
→ yauhh:最明確的狀況是發現node當掉了,不管怎樣的情況. 09/07 23:02
→ yauhh:我可以告訴你,你現在說的"未結束的task"backup一份到好的 09/07 23:03
→ hilorrk:原paper有提到一個情形是該worker上有另外一個程式在執行 09/07 23:03
→ yauhh:worker上,不可能. 每一台電腦的行程代號都不一樣. 他們是 09/07 23:03
→ hilorrk:那個程式會關掉catch..所以造成task執行變慢 但基本上 09/07 23:04
→ hilorrk:worker並沒有損壞.. 09/07 23:04
→ yauhh:發現遠端工作不會完成時,把同樣的工作按照spec重新派到好的 09/07 23:04
→ yauhh:node去做. 09/07 23:04
→ yauhh:另外,請舉例說,在遠端電腦好的情況下,你怎麼知道task損壞? 09/07 23:05
→ hilorrk:不太懂耶..task損壞?基本上backup時不知道該task是不是 09/07 23:07
→ hilorrk:straggler 是啟動backup後看原本的和backup哪個先做完吧? 09/07 23:07
→ hilorrk:如果原本的真的是straggler 那backup自然會有加速效果囉 09/07 23:08
→ hilorrk:如果不是那也是損失些計算能力..在cluster裡這不算什麼吧 09/07 23:08
→ ledia:hilorrk 何必多費唇舌, 這好幾年前就一直再用的東西 09/08 15:29
→ ledia:現在問我到底根據再哪, 我也只能指著那些 data center 09/08 15:30
→ ledia:當證據了 囧 09/08 15:30
→ hilorrk:呃..l大也別這麼說嘛 大家討論討論 互補一下不足囉@@ 09/08 18:38
→ hilorrk:我也能從y大那得到一些啟發 瞭解自己理解錯誤的地方啦 09/08 18:39