推 yyc1217:先排序 再用迴圈跑? 若下一個等於現在這個 就刪掉 01/20 23:32
推 infinitlee:塞到Set裡,在讀出來 01/21 00:08
推 cgkm:檔案小 => 二樓 檔案未必小 => 一樓 01/21 03:41
推 cgkm:混合式:第一回合,先塞入 set,塞滿後排序然後寫入暫存檔 01/21 03:52
推 cgkm: 第二回合:merge 所有的暫存檔, 同時剔除重複的字 01/21 04:05
推 ClareQ:用Set操作就沒錯啦...不需排序還是什麼暫存檔的反而沒效率 01/21 07:59
推 TonyQ:ClareQ , cgkm 提的混合式 ,恐怕是在一個記憶體空間塞不下的 01/21 08:16
→ TonyQ:狀況下才會用到的東西 ,應該只是考慮到不常見的特殊情境. :p 01/21 08:17
推 rukawa0328:特殊情況?可以舉個例子?感覺這方法並無法解決空間問題~ 01/21 11:46
推 TonyQ:在字串極大跟數量極多下,目的應是分離成多個子問題來求解. 01/21 14:00
推 LyinZ:他說的應該是寫暫存檔吧? 01/21 22:45
推 ClareQ:當然也可以實作出以磁碟IO為主來取代記憶體存取的Set 01/22 00:48
→ ClareQ:用Set比自己實作資料處理流程,更易懂好維護和抽換實作啊^^ 01/22 00:51
推 sbrhsieh:檔案極大不代表樣本數極大. 01/22 02:40
推 sbrhsieh:排序對空間的需求不是更嚴苛? 01/22 02:43
推 cgkm:限制一次排序數量 然後用 mergesort 的 merge 01/22 03:16