推 timfan3939: 尿布和啤酒,並不是用hadoop找到的 08/27 16:43
→ timfan3939: 以往的資料分析,是要下載資料後才分析 08/27 16:44
→ timfan3939: 但hadoop改變了這架構,程式上傳至儲存的地方分析 08/27 16:45
→ timfan3939: 最後再統計結果 08/27 16:45
→ timfan3939: 你舉的尿布與啤酒,似乎只是特解示一個特殊的現象 08/27 16:46
→ timfan3939: 就是買尿布的人,會順帶一打啤酒(因為是男人在買的) 08/27 16:47
→ timfan3939: 實際應用應該是將啤酒廣告或商品,放在附近 08/27 16:47
→ timfan3939: 不一定是隔壁,達到方便客人的角度 08/27 16:48
→ timfan3939: 或是將兩者放得很遠,為了取得兩樣商品,客人將走過 08/27 16:48
→ timfan3939: 全賣場,反而有可助於提升業績(可能會心動多買東西) 08/27 16:49
推 timfan3939: 多少錢→就硬碟大小,每筆交易記錄如何存下 08/27 16:55
推 timfan3939: 如何知此相關→有目的找也是可以,沒目的找也可。本 08/27 16:58
→ timfan3939: 例子重於說用資料採礦技術,發現法奇怪的結果。而如 08/27 16:58
→ timfan3939: 何正確解示此結果才是重點 08/27 16:58
推 timfan3939: 至於hadoop 只是用些技術,將「發現」這個結果的過程 08/27 17:00
→ timfan3939: 「加快」而已。要如何去找到你要的東西,還是依賴演 08/27 17:00
→ timfan3939: 算去達成 08/27 17:00
推 timfan3939: 不知以上有沒解答到您的問題? 08/27 17:05
→ sealoe: thx 我再想想看~ 08/28 10:20
→ sealoe: 我大概理解了 事實上我該朝向資料探勘去看 08/28 14:20
→ sealoe: 而不是被廣告詞導向 而使用實際上不見得實用的工具 08/28 14:21
→ sealoe: thx 08/28 14:21
推 timfan3939: 有時挖這個東西不一定是廣告,行銷不是只有廣告一途 08/28 19:37
→ timfan3939: 如何使用此結果來賺更多錢,對商人來說才是重要的 08/28 19:37
→ timfan3939: 所以別被框架框住了 08/28 19:38
推 felaray: 其實我覺得那就是資料探勘,Hadoop只是簡化分析的工具。 08/28 22:08
推 felaray: T大其實可以回篇文章了XD 08/28 22:09
→ felaray: 事交易的種類 08/28 23:17
推 kevingyc: 啤酒跟尿布,只是資料分析過後的觀察,不是一開始的假設 08/29 07:46
→ sealoe: 事實上 我稍微看了一下 這類的系統 都要非常大才有價值 08/29 15:14
→ sealoe: 舉個例子 對沃爾瑪的商品銷售資料做資料探勘 舉例奶粉尿布 08/29 15:15
→ sealoe: 或許可能利用到 但是對於傳統的店家 甚至於大潤發 08/29 15:15
→ sealoe: 似乎不太需要.(以找出最相關的兩件商品這種事上為例) 08/29 15:17
→ sealoe: 不過 我大概有點了解 要搞懂這方面的知識 似乎不是一天兩 08/29 15:18
→ sealoe: 天可以搞定. 且銷售資料也得累積. 舉例來說 我如果要用 08/29 15:19
→ sealoe: 就是要 1.先找人設計或是找到工具 2.根據工具特性輸入資料 08/29 15:20
→ sealoe: 做成資料倉儲的東西 3.經過一年後, 開始可以做些相關產品 08/29 15:20
→ sealoe: 的銷售調查(資料探勘) 這樣 真的合成本嗎? 之前的系統是 08/29 15:21
→ sealoe: 得全部換掉? 假設以10間超商就好了, 換掉POS換掉銷售資料 08/29 15:22
→ sealoe: 庫, 不用太多, 上百萬還是要的. 這樣要做啥才能真正讓 08/29 15:22
→ sealoe: 引入類似技術有價值呢? 還是說 這類技術是設計給沃爾瑪 08/29 15:22
→ sealoe: 類型的大公司使用, 如果規模不夠 實際上不該使用呢? 08/29 15:23
→ felaray: 樣本數要夠大 價值比較能顯現出來 因為在巨量資料的情況 08/29 19:36
→ felaray: 下用傳統人力已經無力去分析.. 08/29 19:37
推 timfan3939: 樣本數不夠大還是可以分析。只是分析出來的結果會有些 08/30 14:25
→ timfan3939: 雜訊,會導致誤判之類的。至於pos之類的,大多都有 08/30 14:26
→ timfan3939: 收據系統,就是買完後就給張收據,這也是未來公司對帳 08/30 14:26
→ timfan3939: 的資訊。若舊有pos好用的話,不如只增加存資料的功能 08/30 14:27
→ timfan3939: 也就是收據記錄功能就好了。 08/30 14:27
→ timfan3939: 資料方面,不是有需要才記錄,而是平時就在記錄,需要 08/30 14:28
→ timfan3939: 時才能快速取得,快速送去運算,得到結果 08/30 14:28
→ timfan3939: 說真的,如果公司沒計畫去記錄下所有可能的數據,那就 08/30 14:30
→ timfan3939: 用普通的市場調查就可以解決了。而大數據也算是市場調 08/30 14:31
→ timfan3939: 查的一部份,準確度比去一個一個問還準(資料多,且全 08/30 14:32
→ timfan3939: 部的資料都算),且較方便(用幾台電腦就跑出來了,不 08/30 14:32
→ timfan3939: 用花心思設計問卷、吸引別人來填之類的) 08/30 14:32