看板 Statistics 關於我們 聯絡資訊
data new; set old; retain lastpagename $ newstep; if step = 1 then do; newstep = 1; output; lastpagename = pagename; end; else if pagename ^= lastpagename then do; newstep + 1; output; lastpagename = pagename; end; drop lastpagename newstep; run; 空打,沒實際跑過,可能有bug... ※ 引述《loser3o0 (loser3o0)》之銘言: : 大家好, : 我的資料長這樣,是網頁分析資料,有三個欄位, : SessionKey是拜訪cookie的key值,區分不同拜訪網頁者, : PageName是觀看頁面名稱 : Step是依時間排序的觀看次序, : SessionKey PageName Step : 1 A 1 : 1 A 2 : 1 B 3 : 1 A 4 : 1 A 5 : 1 C 6 : 1 C 7 : 2 A 1 : 2 B 2 : 2 B 3 : 3 A 1 : 3 C 2 : 3 C 3 : 因為常常在相同頁面觀看,我想將資料壓縮成 : SessionKey PageName Step NewStep : 1 A 1 1 : 1 B 3 2 : 1 A 5 3 : 1 C 6 4 : 2 A 1 1 : 2 B 2 2 : 3 A 1 1 : 3 C 2 2 : 時序觀看相近的PageName合併成一筆資料(取最前面那一筆),再重新排次序, : nodupkey好像不行 會把 這兩筆都刪掉,但是我只是要把相近的刪除, : SessionKey PageName Step : 1 A 4 : 1 A 5 : 起問各位先進有處理這樣的資料的經驗嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.227.175.119 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1508257951.A.69C.html
loser3o0: 感恩回應這方式我再研究看看 10/18 19:19