看板 Statistics 關於我們 聯絡資訊
※ 引述《loser3o0 (loser3o0)》之銘言: : 大家好, : 我的資料長這樣,是網頁分析資料,有三個欄位, : SessionKey是拜訪cookie的key值,區分不同拜訪網頁者, : PageName是觀看頁面名稱 : Step是依時間排序的觀看次序, : SessionKey PageName Step : 1 A 1 : 1 A 2 if nagename=lag(pagename) then delete; : 1 B 3 : 1 A 4 : 1 A 5 : 1 C 6 : 1 C 7 : 2 A 1 if this is C you will delete, so failed i believe the following code would work data yourdata; set yourdata; if nagename^=lag(pagename) then output; if sessionkey^=lag(sessionkey) then output; run; data yourdata; set yourdata;by sessionkey; retain newstep 0; newstep=newstep+1; if first.sessionkey then newstep=1; run; : 2 B 2 : 2 B 3 : 3 A 1 : 3 C 2 : 3 C 3 : 因為常常在相同頁面觀看,我想將資料壓縮成 : SessionKey PageName Step NewStep : 1 A 1 1 : 1 B 3 2 : 1 A 5 3 : 1 C 6 4 : 2 A 1 1 : 2 B 2 2 : 3 A 1 1 : 3 C 2 2 : 時序觀看相近的PageName合併成一筆資料(取最前面那一筆),再重新排次序, : nodupkey好像不行 會把 這兩筆都刪掉,但是我只是要把相近的刪除, : SessionKey PageName Step : 1 A 4 : 1 A 5 : 起問各位先進有處理這樣的資料的經驗嗎 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 183.234.130.198 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1508333538.A.498.html
loser3o0: 感謝回應您的寫法跟我類似加深我的信心感恩 10/19 22:24