[問題] 移除重複的打卡記錄

作者s82237823 ()

看板Python

標題[問題] 移除重複的打卡記錄

時間Thu Apr 11 05:10:58 2019

各位好 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班我手上有一份打卡記錄如上面所示 3/19 上班有打卡的紀錄三筆但是我只需要第一筆（最早打卡成功）請問我要怎麼在python裡面移除中間的兩筆？資料用Pandas讀進來的要用什麼方法來清理這份資料？謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 70.93.230.230 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1554930661.A.E30.html

→ Luluemiko: pandas.DataFrame.duplicated keep first 04/11 07:09

→ s82237823: 感謝 04/11 09:32

結果實際coding之後遇到一個小麻煩 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班 001 BBB 2019/03/19 002 10:12:32 上班 001 BBB 2019/03/19 002 10:12:45 上班 001 BBB 2019/03/19 002 10:13:10 上班 001 BBB 2019/03/19 002 20:34:53 下班如果我用 pd.drop_duplicates(['日期'],keep='first') 會只剩下 001 AAA 2019/03/19 002 10:12:32 上班因為日期是一樣的然後只保留第一個請問要怎麼選擇[姓名][日期][上班or下班] 然後再移除重複的我現在想到的是把人名用loop 但是還是需要日期/上下班兩個column 請問有什麼好方法或是library可以用嗎謝謝 ※ 編輯: s82237823 (134.173.253.56), 04/11/2019 10:47:57

→ s82237823: 已解決用subset可以選多個column 04/11 10:52