看板 Python 關於我們 聯絡資訊
各位好 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班 我手上有一份打卡記錄如上面所示 3/19 上班有打卡的紀錄三筆 但是我只需要第一筆(最早打卡成功) 請問我要怎麼在python裡面移除中間的兩筆? 資料用Pandas讀進來的 要用什麼方法來清理這份資料? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 70.93.230.230 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1554930661.A.E30.html
Luluemiko: pandas.DataFrame.duplicated keep first 04/11 07:09
s82237823: 感謝 04/11 09:32
結果實際coding之後遇到一個小麻煩 001 AAA 2019/03/19 002 10:12:32 上班 001 AAA 2019/03/19 002 10:12:45 上班 001 AAA 2019/03/19 002 10:13:10 上班 001 AAA 2019/03/19 002 20:34:53 下班 001 BBB 2019/03/19 002 10:12:32 上班 001 BBB 2019/03/19 002 10:12:45 上班 001 BBB 2019/03/19 002 10:13:10 上班 001 BBB 2019/03/19 002 20:34:53 下班 如果我用 pd.drop_duplicates(['日期'],keep='first') 會只剩下 001 AAA 2019/03/19 002 10:12:32 上班 因為日期是一樣的 然後只保留第一個 請問要怎麼選擇[姓名][日期][上班or下班] 然後再移除重複的 我現在想到的是 把人名用loop 但是還是需要日期/上下班兩個column 請問有什麼好方法或是library可以用嗎 謝謝 ※ 編輯: s82237823 (134.173.253.56), 04/11/2019 10:47:57
s82237823: 已解決 用subset可以選多個column 04/11 10:52