看板 Python 關於我們 聯絡資訊
多欄位去除重複元素方式?(求思路) 目前爬取公司名稱和電話 將各個網站爬取資料整合起來時 會有以下狀況 欄位一(地區) 欄位二(公司名) 欄位三(電話) 台中市 公司名1 123456 中市 公司名1- 123456 中市西區 公司1 123456 以電話相同為基準去重 公司名任意留一個 三列處理完 希望只剩下一列 請問有什麼方式處理嗎 提個思路或套件都可以 感謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.218.52.174 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1550884019.A.C9F.html
charlie11438: https://bit.ly/2twYpqC 這個呢?轉成DataFrame去 02/23 09:16
charlie11438: 重 02/23 09:16
nini200: 好 謝謝分享 02/23 21:34
CodingMan: if key in list: del else: add to list 02/24 09:32
CodingMan: key = 你的電話 02/24 09:33
這只處理單一欄位吧?
adrianshum: [c.tel:c for c in company_list].items() ? 02/24 18:29
看不懂 還是謝謝您 ※ 編輯: nini200 (101.13.177.69), 02/25/2019 09:38:22
adrianshum: 打錯了orz { c.tel : c for c in company_list}.value 02/26 13:10
adrianshum: s() 才對 02/26 13:10
adrianshum: 解釋另回文吧 02/26 13:13