推 numpy: 所以一開始要連同 testing data 一起餵給 labelencoder 11/05 00:29
推 littlebo1990: 之前做的做法是做出一個dictionary 在0位置 11/05 01:00
推 littlebo1990: 放unknown. Test和training用同一個dict轉 11/05 01:04
→ littlebo1990: test中沒在trainin出現過的都丟到unknown 11/05 01:05
→ oo855050: numpy大感謝你的建議 11/05 11:48
→ oo855050: little大 請問要如何比較兩組資料中有哪些是對方沒有出 11/05 11:49
→ oo855050: 現的 並且將那些資料的位置找出來呢 11/05 11:49
→ littlebo1990: 先各自轉成token (or數字), 然後把token 存成dict 11/06 01:07
→ littlebo1990: 再用set取出unique的字, 再用set的method 11/06 01:12
→ littlebo1990: Difference or Symmetric difference 11/06 01:12
→ littlebo1990: note:數字的話要確保 字到數字 是 one to one 11/06 01:13
→ oo855050: 好的感謝little大的教學 我再試試看^_^ 11/06 19:28