[問題] 搜尋 nested list 中的字串

作者hohiyan (海洋)

看板Python

標題[問題] 搜尋 nested list 中的字串

時間Fri Oct 24 23:49:34 2014

大家好我目前正在自學python，想請教是否有更好的方法來處理搜尋nested list中的資料。例如一個 nested list 為 ft = [['a',10],['b',5],['c',11'],['d',3]] 題目為 Function add() takes a single-character string and a ft, and modified the ft to increase the number of occurrences of that character by 1. 例如 add('a',ft) 會 return ft = [['a',11],['b',5],['c',11'],['d',3]] 而 add('i',ft) return ft = [['a',10],['b',5],['c',11'],['d',3],['i',1]] 第一個問題是若我想要確認某個字元是否已在這個nested list中，應該怎麼做？我用 'a' in ft 會error，只知道可以用 'a' in ft[i] 所以我就先 flat(?) 這個 nested list 讓它變成： ['a',10,'b',5,'c',11,'d',3] ← 但這樣好像很笨？第二個問題是怎麼改進這個function 的寫法，下面是我目前的寫法 def add_occurrence(x, ft): nt = [] new_ft = [x for y in ft for x in y] if x not in new_ft: nt += [x,1] ft.extend([nt]) else: for L in ft: if x in L: L[1] += 1 return None 看起來可能很笨，但因為我目前也只學到 list 相關的進度，我想請問如何改善這個function的效率？可以怎麼改進這個 function 的寫法？因為我覺得它的效率似乎不太好，當我用它去跑一個很大的文件檔（幾萬字的txt file），要跑上超過一分鐘。我總覺得一定是我寫的function 太爛了所以才要跑這麼久 Orz... 在此先感謝各位高手。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 149.159.27.253 ※ 文章網址: http://www.ptt.cc/bbs/Python/M.1414165778.A.413.html ※ 編輯: hohiyan (149.159.27.253), 10/25/2014 00:04:46

→ mikapauli: 第一個問題，可以用'a' in list(zip(*ft))[0] 10/25 00:30

→ mikapauli: 第二個問題，就你的寫法: 10/25 00:46

→ mikapauli: nt = []; nt += [x, 1]; ft.extend([nt]) 10/25 00:46

→ mikapauli: 可以直接寫ft.append([x, 1]) 10/25 00:46

→ mikapauli: if x in L 可以寫 if x == L[0] 10/25 00:46

→ mikapauli: 結合第一個問題定義new_ft = list(zip(*ft))[0]的話 10/25 00:52

→ mikapauli: 第二個問題else區塊內可以寫成 10/25 00:52

→ mikapauli: ft[new_ft.index(x)][1] += 1 10/25 00:53

→ mikapauli: 另外你可以參考一下dict 10/25 00:57

→ hohiyan: 感謝！有很多地方自己想好久都想不到，謝謝提醒。 10/25 12:38