[問題] BeautifulSoup 抓國旅卡網站資訊問題請教

作者threeSecGun (三秒槍)

看板Python

標題[問題] BeautifulSoup 抓國旅卡網站資訊問題請教

時間Tue Jan 29 17:34:33 2019

感謝版上先進指點己能正確讀入網站內的資料目前在使用BeautifulSoup時發生些困難再次求解以下是網站部分原始html碼: ------------------------------------- . . . <TD><A HREF=http://www.eyesmart.com.tw target=_blank> ００７０天母營業所</A> </TD> <TD>其他業別</TD> <TD> 02-28712835</TD> <TD> 台北市士林區天母東路１至３號</TD> <TD ALIGN="CENTER"> 無 </TD> <TD ALIGN="CENTER"><A HREF=/NASApp/NTC/servlet/com.du.mvc.EntryServlet?Action=RetailerEdit&Type=GetFull&Id=161150&RequestType=0&WebMode=text> 詳細內容</A></TD> </TR> <TR BGCOLOR=#FAFAF5 VALIGN="TOP"> <TD> ００７０寶島天母營業所 </TD> <TD>其他業別</TD> <TD> 02-28712835</TD> <TD> 台北市士林區天母東路１之３號</TD> <TD ALIGN="CENTER"> . . . (略) ------------------------------------ 我直接用soup.find_all('small')來抓出所有包在tag的內容如此可以抓到所有廠商資料但如果tag裡面還有<a>tag 的話就沒辦法抓到裡面的內容 --->None 顯示如下: ------------------------------------ ００２６寶島士林（二）營業所其他業別 02-28313505 台北市士林區中正路１９４號 None 其他業別 02-27365908 台北市大安區通化街９２號 ------------------------------------ 想請教版友先進若想要同時抓取 內容 和 <A herf=....>內容</A> 的話有什麼比較建議的作法? 感謝~ ※ 編輯: threeSecGun (49.213.204.25), 01/29/2019 17:35:50

→ kuro: 我也是菜逼巴如果只要 small 標籤裡面的文字的話 01/29 18:01

→ kuro: 我會直接 for t in soup.find_all('small'): 01/29 18:01

→ kuro: print(t.text) 01/29 18:01

→ threeSecGun: 感謝對BeautifulSoup不熟. 誤用t.string 01/29 19:26

→ threeSecGun: 改用t.text即可正常取用所有tag內容感謝樓上協助 01/29 19:26

推 utap2001: soup.find_all('small').find_all('a')就可以取到所有a 01/30 00:19

推 jasonfghx: 這網站是蛇呢? 01/30 10:51

→ threeSecGun: 感謝utap指點原來可多次對<tag>find_all這樣很方便 01/30 16:03