看板 C_Sharp 關於我們 聯絡資訊
我是用Visual Studio 2010 C# 想要對網頁進行parsing 之前用C++時,有用一個parser還不錯用 可以直接搜尋node 不知c#有沒有免費的parser? google的結果,Winista.HtmlParser.dll找不到可下載的載點 或者其它是下載後是專案檔,不知道怎麼轉成DLL直接參照 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.104.148.195
apiod:你之前C++是用哪一個parser? 04/03 00:03
conan99:cpp是XML的parser才對,但是忘了哪個了,許久沒用了 04/03 00:13
conan99:java是HTML的,但也忘了哪個,這個還有一個介面可以測試 04/03 00:14
james732:如果是XML的話,C#有內建的可以直接使用 04/03 00:47
bcse:參考看看 http://msdn.microsoft.com/library/system.xml 04/03 00:49
kewang:http://kewang.pixnet.net/blog/post/25406115 Fizzler不錯 04/03 01:13
totte:前陣子有遇過相同問題,後來使用Html Agility Pack 04/03 09:48
conan99:想問個問題:可以拿「XML PARSER」parsing 「HTML」嗎?XD 04/03 15:31
james732:如果是XHTML的話應該可以...? 04/03 15:34
conan99:那我了解了,再找時間來試試^^謝謝各位 04/03 15:49
yuweisu:可以用HTML Agility Pack 在MSDN上可以下載 還有說明 04/04 09:00
petrushka:如果html不是well-formed, 可以使用Tidy處理成xhtml 04/06 18:17