看板 Python 關於我們 聯絡資訊
※ 引述《xxfaintxx (faint)》之銘言: : 各位大神好,小弟想做一個電影評論網頁的Side-project : 思考方向與實作思維,還請各位大大不吝指教 : 1. 目前實作了兩支爬蟲,一個去抓取yahoo電影的資訊,一個抓取Movie版有 : 提到"雷"的標題 : 工具: Scrapy : 思考的方向:想將兩隻爬蟲抓下來的電影title與Movie版評論title做比對, : 並將電影title標記在Movie版評論Data裡,最後存到資料庫 : 完成的問題:成功爬到資料並把圖片下載到local端 : 遭遇的問題:兩隻爬蟲抓下來的資料怎麼做比對,目前是將資料匯出csv檔, : 用pandas .str.contains 去做電影title的比對,但performance : 似乎... 很慢 是因為我用錯方法? 還是有其他更快的方法?? : 2. 將存進資料庫的資料用django呈現網頁 : 工具:django : 思考方向:點頁面的電影title,呈現圖片、網路評分、Movie版鄉民暴雷的文章 : 提供瀏覽並計算"好雷"、"負雷"、"普雷"的挑論熱度 : 完成的問題:title與圖片相關資訊呈現在業面已完成 : 3. 最後最重要的問題,做完這Side-project 有辦法找到Python相關工作嗎?? : 還請大大們指教 相關工作,要找當然找的到,python 工作不算少,junior 職缺蠻多的 你的東西可以先放到 github,面試時,直接展示自己的 github web 也是,當你在面試時,可以直接展示 web 頁面, 你可以先貼你的 github 跟 web 網址,讓版上的大家參考,給建議 而且你的問題,有 code 直接看比較知道問題出在哪 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.97.49 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1601394440.A.77D.html