因為工作需求,第一次自己寫一個很簡單的爬蟲分析
其實也是照著網路上面各個神人的方式刻成符合自己的需求
首先因為python 簡陋,你要依你的需求安裝module
才能帶入這個module的指令
我們今天是要爬網頁,所以會需要安裝下面幾個套件
使用pip install 的指令進行安裝 pip install (your_module_name)
其實也是照著網路上面各個神人的方式刻成符合自己的需求
首先因為python 簡陋,你要依你的需求安裝module
才能帶入這個module的指令
我們今天是要爬網頁,所以會需要安裝下面幾個套件
使用pip install 的指令進行安裝 pip install (your_module_name)
第一個要安裝BeautifulSoup 套件再來我們還需要搭配使用
lxml 套件與 requests 套件。lxml 套件是用來作為 BeautifulSoup 的解析器BeautifulSoup 可以支援的解析器其實不只一種還有
html.parser(Python 內建)與 html5lib根據官方文件的推薦,我們使用解析速度最快的
lxml。文章標籤
全站熱搜
