python爬蟲之UserAgent

系統運維

在學習爬蟲的過程中在有的時候沒使用頭在使用python的爬蟲腳本剛爬了兩次,就只是測試了一下就打不開這個網頁了,剛開始還一直迷糊著,到后來才知道,python在做爬蟲的時候默認的user agent就是python的大版本,python2.7.的User-Agent: Python-urllib/2.7;python3.5.的User-Agent: Python-urllib/3.5

讓客戶滿意是我們工作的目標，不斷超越客戶的期望值來自于我們對這個行業的熱愛。我們立志把好的技術通過有效、簡單的方式提供給客戶，將通過不懈努力成為客戶在信息化領域值得信任、有價值的長期合作伙伴，公司提供的服務項目有：國際域名空間、雅安服務器托管、營銷軟件、網站建設、類烏齊網站維護、網站推廣。

下面來做個試驗:
python代碼如下:

python2

import urllib2

url = http://www.baidu.com/

request = urllib2.Request(url)

response = urllib2.urlopen(request)

print(response.read())

python3

from urllib import request

url = http://www.baidu.com/

req = request.Request(url)

response = request.urlopen(req)

print(response.read().decode()

我們開啟fiddler,運行完成代碼,然后在fiddler上面查看下我們的數據

很明顯就是python的版本,
因此我們在學習爬蟲的時候無論爬什么,代碼最好都要加上這個頭信息

下面我們在代碼上加入一個頭

from urllib import request

headers = {
    User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64
}

url = http://www.baidu.com/

req = request.Request(url,headers=headers)

response = request.urlopen(req)

print(response.read().decode())

抓包的結果如下:

文章名稱：python爬蟲之UserAgent
URL鏈接：http://www.xueling.net.cn/article/cgccoh.html

老熟女激烈的高潮_日韩一级黄色录像_亚洲1区2区3区视频_精品少妇一区二区三区在线播放_国产欧美日产久久_午夜福利精品导航凹凸

重慶分公司，新征程啟航

python爬蟲之UserAgent

其他資訊

老熟女激烈的高潮_日韩一级黄色录像_亚洲1区2区3区视频_精品少妇一区二区三区在线播放_国产欧美日产久久_午夜福利精品导航凹凸

重慶分公司，新征程啟航

python爬蟲之UserAgent

其他資訊

重慶分公司，新征程啟航