老熟女激烈的高潮_日韩一级黄色录像_亚洲1区2区3区视频_精品少妇一区二区三区在线播放_国产欧美日产久久_午夜福利精品导航凹凸

重慶分公司,新征程啟航

為企業提供網站建設、域名注冊、服務器等服務

Python爬蟲怎么繞過登錄頁面

這篇文章主要講解了“Python爬蟲怎么繞過登錄頁面”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Python爬蟲怎么繞過登錄頁面”吧!

創新互聯公司制作網站網頁找三站合一網站制作公司,專注于網頁設計,網站設計、成都網站制作,網站設計,企業網站搭建,網站開發,建網站業務,680元做網站,已為數千家服務,創新互聯公司網站建設將一如既往的為我們的客戶提供最優質的網站建設、網絡營銷推廣服務!

前言

很多時候我們做 Python 爬蟲時或者自動化測試時需要用到 selenium 庫,我們經常會卡在登錄的時候,登錄驗證碼是最頭疼的事情,特別是如今的文字驗證碼和圖形驗證碼。文字和圖形驗證碼還加了干擾線,本文就來講講怎么繞過登錄頁面。

登錄頁面的驗證,比如以下的圖形驗證碼。

Python爬蟲怎么繞過登錄頁面

還有我們基本都看過的 12306 的圖形驗證碼。

Python爬蟲怎么繞過登錄頁面

繞過登錄方法

繞過登錄基本有兩種方法,第一種方法是登錄后查看網站的 cookie,請求 url 的時候把 cookie 帶上,第二種方法是啟動瀏覽器帶上瀏覽器的全部信息,包括添加的書簽和訪問網頁的 cookie 信息。

第一種 cookie 方法我們要分析別人網站的 cookie 值,找出相應的值然后添加進去,對于我們不熟的網站,他們可能也會做加密或者動態處理,所以有些網站也不是那么好操作。如果是自己公司的網站需要測試,我們可以詢問對應的開發那個 cookie 值是區分獨立用的值,拿出來放在請求里面就行。

添加 cookie 繞過登錄

比如我們登錄百度賬號比較費勁,每次都需要登錄也比較繁瑣,我們 F12 打開頁面調試工具,登錄后找到 www.baidu.com 文件,在 cookie 中,我們發現很多值,其中圖中圈起來的就是我們要找的值。

Python爬蟲怎么繞過登錄頁面

我們在訪問 baidu 鏈接的時候加上這個 cookie 值,這樣就是直接登錄后的百度賬號了。

Python爬蟲怎么繞過登錄頁面

下載瀏覽器驅動

我們要 selenium 啟動瀏覽器時,需要下載后對應的驅動文件并放在 Python 安裝的根目錄下,比如我會用到谷歌 Chrome 瀏覽器和 Firefox 火狐瀏覽器。

Python爬蟲怎么繞過登錄頁面谷歌瀏覽器驅動下載地址:

http://chromedriver.storage.googleapis.com/index.html

火狐瀏覽器驅動下載地址:

https://github.com/mozilla/geckodriver/releases/

啟動 Chrome 瀏覽器繞過登錄

我們每次打開瀏覽器做相應操作時,對應的緩存和 cookie 會保存到瀏覽器默認的路徑下,我們先查看個人資料路徑,以 chrome 為例,我們在地址欄輸入 chrome://version/

Python爬蟲怎么繞過登錄頁面

圖中的個人資料路徑就是我們需要的,我們去掉后面的 \Default,然后在路徑前加上「–user-data-dir=」就拼接出我們要的路徑了。

profile_directory = r'--user-data-dir=C:\Users\xxx\AppData\Local\Google\Chrome\User Data'

接下來,我們啟動瀏覽器的時候采用帶選項時的啟動,這種方式啟動瀏覽器需要注意,運行代碼前需要關閉所有的正在運行 chrome 程序,不然會報錯。全部代碼如下。

Python爬蟲怎么繞過登錄頁面

selenium 自動化啟動瀏覽器后我們會發現我之前保存的書簽完整在瀏覽器上方,baidu 賬號也是登錄的狀態。

Python爬蟲怎么繞過登錄頁面啟動 Firfox 瀏覽器繞過登錄

Firfox 火狐瀏覽也可以這樣啟動它,設置略有不同。

首先,查看配置文件的存儲路徑,查看方法:幫助–故障排除信息–配置文件夾,把里面的路徑復制過來就行。

Python爬蟲怎么繞過登錄頁面

同樣,我們把路徑放在變量中。

profile_path = r'C:\Users\guixianyang\AppData\Roaming\Mozilla\Firefox\Profiles\dvm6wqam.default'

我們也在火狐瀏覽器中登錄好百度的賬號,用 selenium 自動化啟動帶配置文件的火狐瀏覽器,也會發現啟動時已經啟動了瀏覽器安裝的插件和登錄好的百度賬號。

Python爬蟲怎么繞過登錄頁面

繞過圖形驗證碼的網站

文中第一個圖是簡書登錄時的圖形驗證碼,我們登錄簡書后(cookie 有一定的時效,貌似有 10 天半個月左右),把上面代碼中的鏈接換成簡書的,再用上面的方法覺可以實現繞過登錄頁的圖形驗證碼。

比如我直接打開我的簡書個人主頁

https://www.jianshu.com/u/52353ffa8b86

自動化啟動后也是保留了登錄的狀態。

Python爬蟲怎么繞過登錄頁面

網站的登錄大門已被打開,接下來就可以做自己想做的事情了,比如爬蟲、自動化測試驗證之類的。

感謝各位的閱讀,以上就是“Python爬蟲怎么繞過登錄頁面”的內容了,經過本文的學習后,相信大家對Python爬蟲怎么繞過登錄頁面這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是創新互聯,小編將為大家推送更多相關知識點的文章,歡迎關注!


分享題目:Python爬蟲怎么繞過登錄頁面
當前鏈接:http://www.xueling.net.cn/article/pophej.html

其他資訊

在線咨詢
服務熱線
服務熱線:028-86922220
TOP
主站蜘蛛池模板: 国产精品无码首页自拍 | 国产在线乱码一区二区三区 | 热久久一区| 国产黄免费 | 亚洲国产欧美另类 | 国产精品不卡在线观看 | 久久精品亚洲人成影院 | 亚洲不卡视频在线观看 | 国产19页| 久久久国产乱子伦精品作者 | 91久草视频 | 国产胸大一区二区三区粉嫩思欲 | 中国黄色一及片 | 精品福利一区二区三区免费视频 | 好男人好资源神马在线观看 | 亚洲伊人中文字幕 | 日韩成人在线观看视频 | 久久久久久视频 | 色屁屁WWW影院免费观看 | 成人公开免费视频 | 四虎影视成人永久免费观看视频 | 91网站在线观看免费 | 又嫩又硬又黄又爽的视频 | 网色国产 | 成年片黄色日本大片网站视频 | 一区二区亚洲欧美在线 | 久久久久久亚洲精品 | 久久国产精品欧美 | 伊人久久一区二区三区 | 国产丰满农村老妇女乱 | 国产一级特黄录像片 | 福利精品 | 俄罗斯老熟妇乱子伦视频 | 日日干日日操 | 亚洲一区成人在线观看 | 亚洲精品一区二区三区午夜不卡片 | 亚州日本乱码一区二区三区 | 日日操夜夜操影院 | 熟妇人妻无乱码中文字幕 | 3D动漫同人精品无码专区 | 亚洲啊啊啊啊啊 |