老熟女激烈的高潮_日韩一级黄色录像_亚洲1区2区3区视频_精品少妇一区二区三区在线播放_国产欧美日产久久_午夜福利精品导航凹凸

重慶分公司,新征程啟航

為企業提供網站建設、域名注冊、服務器等服務

讓我們用python來采集招聘數據看看找工作都要會什么吧~

前言

嗨嘍~大家好呀,這里是魔王吶

讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業的熱愛。我們立志把好的技術通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領域值得信任、有價值的長期合作伙伴,公司提供的服務項目有:空間域名、網站空間、營銷軟件、網站建設、潢川網站維護、網站推廣。

現在,很多人不是在找工作的途中就是在找工作的路上(我的廢話文學????)

所以我今天來采集一下招聘網站,讓我們來看看找工作主要要學會什么?

環境使用:

  • Python 3.8
  • Pycharm ---> 漢化插件 translation

模塊使用:

  • requests >>> pip install requests
  • re
  • json
  • csv

如果安裝python第三方模塊:

  1. win + R 輸入 cmd 點擊確定, 輸入安裝命令 pip install 模塊名 (pip install requests) 回車

  2. 在pycharm中點擊Terminal(終端) 輸入安裝命令


如何配置pycharm里面的python解釋器?

  1. 選擇file(文件) >>> setting(設置) >>> Project(項目) >>> python interpreter(python解釋器)
  2. 點擊齒輪, 選擇add
  3. 添加python安裝路徑

pycharm如何安裝插件?

  1. 選擇file(文件) >>> setting(設置) >>> Plugins(插件)
  2. 點擊 Marketplace 輸入想要安裝的插件名字 比如:翻譯插件 輸入 translation / 漢化插件 輸入 Chinese
  3. 選擇相應的插件點擊 install(安裝) 即可
  4. 安裝成功之后 是會彈出 重啟pycharm的選項 點擊確定, 重啟即可生效

基本流程思路: <通用>

解答、教程可加Q:免費獲取哦~

一. 數據來源分析

  1. 確定需求, 明確采集數據內容是什么?
  2. 通過開發者工具進行抓包分析, 分析數據來源, 請求那個url地址可以獲取相關數據內容

I. F12或者鼠標右鍵點擊檢查 選擇network 刷新網頁

II. 通過關鍵字 搜索找相應數據包

二. 代碼實現步驟

  1. 發送請求, 對于分析得到url地址發送請求 <模擬瀏覽器對于url發送請求>
  2. 獲取數據, 獲取response響應數據 ---> 服務器返回響應數據
  3. 解析數據, 提取我們想要數據內容 ---> 招聘基本信息
  4. 保存數據, 保存表格里面
  5. 多頁采集, 多頁數據采集

代碼

# 導入數據請求模塊  ---> 第三方模塊 需要 pip install requests  導入模塊沒有使用 灰色
import requests
# 導入正則模塊---> 內置模塊 不需要安裝
import re
# 導入json---> 內置模塊 不需要安裝
import json
# 導入格式化輸出模塊---> 內置模塊 不需要安裝
import pprint
# 導入csv模塊
import csv
# 導入時間模塊
import time
# 導入隨機模塊
import random
源碼、解答、教程可加Q裙:
# 創建文件
f= open('python招聘10頁.csv', mode='a', encoding='utf-8', newline='')
csv_writer= csv.DictWriter(f, fieldnames=[
'職位',
'公司名',
'薪資',
'城市',
'經驗',
'學歷',
'公司類型',
'公司規模',
'公司領域',
'福利待遇',
'發布日期',
'公司詳情頁',
'職位詳情頁',
])
# 寫入表頭
csv_writer.writeheader()
"""
1. 發送請求, 對于分析得到url地址發送請求 <模擬瀏覽器對于url發送請求>
    模擬瀏覽器---> headers 在開發者工具里面headers下面的 requests headers里面
        請求頭, 字典數據類型, 要構建完整鍵值對
200]>  說明對于url地址發送請求成功了, 但是不一定得到你想要的數據

被反爬, 狀態碼可能還是200, 但是返回數據不是你想要的內容
"""
for page in range(1, 11):
    print(f'----------------正在采集第{page}頁數據內容----------------')
    time.sleep(random.randint(1, 2))
    # 確定url地址--> 可以直接復制
    url= f'https://search.51job.com/list/0%252C0%252C0%252C0%252C0,000000,0000,00,9,99,python,2,{page}.html'
    # 模擬瀏覽器 headers 請求頭 偽裝
    headers= {
        # User-Agent 用戶代理, 表示瀏覽器基本身份標識
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }
    # 發送請求 使用什么請求方式, 取決于開發者工具里的內容
    response= requests.get(url=url, headers=headers)
    #200]>  響應對象  200 狀態碼 請求成功
    print(response)
    # 獲取數據, 獲取服務器返回響應數據---> 獲取文本數據 print(response.text)
"""
    解析數據  ---> 提取我們想要數據內容
        解析方法比較多: re css xpath json解析.... 如何選擇方法 根據返回數據類型以及我想要數據內容情況
        re.findall() 調用re模塊里面findall方法
        通過re模塊找到所有我們想要數據內容---> 告訴它去哪里找, 找什么樣數據
    
    正則匹配提取出來數據, 返回列表---> 
    """
    # 提取招聘數據 re.findall()
    源碼、解答、教程可加Q裙:
    html_data= re.findall('window.__SEARCH_RESULT__ = (.*?)', response.text)[0]
    # 把字符串數據轉成json字典數據
    json_data= json.loads(html_data)
    # print 打印字典數據, 一行展示  pprint.pprint 打印字典數據類型, 格式化展開的效果 print(json_data) pprint.pprint(json_data)
    # 字典取值---> 根據鍵值對取值 根據冒號左邊的內容[鍵], 提取冒號右邊的內容[值]
    # for循環遍歷 把列表里面數據一個一個提取出來
for index in json_data['engine_jds']:
        # 提取數據, 用字典 保存內容  學歷是敲門磚, 技術才是鐵飯碗.... 畢業出來3500
        dit= {
'職位': index['job_name'],
'公司名': index['company_name'],
'薪資': index['providesalary_text'],
'城市': index['workarea_text'],
'經驗': index['attribute_text'][1],
'學歷': index['attribute_text'][-1],
'公司類型': index['companytype_text'],
'公司規模': index['companysize_text'],
'公司領域': index['companyind_text'],
'福利待遇': index['jobwelf'],
'發布日期': index['issuedate'],
'公司詳情頁': index['company_href'],
'職位詳情頁': index['job_href'],

        }
        # 寫入數據
        csv_writer.writerow(dit)
        print(dit)

網站欄目:讓我們用python來采集招聘數據看看找工作都要會什么吧~
本文地址:http://www.xueling.net.cn/article/dsoggsj.html

其他資訊

在線咨詢
服務熱線
服務熱線:028-86922220
TOP
主站蜘蛛池模板: 久久天天躁夜夜躁狠狠躁2022 | 一级又爽又黄的免费毛片视频 | 两人视频在线播放免费观看网站 | 人与黄色三级毛片 | 国产亚洲精品精品精品 | 免费成年人视频在线观看 | 欧美日韩国产成人高清视 | 久久精品激情 | av网站大全在线 | 亚洲大片精品永久免费看网站 | 亚欧洲精品视频免费观看mv在线观看 | 欧美三区二区一区 | 免费看黄色片网站 | 2020年最新国产精品正在播放 | 岛国黄色 | 脱老师内裤进入gif视频 | 欧洲在线免费视频 | 东京热制服丝袜无码专区 | 夜夜操夜夜操 | 久久不见久久见免费影院视频观看 | 成人av一区二区三区在线观看 | 一区视频在线免费观看 | 比利时xxxx性hd极品 | 亚洲色偷偷综合亚洲AV伊人蜜桃 | 国产一区二区三区在线视频观看 | 7777精品伊久久久大香线蕉语言 | 国产女同互慰高潮流水视频 | 中文字幕日韩av | 国产一级淫片a按摩推澡按摩 | 国产性精品 | 69xx在线看片 | 日韩性xxxx | 天天干天天操天天搞 | 日本黄色电视 | 国产精品女人久久久久久 | 男女啪啪做爰高潮全过程短片 | 国产精品久久三区 | 久久精品一区二区三区视频 | 日本视频一二三区中文字幕 | 国产无遮挡又黄又爽动态图 | 黄大色黄大片女爽一次 |