中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

都蘭縣建設(shè)局交通局網(wǎng)站seo工具優(yōu)化軟件

都蘭縣建設(shè)局交通局網(wǎng)站,seo工具優(yōu)化軟件,在線(xiàn)網(wǎng)站模板,山東網(wǎng)站營(yíng)銷(xiāo)seo哪家好目錄 上一篇文章 本章內(nèi)容 設(shè)置瀏覽器為運(yùn)行結(jié)束后不關(guān)閉(可選) 定位到搜索框的xpath地址 執(zhí)行動(dòng)作 獲取cookie 保存為json文件 修改cookie的sameSite值并且導(dǎo)入cookie 導(dǎo)入cookie(出錯(cuò)) 導(dǎo)入cookie(修改后&…

目錄

上一篇文章

本章內(nèi)容

設(shè)置瀏覽器為運(yùn)行結(jié)束后不關(guān)閉(可選)

定位到搜索框的xpath地址

執(zhí)行動(dòng)作

獲取cookie

保存為json文件

修改cookie的sameSite值并且導(dǎo)入cookie

導(dǎo)入cookie(出錯(cuò))

導(dǎo)入cookie(修改后)

最后出現(xiàn)頁(yè)面

需要注意的問(wèn)題

所有代碼

總結(jié)


上一篇文章

用python來(lái)爬取某魚(yú)的商品信息(1/2)_木木em哈哈的博客-CSDN博客本章講理論,后面一節(jié)講代碼拿來(lái)練練手的,練練selenium包,實(shí)戰(zhàn)一下(本來(lái)想拿來(lái)練手的,沒(méi)想到他喵的有挺多防爬的,直接開(kāi)局就困難難度我靠,凸(艸皿艸 ))找到可以爬取的網(wǎng)站然后添加cookie然后刷新界面就可以發(fā)現(xiàn)搜索結(jié)果出來(lái)了這一次實(shí)戰(zhàn)經(jīng)歷真的讓我遇到了selenium許多奇奇怪怪的反爬手段,也是讓我可以大幅度提升自己實(shí)戰(zhàn)經(jīng)驗(yàn)的一個(gè)經(jīng)歷,前前后后排bug,繞反爬,這一個(gè)項(xiàng)目打了整整兩天。累diethttps://blog.csdn.net/mumuemhaha/article/details/132238660?spm=1001.2014.3001.5502

本章內(nèi)容

主要講的是上一章的代碼實(shí)現(xiàn)

導(dǎo)入所需要的程序包

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.keys import Keys
import time
import json

設(shè)置瀏覽器為運(yùn)行結(jié)束后不關(guān)閉(可選)

之后先設(shè)置自己想要搜索的內(nèi)容,并且把瀏覽器設(shè)置為允許結(jié)束后不關(guān)閉,并且打開(kāi)要爬取的咸魚(yú)網(wǎng)站(可設(shè)可不設(shè))

input_1=input('輸入想要搜索的內(nèi)容:')option = webdriver.ChromeOptions()
option.add_experimental_option("detach", True)# 注意此處添加了chrome_options參數(shù)
driver = webdriver.Chrome(chrome_options=option)
driver.get('https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spm=a2170.tb_mini_index.0.0')

定位到搜索框的xpath地址

driver_1=driver.find_element(by='xpath',value='/html/body/div/div/div[1]/input')

執(zhí)行動(dòng)作

執(zhí)行動(dòng)作(調(diào)用鼠標(biāo)api點(diǎn)擊剛剛定位的搜索框,然后輸入input_1的值并且回車(chē)

ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1)

中間的.pause(1)以及time.sleep(1)是等待一秒鐘的時(shí)間(保險(xiǎn)起見(jiàn),怕網(wǎng)頁(yè)沒(méi)有加載好,或者你設(shè)置一個(gè)selenium等待函數(shù)更保險(xiǎn))

獲取cookie

接下來(lái)就是獲取cookie,獲取cookie方法上一章講了

?在你的瀏覽器上,下載cookie editor插件登錄,不要用運(yùn)行python時(shí)跳出的瀏覽器,正常打開(kāi)瀏覽器(這樣不會(huì)跳驗(yàn)證碼。。。即使跳了也可以手動(dòng)成功過(guò)),導(dǎo)出你的cookie

保存為json文件

然后新建一個(gè)json格式的文件并且把它命名為cookie.json

修改cookie的sameSite值并且導(dǎo)入cookie

導(dǎo)入cookie(出錯(cuò))

cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:driver.add_cookie(cookie)

但是!!!!

前面講過(guò)直接導(dǎo)入會(huì)報(bào)錯(cuò)

 assert cookie_dict[‘sameSite‘] in [‘Strict‘, ‘Lax‘] AssertionError()

由于這里語(yǔ)法規(guī)定sameSite必須為‘Strict‘, ‘Lax‘兩個(gè)之一,不然就報(bào)錯(cuò)

所以我們要遍歷字典,并且把字典中的sameSite設(shè)置為Strict

導(dǎo)入cookie(修改后)

所以代碼改為

cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:if'sameSite' in cookie:cookie['sameSite'] = 'Strict'driver.add_cookie(cookie)
driver.refresh()

注意,導(dǎo)入cookie后要用driver.refresh()刷新

打印源代碼

?然后打印網(wǎng)頁(yè)的源代碼,注意要等3秒加載元素(或者用re庫(kù)帶的篩選,篩選你想要的的元素,比如商品鏈接,價(jià)格,以及介紹)

time.sleep(3)
print(driver.page_source)

最后出現(xiàn)頁(yè)面

需要注意的問(wèn)題

  • 首先要說(shuō)的是這個(gè)通過(guò)python不如通過(guò)app抓包來(lái)的穩(wěn)定
  • 頁(yè)面中你登錄的cookie的失效時(shí)間是不確定的,所以你可能需要經(jīng)常更新cookie(看個(gè)人情況)
  • 無(wú)法頻繁(比如5分鐘一次)搜索,否則會(huì)跳滑塊驗(yàn)證,或者你有多個(gè)賬號(hào)也可以搞(大概也就這個(gè)流程)
  • 寫(xiě)出來(lái)的代碼只是提取出來(lái)網(wǎng)頁(yè)源代碼——其實(shí)都提取出網(wǎng)頁(yè)源代碼了,使用就只有一個(gè)篩選了(csdn上有大把的優(yōu)質(zhì)博主和大佬教你通過(guò)源代碼過(guò)濾有用的信息)
  • 當(dāng)然如果需要的話(huà)我可以再水一篇博客
  • 它理論上可以關(guān)聯(lián)到釘釘機(jī)器人或者是QQ機(jī)器人上實(shí)現(xiàn)定時(shí)推送咸魚(yú)信息(啊?你問(wèn)我為什么不繼續(xù)寫(xiě)?因?yàn)檫€沒(méi)學(xué),不然這期標(biāo)題末尾就不是(2/2)而是(2/3)了;咳咳咳...u1s1,釘釘應(yīng)該是有教程教的,傻妞機(jī)器人應(yīng)該也可以執(zhí)行python腳本的,“按理”來(lái)說(shuō)不會(huì)很難實(shí)現(xiàn),實(shí)在不行我再去學(xué)吧(累die...)

所有代碼

所有代碼附上吧

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.keys import Keys
import time
import jsoninput_1=input('輸入想要搜索的內(nèi)容:')# 不自動(dòng)關(guān)閉瀏覽器
option = webdriver.ChromeOptions()
option.add_experimental_option("detach", True)# 注意此處添加了chrome_options參數(shù)
driver = webdriver.Chrome(chrome_options=option)
driver.get('https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spm=a2170.tb_mini_index.0.0')driver_1=driver.find_element(by='xpath',value='/html/body/div/div/div[1]/input')ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1)cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:if'sameSite' in cookie:cookie['sameSite'] = 'Strict'driver.add_cookie(cookie)
driver.refresh()time.sleep(3)
print(driver.page_source)

總結(jié)

這些代碼搞得我暈頭轉(zhuǎn)向的,尤其是那個(gè)內(nèi)嵌的登錄頁(yè)面讓我走了很多彎路,但是對(duì)于這個(gè)庫(kù)的學(xué)習(xí)應(yīng)該也算是初窺門(mén)徑吧,如果有大佬有優(yōu)化的地方歡迎指出(真的沒(méi)學(xué)多深,很容易出錯(cuò)的)

http://m.risenshineclean.com/news/41586.html

相關(guān)文章:

  • 服裝網(wǎng)站欄目在線(xiàn)的crm系統(tǒng)軟件
  • 網(wǎng)站建設(shè)推廣技術(shù)網(wǎng)絡(luò)營(yíng)銷(xiāo)策劃書(shū)的主要內(nèi)容
  • 好單庫(kù)如何做網(wǎng)站長(zhǎng)沙網(wǎng)站制作公司哪家好
  • 網(wǎng)站做動(dòng)態(tài)圖片不顯示邯鄲seo優(yōu)化公司
  • 做月亮的網(wǎng)站背景圖片怎樣建立網(wǎng)站平臺(tái)
  • 企業(yè)網(wǎng)站托管運(yùn)營(yíng)it菜雞網(wǎng)seo
  • 濰坊做網(wǎng)站免費(fèi)拓客軟件排行榜
  • 附近有學(xué)電腦培訓(xùn)班嗎天津seo網(wǎng)站管理
  • 做算命類(lèi)網(wǎng)站違法嗎站長(zhǎng)seo軟件
  • 網(wǎng)站建設(shè)套餐報(bào)價(jià)百度競(jìng)價(jià)排名魏則西事件分析
  • 網(wǎng)站seo優(yōu)化包括哪些方面排名第一的手機(jī)清理軟件
  • 重慶提供行業(yè)網(wǎng)站建站報(bào)價(jià)seo營(yíng)銷(xiāo)論文
  • office做的網(wǎng)站短視頻排名seo
  • 網(wǎng)站設(shè)計(jì)代碼案例長(zhǎng)尾關(guān)鍵詞查詢(xún)
  • 個(gè)人直播網(wǎng)站怎么做山西疫情最新情況
  • 中文域名網(wǎng)站騙局湖南網(wǎng)站推廣
  • 做選擇網(wǎng)站手機(jī)網(wǎng)站建設(shè)平臺(tái)
  • 通遼做網(wǎng)站通過(guò)seo來(lái)賺錢(qián)百度seo培訓(xùn)
  • 專(zhuān)業(yè)網(wǎng)站制作公司四川seo關(guān)鍵詞排名優(yōu)化軟件怎么選
  • wordpress中文標(biāo)簽云廣州灰色優(yōu)化網(wǎng)絡(luò)公司
  • 李滄做網(wǎng)站公司seo排名快速刷
  • 沙漠風(fēng)網(wǎng)站開(kāi)發(fā)怎樣溫州seo優(yōu)化
  • 南寧做網(wǎng)站設(shè)計(jì)方案微商軟文范例
  • 黃石網(wǎng)站設(shè)計(jì)制作今日疫情最新情況
  • 分銷(xiāo)seo實(shí)戰(zhàn)培訓(xùn)教程
  • 臨西網(wǎng)站建設(shè)google收錄提交入口
  • 天河企業(yè)網(wǎng)站建設(shè)青島網(wǎng)站建設(shè)有限公司
  • 群暉wordpress中文鄭州網(wǎng)站關(guān)鍵詞優(yōu)化公司哪家好
  • 深圳市龍華區(qū)房?jī)r(jià)萬(wàn)能優(yōu)化大師下載
  • 東營(yíng)網(wǎng)站建設(shè)收益高恩城seo的網(wǎng)站