当前位置: 首页 > news >正文

房山建站公司wordpress无插件自动实现tag关键字内链

房山建站公司,wordpress无插件自动实现tag关键字内链,旅游网站制作 价格,网站程序建设目录 selenium的介绍 1、 selenium是什么#xff1f; 2、selenium的工作原理 3、如何使用selenium#xff1f; webdriver浏览器驱动设置 关键步骤 代码 运行结果 注意事项 selenium的介绍 1、 selenium是什么#xff1f; 用于Web应用程序测试的工具。可以驱动浏览… 目录 selenium的介绍 1、 selenium是什么  2、selenium的工作原理 3、如何使用selenium webdriver浏览器驱动设置 关键步骤 代码 运行结果 注意事项 selenium的介绍 1、 selenium是什么  用于Web应用程序测试的工具。可以驱动浏览器执行特定操作自动按照脚本     代码做出点击输入打开验证等操作就像真实用户所做的一样。     支持的浏览器包括IEFirefoxSafariChromeOpera等。 2、selenium的工作原理 浏览器具有webdriver驱动,这个驱动是根据不同的浏览器开发的     不同的浏览器使用不同的webdriver驱动程序且需要对应相应的浏览器版本     webdriver驱动程序可以通过浏览器内核控制浏览执行指定命令 3、如何使用selenium 使用前准备 a、安装selenium库  b、驱动浏览器的内核驱动 a、安装selenium使用pip install selenium -i https://pypi.mirrors.ustc.edu.cn/simple/                 或在pycharm中安装 b、chrome内核驱动地址    360浏览器使用的就是chrome的内核QQ浏览器使用IEIE https://chromedriver.storage.googleapis.com/index.html   首先确定你的浏览器是使用哪个内核     windows系统下载下来的文件解压后放置在python安装地址的Scripts中     Linux和Mac系统同上注意系统存在2个Python版本确定当前运行的python                     版本配置在环境变量中 爬取苏宁易购平台某款产品的优质评论与差评 webdriver浏览器驱动设置 webdriver具备多种不同浏览器的驱动 browser webdriver.Chrome() browser webdriver.Firefox() browser webdriver.Edge() browser webdriver.PhantomJS() browser webdriver.Safari() 其中.chrome.webdriver import WebDriver as Chrome定义了别名Chrome代表WebDriver 关键步骤 初始化浏览器驱动 使用 selenium 的 Options 对象配置 Edge 浏览器例如可以设置无界面模式。初始化 webdriver.Edge启动浏览器。 抓取优质评价 打开优质评价的 URL。使用 find_elements 查找所有评价内容并将其保存到文件 优质评价1.txt。点击“下一页”按钮循环抓取所有页的评论内容。 抓取差评 打开差评的 URL。使用 find_elements 查找所有差评内容并将其保存到文件 差评.txt。点击“下一页”按钮循环抓取所有页的差评内容。 关闭浏览器 完成抓取后调用 driver.quit() 关闭浏览器。 代码 from selenium import webdriver from selenium.webdriver.edge.options import Options from selenium.webdriver.common.by import By import time# 创建 Edge 浏览器选项对象 options Options() # 在这里可以添加各种选项例如 # options.add_argument(--headless) # 无界面模式# 使用修改后的参数传递方式初始化 Edge 浏览器驱动 driver webdriver.Edge(optionsoptions)# 抓取优质评价 driver.get(https://review.suning.com/cluster_cmmdty_review/cluster-38249278-000000012389328846-0000000000-1-good.htm?originalCmmdtyTypegeneralsafpd488778a.10004.loverRight.166)# 打开文件用于保存优质评价内容 yzpj_file open(优质评价1.txt, w, encodingutf-8)def get_py_content(file):# 查找所有包含评价内容的元素pj_elements_content driver.find_elements(By.CLASS_NAME, body-content)# 遍历每个元素将文本内容写入文件for i in range(len(pj_elements_content)):file.write(pj_elements_content[i].text \n)# 获取第一页的评论内容 get_py_content(yzpj_file)# 查找下一页按钮 next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) print(next_elements)# 循环点击下一页获取所有页的评论内容 while next_elements:next_element next_elements[0]time.sleep(1) # 等待页面加载next_element.click() # 点击下一页get_py_content(yzpj_file) # 获取当前页的评论内容next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) # 重新查找下一页按钮# 关闭优质评价文件 yzpj_file.close()# 抓取差评 driver.get(https://review.suning.com/cluster_cmmdty_review/cluster-38249278-000000012389328846-0000000000-1-bad.htm?originalCmmdtyTypegeneralsafpd488778a.10004.loverRight.166)# 打开文件用于保存差评内容 cpj_file open(差评.txt, w, encodingutf-8)def get_cp_content(file):# 查找所有包含差评内容的元素pj_elements_content driver.find_elements(By.CLASS_NAME, body-content)# 遍历每个元素将文本内容写入文件for i in range(len(pj_elements_content)):file.write(pj_elements_content[i].text \n)# 获取第一页的差评内容 get_cp_content(cpj_file)# 查找下一页按钮 next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) print(next_elements)# 循环点击下一页获取所有页的差评内容 while next_elements:next_element next_elements[0]time.sleep(2) # 等待页面加载next_element.click() # 点击下一页get_cp_content(cpj_file) # 获取当前页的差评内容next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) # 重新查找下一页按钮# 关闭差评文件 cpj_file.close()# 关闭浏览器 driver.quit()运行结果 1优质评价 2差评 注意事项 浏览器驱动 确保已安装正确版本的 Microsoft Edge 驱动程序并将其路径添加到系统环境变量中。 网页动态加载 使用 time.sleep() 等待页面加载避免因页面未完全加载而导致错误。 文件编码 打开文件时指定 encodingutf-8避免写入内容时出现乱码。 XPath 定位 确保 XPath 表达式正确能够定位到“下一页”按钮。如果网页结构发生变化需要调整 XPath。 无界面模式 如果需要无界面运行可以取消注释 options.add_argument(--headless)。
http://www.w-s-a.com/news/856532/

相关文章:

  • 国外试用网站空间网站建设与管理题目
  • 淄博网赢网站建设网站设计的技术选择
  • 建外贸网站 东莞厦门做网站最好的公司
  • 为您服务网站新网站做百度推广
  • 电子商务免费网站建设网站制作哪个好薇
  • 全面启动门户网站建设中小型企业建设一个网站大概需要多少钱
  • 建网站一般多少钱网站建设上传服务器步骤
  • 手机销售网站怎么做的网站推广优化建设方案
  • 做任务分享赚钱的网站德阳网站建设公司哪家好
  • 云南建设工程质量监督网站wordpress网站导航主题
  • 徐州网站建设哪家好薇手机开源网站代码
  • 更新网站要怎么做呢泰安市58同城招聘网
  • 溧阳网站建设价格企业网站设计费用
  • 我建设的网站打开很慢河北住房和城乡建设厅网站卡
  • 门户网站广告的特点有网站的建设初步定位
  • 建设网站第一步网页建设方案
  • 网站开发需要那些人才wordpress 小工具原理
  • 广州建设局官方网站佛山高端网站制作公司
  • 东莞哪里能学建设网站网站备案值得吗
  • 中山 网站建设 骏域小程序开发课程
  • 北京网站建设成都微商城app官方下载
  • 网站开发用户登陆的安全wordpress 开发网站
  • 网站建设容易出现的问题四川seo关键词工具
  • 做外单网站有哪些内容服务好的南京网站建设
  • 阜阳微商城网站建设百度网站两两学一做心得体会
  • 建设银行积分网站观光农业规划设计
  • jsp项目个人网站开发用织梦做网站有什么公司会要
  • 和田网站制作无限动力网站
  • 长沙口碑好网站建设企业网站 需求
  • 哪个网站建设公司wordpress陌陌主题