当前位置: 首页 > news >正文

银河麒麟软件下载网站网址例子

银河麒麟软件下载网站,网址例子,建设用地规划许可证去哪个网站查,wordpress数字交易在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码#xff0c;如下图所示 点击下一页时是执行了函数doPostBack#xff0c;查看页面源码如下 点击下一页后这段js提交了一个表单#xff0c;随后后端返回对应数据#xff0c;一开始尝试分析获取对应两个参数如下图所示 点击下一页时是执行了函数doPostBack查看页面源码如下 点击下一页后这段js提交了一个表单随后后端返回对应数据一开始尝试分析获取对应两个参数封装在data中通过POST请求获得新的一页后面尝试了很久始终不成功…肯定是因为太菜 没办法只能使用神器selenium缺点是要调用浏览器肯定是比较慢的但是python直接给你模拟浏览器的各种操作而且不用抓包分析比较方便。所以还是偷偷懒注意除了python要安装selenium之外还需要安装对应浏览器的web驱动这里我用的是谷歌浏览器驱动下载地址 镜像https://registry.npmmirror.com/binary.html?pathchromedriver/ 如果你谷歌版本新镜像上可能没有对应版本。 官网https://sites.google.com/chromium.org/driver/downloads117以上在这里找这里~ 下载好后就是正常的爬虫步骤直接看代码吧 import docx from selenium import webdriver import html2text import timeidx [4, 5, 9, 10, 11, 13, 14, 15, 16] srcsel xxxx/Web/userSingle.aspx?ID # 选择题 srcjg xxxx/Web/userIs.aspx?ID # 判断题def remove_tags(text):h html2text.HTML2Text()h.ignore_links Truereturn h.handle(text)def process(url):driver webdriver.Chrome()driver.get(url)res driver.find_element(id, GridViewx).get_attribute(innerHTML)res remove_tags(res)doc.add_paragraph().add_run(res)pages int(driver.find_element(id, GridViewx_ctl13_lblPageCount).text)# pages 2for i in range(pages - 1):time.sleep(1.5)driver.find_element(id, GridViewx_ctl13_btnNext).click()res driver.find_element(id, GridViewx).get_attribute(innerHTML)res remove_tags(res)doc.add_paragraph().add_run(res)driver.quit()doc docx.Document(res.docx) for pid in idx:process(srcsel str(pid))time.sleep(3)process(srcjg str(pid)) doc.save(res.docx) 为什么多此一举用html2text呢因为发现这样写又能比较好看和丑的比起来还不用自己一条数据一条数据取出来排版。然后代码里我直接写进word文档里了这里有个小坑你的word文档docx中必须得有东西不能是空的要不然会报错… 懒得排版凑合看看
http://www.w-s-a.com/news/165675/

相关文章:

  • 茌平网站建设公司免费的云服务器有哪些
  • 手机网站单页面铜陵网站制作公司
  • 网站logo怎么做才清晰千库网官网首页登录
  • 山西省建设银行网站首页长沙网站建设制作
  • 襄阳市做网站 优帮云百度搜索次数统计
  • 自己做视频直播网站盐城做网站多少钱
  • 买个网站服务器多少钱重庆做的好的房产网站
  • 深圳定制建站网站建设推广关键词怎么设置
  • 宝山网站建设 网站外包修改wordpress版权
  • 建立网站的基本步骤新网站多久会被百度收录
  • 软件设计开发流程图廊坊关键词seo排名方案
  • 南山住房和建设局网站网站被k 多久恢复
  • 阿里买域名 电脑做网站做简历哪个网站好
  • 个人网站免费服务器单页网站的域名
  • 网站设计简单讲解小店怎么做网站
  • 校园网站的意义wordpress去除更新
  • 网站开发用python吗常用的网页开发工具有哪些
  • 北京市住房建设投资建设网站做商城网站要哪些流程
  • seo网站改版杭州建设局官网
  • 物流网站建设策划书泰然建设网站
  • 百度做网站的费用采集发布wordpress
  • 网站运维公司有哪些防录屏网站怎么做
  • 昆明做网站seo的网站制作专业
  • 聊城制作手机网站公司wordpress 头条
  • 商城微网站模板一般电商网站做集群
  • winserver2008上用iis发布网站嵊州网站制作
  • 网站内页权重怎么查辽宁建设工程信息网怎么上传业绩
  • 丰都网站建设价格镇江网站制作费用
  • app手机网站建设黄网站建设定制开发服务
  • 百度网盘app下载徐州优化网站建设