当前位置: 首页 > news >正文

怎样查找网站域名归属朗润装饰成都装修公司

怎样查找网站域名归属,朗润装饰成都装修公司,哈尔滨市住房和城乡建设局官网,房地产新闻发布会爬取美团新闻信息#xff0c;此处采用两种方法实现#xff1a; 注意点#xff1a;因为此处的数据都是动态数据#xff0c;所以一定要考虑好向下滑动数据包会更新的情况#xff0c;不然就只能读取当前页即第一页数据#xff0c;方法一通过更新ajax数据包网址页数#xf…爬取美团新闻信息此处采用两种方法实现 注意点因为此处的数据都是动态数据所以一定要考虑好向下滑动数据包会更新的情况不然就只能读取当前页即第一页数据方法一通过更新ajax数据包网址页数方法二通过计算网页高度滚动到底部实现持续向下滑动过程。 方法一  使用寻找包含数据的ajax请求json数据的数据包通过jsonpath定位提取出想要的数据  # -- coding: utf-8 -- # 爬取内容标题标签简介 import requests import json import jsonpath import pprintnum 1 headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36,cookie: _lxsdk_cuid192b4109d3bc8-0ab8530f770fd3-26001051-144000-192b4109d3bc8; logan_session_tokens9yzimqoliqqqa0xxruc; cookie_consenttrue; _lxsdk_s192b4109d3c-294-7f6-c00%7C%7C12 } while num 10:url fhttps://www.meituan.com/smart/view/news/r/tNewsService_pageGetByQuery?pageSize10pageNo{num}newsClassifyIdlanTypezh-CNresponse requests.get(url, headersheaders)dict_data json.loads(response.content)# pprint.pprint(dict_data)titles jsonpath.jsonpath(dict_data, $..title)signs jsonpath.jsonpath(dict_data, $..newsClassifyName)contents jsonpath.jsonpath(dict_data, $..newsAbstract)comment_list []for title, sign, comment in zip(titles, signs, contents):comment_dict {标题: title,标签: sign,简介: comment,}comment_list.append(comment_dict)print(json.dumps(comment_list, ensure_asciiFalse, indent4))num 1爬取结果 方法二 使用selenium进行自动化操作通过xpath定位数据实现对数据的提取 # -- coding: utf-8 -- from selenium import webdriver from selenium.webdriver.common.by import By import timedriver webdriver.Chrome() driver.get(https://www.meituan.com/news?requestCodeb872f8728bc74f9f9c90688d88b58e1dresponseCodeff49426a9e664f6ba92cbaa7fc9b9b08)# 等待页面加载 time.sleep(3) # 设置滚动和爬取参数 scroll_pause_time 2 # 每次滚动后的等待时间 previous_height driver.execute_script(return document.body.scrollHeight) #JavaScript 代码返回当前网页的总高度# 循环进行滚动和数据爬取 while True:# 获取当前页面的元素列表el_list driver.find_elements(By.XPATH, //*[id__next]/div[2]/div[2]/div/div[2]/a/div/div[1]/div)# 输出当前爬取的内容for el in el_list:title el.find_element(By.XPATH, .//h2).textsign el.find_element(By.XPATH, .//div[2]/span[1]/span).textcontent el.find_element(By.XPATH, .//div[1]).textcomment_dict {标题: title,标签: sign,简介: content,}print(comment_dict) # 输出当前获取的数据# 滚动到页面底部driver.execute_script(window.scrollTo(0, document.body.scrollHeight);)# 等待新内容加载time.sleep(scroll_pause_time)# 计算新的滚动高度new_height driver.execute_script(return document.body.scrollHeight)if new_height previous_height:break # 如果没有更多内容退出循环previous_height new_heightdriver.quit()爬取结果
http://www.w-s-a.com/news/155162/

相关文章:

  • 论坛网站开发网络营销是什么时候产生的
  • 帮人做网站赚钱无忧软文网
  • 做网站要不要营业执照重庆网站优化seo公司
  • 学院宣传网站建设简介做网站没灵感
  • 网站建设终稿确认书网站意义学校
  • 3小时网站建设平台专业制作教学课件
  • 曲阜网站建设百度开户现货黄金什么网站可以做直播
  • 比较好的企业建站平台小程序开发外包该注意些什么
  • 建行官网官网网站吗二次元风格wordpress模板
  • 怎样开通自己的网站网址导航哪个主页最好
  • 大良o2o网站建设详情页设计说明怎么写
  • 您与此网站之间建立的连接不安全汽车cms系统是什么意思
  • 有没有做logo的网站企业网站的内容营销
  • 哈尔滨做企业网站怎么做网站自动响应
  • 网站建设硬件和软件技术环境配置签约做网站模板
  • 教育网站建设的素材手机app制作流程
  • 免费行情软件网站大全下载网站备案查询
  • flex网站模板wordpress实时预览
  • 建设银行网站模板为什么企业要建设自己的企业文化
  • 网站建设必知免费手机网站建站系统
  • ssh可以做wap网站么嘉兴seo排名
  • 站内优化包括哪些帝国做企业网站
  • 做网站seo赚钱吗网络维护和故障维修
  • 企业网站可以自己做摄影网站开发背景怎么写
  • 网站百度指数seo最好的工具
  • 宝安专业网站建设推荐设计感强的网站
  • 网站建设 6万元北京知名的品牌设计公司
  • 网站建设的总体需求是什么vmware 下wordpress
  • 光谷网站建设请检查网络
  • 申请建设网站的报告书商务网站开发课程体会