当前位置: 首页 > news >正文

目录搜索引擎网站怎么搭建自己的网站

目录搜索引擎网站,怎么搭建自己的网站,做电子板报的网站,制作表白网站教程目录 一、环境准备 二、编写代码 2.1 分页分析 2.2 编码 一、环境准备 安装requests和lxml pip install requests pip install lxml 二、编写代码 2.1 分页分析 编写代码前我们先看看榜单的url 我们假如要爬取五页的数据#xff0c;那么五个url分别是#xff1a; htt…目录 一、环境准备 二、编写代码 2.1 分页分析 2.2 编码 一、环境准备 安装requests和lxml pip install requests pip install lxml 二、编写代码 2.1 分页分析 编写代码前我们先看看榜单的url 我们假如要爬取五页的数据那么五个url分别是 https://movie.douban.com/top250?start0filter https://movie.douban.com/top250?start25filter https://movie.douban.com/top250?start50filter https://movie.douban.com/top250?start75filter https://movie.douban.com/top250?start100filter 不难看出规律在于start参数每页有25条数据。 那么按照分页计算公式 (当前页数 - 1) * 每页数据量 得出 代码逻辑。 2.2 编码 我们复制下xpath。 import random from lxml import etree import requests import time# 请求头信息 headers {User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.0.0 Safari/537.36 } # 共取5页数据 for i in range(1, 6):start (i - 1) * 25url fhttps://movie.douban.com/top250?start{start}filterresponse requests.get(url, headersheaders)tree etree.HTML(response.text)div tree.xpath(//*[idcontent]/div/div[1]/ol/li/div)for d in div:# 获取当前电影标题title d.xpath(.//span[classtitle][1]/text())[0]print(title)time.sleep(random.randint(1, 3)) 成功爬取豆瓣电影TOP250榜单。
http://www.w-s-a.com/news/22950/

相关文章:

  • 网站怎么群发广州现在可以正常出入吗
  • 微信有网站开发吗多语种网站
  • 深圳网站设计 建设首选深圳市室内设计公司排名前50
  • 上海网站建设 觉策动力wordpress接口开发
  • 网站建设服务器的选择方案小型视频网站建设
  • 江宁做网站价格扬州立扬计算机培训网站建设怎么样
  • 手表网站背景开发新客户的十大渠道
  • 定制网站设计wordpress写的网站
  • p2p网站建设公司排名成都装饰公司
  • 网站被k怎么恢复wordpress缓存类
  • 做外贸有哪些网站平台最近文章 wordpress
  • joomla网站模板一个人做网站的swot
  • 南京建设网站需要多少钱深圳专业网站建设制作价格
  • 天河建网站装修公司线上推广方式
  • 超市网站怎么做的目前最流行的拓客方法
  • 做文字logo的网站贵阳商城网站开发
  • 沧州有没有做网站的中国建筑设计
  • 建设网站 系统占用空间在线代理浏览网站
  • 做海报有什么参考的网站网站建设验收合同
  • 酒店网站制作wordpress文章评论设置
  • 造一个官方网站wordpress mysql类
  • 怎么做卡商网站河南做网站找谁
  • 网站建设招标方案模板上线啦 图谱智能网站
  • 龙口网站建设公司哪家好wordpress 上传类型
  • 做外贸主要看什么网站服务平台的宗旨
  • 宜昌营销型网站购买网站
  • 如何查询网站建设时间wordpress 框架解析
  • 网站建设年终总结网站建设公司顺义
  • 网页给别人做的 网站后续收费吗获取更多付费流量
  • 金融交易网站建设金融 网站建设