当前位置: 首页 > news >正文

做网站提成防红短链接生成接口地址

做网站提成,防红短链接生成接口地址,php电商网站开发贴吧,建设网站备案不通过怎么办爬取当当网图书数据并保存到本地#xff0c;使用request、lxml的etree模块、pandas保存数据为excel到本地。 爬取网页的url为#xff1a; http://search.dangdang.com/?key{}actinputpage_index{} 其中key为搜索关键字#xff0c;page_index为页码。 爬取的数据…爬取当当网图书数据并保存到本地使用request、lxml的etree模块、pandas保存数据为excel到本地。 爬取网页的url为 http://search.dangdang.com/?key{}actinputpage_index{} 其中key为搜索关键字page_index为页码。 爬取的数据包括爬取的数据包括书名、作者、图书简介、出版社、出版日期、价格、评论数量。 代码如下 import random import requests from lxml import etree import pandas as pd import timedata [] data.append([书名, 作者, 图书简介, 出版社, 出版日期, 价格, 评论数量]) def get_book_info(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36}response requests.get(url, headersheaders)response.encoding gbkif response.status_code 200:selector etree.HTML(response.text) book_list selector.xpath(//*[idcomponent_59]/li)for book in book_list:# 书名 book_name .join(book.xpath(.//p[1]/a/title))# 作者book_author .join(book.xpath(.//p[5]/span[1]/a/title))# 图书简介book_intro .join(book.xpath(.//p[2]/text()))# 出版社book_publisher .join(book.xpath(.//p[5]/span[3]/a/title)) # 出版日期 book_date .join(book.xpath(.//p[5]/span[2]/text()))# 价格book_price .join(book.xpath(.//p[3]/span[1]/text()))# 评论数量book_comments .join(book.xpath(.//p[4]/a/text()))# 随机等待时间防止被封IPrdn random.randint(1, 5) print(f等待时间{rdn})time.sleep(rdn)data.append([book_name, book_author, book_intro, book_publisher, book_date, book_price, book_comments])if __name__ __main__: keyword input(请输入搜索关键字)page_index 1while True:url fhttp://search.dangdang.com/?key{keyword}actinputpage_index{page_index}print(f正在爬取第{page_index}页数据...)get_book_info(url)page_index 1if page_index 1:breakdf pd.DataFrame(data[1:], columnsdata[0])# 将DataFrame保存为Excel文件df.to_excel(f{keyword}.xlsx, indexFalse)
http://www.w-s-a.com/news/436962/

相关文章:

  • 安阳市哪里做网站建设网站流量怎么赚钱
  • 网站开发与优化课程总结软件班级网站建设
  • py网站开发wordpress 公司网站 模板 下载
  • 长春城乡建设部网站首页英文网站推广服务
  • wordpress实训上海整站seo
  • 福建自己建设网站义乌市企推网络科技有限公司
  • 宁波优化网站哪家好织梦网站地图怎么做
  • 怎么在自己的网站加关键词烟台企业网站建设
  • 中山网站建设界面设计职业技能等级证书
  • 做网站首页多少钱免费版企业邮箱注册
  • ppp模式在网站建设的南昌专业做网站公司哪家好
  • 泰安网站建设制作电话号码百度sem竞价托管公司
  • 苏网站建设网页设计和网页美工
  • 跨境电商平台网站广州地铁站路线图
  • 吉林省交通建设集团有限公司网站企业网站推广的策略有哪些
  • 网站内链怎么做更好郑州网站建设哪家便宜
  • 建设大型购物网站运城哪里做网站
  • php企业网站通讯录管理系统做网站在线支付系统多少钱?
  • 怎么区分用vs和dw做的网站贝贝网网站开发背景
  • 无锡网站建设制作建设信息网查询
  • 彩票系统网站开发建设人力资源网官网
  • 有专门下载地图做方案的网站吗网站建设平台计划书
  • 网站闭站保护10个著名摄影网站
  • 安徽省建设工程信息网官网首页网站关键词排名优化工具
  • 深圳网站建设 百业网站专题教程
  • 公司seo是指什么意思如何来做网站优化
  • 化妆品网站建设平台的分析湖南网站搜索排名优化电话
  • 织梦网站修改教程视频教程管理类网站开发价格
  • 如何让新网站快速收录企业建站的作用是什么
  • 在线制作简历的网站做的最好的微电影网站