当前位置: 首页 > news >正文

营销型网站外包建网站空间可以不买

营销型网站外包,建网站空间可以不买,网站开发一般流程,wordpress微信同步爬虫简介 可以把互联网比做成一张 “大网”#xff0c;爬虫就是在这张大网上不断爬取信息的程序。 爬虫是请求网站并提取数据的自动化程序。 省流#xff1a;Demo实现前置知识#xff1a; JS 基础Node 基础 #xff08;1#xff09;爬虫基本工作流程#xff1a; 向…爬虫简介 可以把互联网比做成一张 “大网”爬虫就是在这张大网上不断爬取信息的程序。 爬虫是请求网站并提取数据的自动化程序。 省流Demo实现前置知识 JS 基础Node 基础 1爬虫基本工作流程 向指定的URL发送 http 请求获取响应(HTML、XML、JSON、二进制等数据)处理数据(解析DOM、解析JSON等)将处理好的数据进行存储 相关岗位: 数据分析大数据应用运营人工智能  2爬虫作用 搜索引擎自动化程序 自动获取数据自动签到自动薅羊毛自动下载 抢票软件  爬虫就是一个探测程序它的基本功能就是模拟人的行为去各个网站转悠点点按钮找找数据或者把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去 。 使用的百度和Google其实就是利用了这种爬虫技术: 每天放出无数爬虫到各个网站把他们的信来存到数据库中等用户来检索。   抢票软件自动帮你不断刷新 12306 网站的火车余票。一旦发现有票就马上下单然后你自己来付款。 在现实中几乎所有行业的网站都会被爬虫所“骚扰”而这些骚扰都是为了方便用户。 爬虫批量下载图片  目标以https://www.itheima.com/teacher.html#aweb 网站目标为例下载图片 ①获取网页内容  使用 axios 或 node 原生 API发起请求,得到的结果就是整个HTML网页内容  1 使用axios // 步骤 //使用ES6 语法记得将package.json中的修改为type:module //1.发起 HTTP 请求获取到当前网页(借助 axios) import axios from axios//function getData(){//axios.get(https://www.itheima.com/teacher.html#aweb).then()//.then 后拿到promise对象 //}async function getData(){const res await axios.get(https://www.itheima.com/teacher.html#aweb)console.log(res.data) }getData() 2使用node方法使用 http.request()方法即可发送 http 请求如下 //引入https模块 const http require(https) //创建请求对象 let reg http.request(https://www.itheima.com/teacher.html#aweb, res {//准备chunkslet chunks []res.on(data,chunk {//监听到数据就存储chunks.push(chunk) }) res.on(end(){//结束数据监听时讲所有内容拼接console.log(Buffer.concat(chunks).toString(utf-8))})}) //发送请求 req.end() ②解析 HTML 并下载图片 使用 cheerio 加载 HTML回顾 jQueryAPI·加载所有的 img标签的 src 属性使用 download 库批量下载图片 cheerio库 官方地址The industry standard for working with HTML in JavaScript | cheerioThe fast, flexible elegant library for parsing and manipulating HTML and XML.https://cheerio.js.org/ 在服务器上用这个库来解析 HTML 代码并且可以直接使用和 jQuery 一样的 API 官方 demo 如下: const cheerio require(cheerio) const $ cheerio.load(h2 classtitleHello world/h2) $(h2.title).text(Hello there!) $(h2).addClass(welcome) $.html() // htmlhead/headbodyh2 classtitle welcomeHello there!/h2/body/html 同样也可以通过 jQuery 的 API 来获取DOM元素中的属性和内容 1使用 cheerio库解析 HTML 1.分析网页中所有 img 标签所在结构  import axios from axios import cheerio from cheerio async function getData(){const res await axios.get(https://www.itheima.com/teacher.html#aweb)const $ cheeri0.load(res.data)//使用 cheerio 解析网页源码const imgs Array.from($(.tea main .tea con img)).map(img https://www.itheima.com/$(img).attr(src)) //用map遍历之后jQuery的attr//使用选择器解析所有的 img 的src 属性console.log(imgs) }getData()
http://www.w-s-a.com/news/449906/

相关文章:

  • 宁波网站建设公司推荐哪家淄博网站制作公司服务
  • 做网站网页挣钱不免费主题wordpress
  • 如何提高你的网站的粘性手机网站整站模板下载
  • 学校网站建设制度网站相关推荐怎么做
  • 昌图网站wordpress 视频外链
  • 企业网站要怎么建设重庆住房城乡建设部网站
  • html5网站特点seo教程培训班
  • 深圳网站建设哪个最好网站 多语
  • 互联网工具型网站创意网络广告
  • 影视公司网站建设网页界面设计分辨率是多少dpi
  • 免费的做微博的网站模板wordpress 页面 首页
  • 摄影图片网站网站辅导运营与托管公司
  • 做课件的网站长春免费建站模板
  • 响应式网站模板下载免费wordpress 小工具移动
  • 网站标签title在线app制作平台
  • 做电器推广的网站简洁大方的网站模板
  • 网站开发的平台100个详情页设计图
  • wordpress淘宝客建站教程视频知名的设计公司网站
  • 批量做单页网站怎么直接用代码做网站
  • 百度收录较好的网站办公室装修设计方案
  • 建设购物网站要求cnzz数据统计
  • 深圳自适应网站建设价格广东网站建设软件
  • 网页设计介绍北京网站自己做彩票网站
  • 最牛论坛网站app生成链接
  • 用jsp做的网站源代码网站优化说明
  • 网站建设公司名字甘肃省和住房建设厅网站
  • 做外贸网站需要什么卡网站建设公司怎样
  • 网站关键词密度怎么计算的中文版wordpress
  • asp网站建设教程如何在线上推广自己的产品
  • 电脑网站你懂我意思正能量济南网站建设公司熊掌号