当前位置: 首页 > news >正文

如何与别的网站做友情链接做网站排名大概要多少钱

如何与别的网站做友情链接,做网站排名大概要多少钱,网站浮动窗口代码php,郑州网站制作-中国互联原生scrapy如何接入scrapy-redis#xff0c;实现初步入局分布式 前言scrpy-redis分布式碎语 实现流程扩展结束 前言 scrpy-redis分布式 下图是scrpy-redis官方提供的架构图#xff0c;按我理解#xff0c;与原生scrapy的差异主要是把名单队列服务器化#xff0c;也是存储… 原生scrapy如何接入scrapy-redis实现初步入局分布式 前言scrpy-redis分布式碎语 实现流程扩展结束 前言 scrpy-redis分布式 下图是scrpy-redis官方提供的架构图按我理解与原生scrapy的差异主要是把名单队列服务器化也是存储在redis服务中从而实现分布式。当然还有piplines采集结果数据的存储差异化它也可以存储到redis中实现数据存储分布式 其实一套完整、健全的采集框架可以在scrapy-redis的基础上加入代理池服务cookie池服务数据存储服务等等一般来说不会把解析流程放在采集时做每个环节只做自己的事情不要越界所有后面还会有解析入库服务听听就好这套流程搞起来太麻烦了一般开发都是直接scrapy项目集成搞定。想法还是要有的这套流程不只是解耦更是为了监控和日志统计。 碎语 scrapy-redis分布式实现流程网上有很多教程参考源码和博客教程后看是看得懂关键还是得实践在这些基础上整理出自己的实现经验。 实现流程 安装scrapy-redis包 pip install scrapy-redissessting配置文件中添加下面配置信息 这是最基本的配置 DUPEFILTER_CLASS scrapy_redis.dupefilter.RFPDupeFilter SCHEDULER scrapy_redis.scheduler.Scheduler SCHEDULER_PERSIST True # SCHEDULER_QUEUE_CLASS scrapy_redis.queue.SpiderPriorityQueue # SCHEDULER_QUEUE_CLASS scrapy_redis.queue.SpiderQueue # SCHEDULER_QUEUE_CLASS scrapy_redis.queue.SpiderStack# redis REDIS_HOST 127.0.0.1 REDIS_PORT 6379 # REDIS_ENCODING utf-8 # REDIS_PARAMS {password: redispasswordqwe} # 如果有密码的话采集脚本修改必要参数 scrapy脚本的一般样式如下 接入scrapy-reids后的一般样式如下 到一步其实我们就已经实现好代码层的改动了只要运行成功就表示已经接入成功往redis写入名单 运行后发现采集脚本的逻辑并没有执行且程序一直在运行着这是因为scrapy-redis会一直监听redis队列只要往redis写入名单队列scrapy-redis就会自动拿到名单并执行采集脚本的逻辑所以这一步我们需要往redis写入对应的key的名单。 lpush dmoz:start_urls http://www.dmoz-odp.org/ # scrapy-redis的采用的start_urls是列表结构原生命令or工具 写入成功后就可以看到程序跑起来了。 扩展 使用scrapy-redis后一般情况下在某个脚本编号下redis会生成三个key分别是 其中 start_urls是初始名单队列使用的是列表数据结构dupefilter是去重队列这个只有你开启了去重机制才会生成默认是不开启的使用的是集合数据结构requests是scheduler名单队列我们知道所有名单都是由scheduler发送给调度器的而scheduler的名单一般是两个来源一个是初始名单队列另一个是由Spider提取后发送到scheduler的这一步就会生成这个key并且它是有积分优先级机制的priority所以它使用的是有序集合数据结构 所有其实我们也可以直接生成requests名单队列当然生成方式会相对复杂这个后面分享分享~ 结束 好了分享就到这了有啥错误的地方请指正~
http://www.w-s-a.com/news/554365/

相关文章:

  • 东莞市锂电池网站建设HTML5怎么做自适应网站
  • 江苏城乡建设学校网站群晖建立wordpress
  • wordpress导入网站模板seo自学网官网
  • 购物网站服务器带宽北京网站开发周期
  • 同性做视频网站网站怎么添加栏目
  • 新余网站设计seo自学网站
  • 新乡个人网站建设价格wordpress数据插件
  • 你是网站设计有限公司的项目经理网站推广的重要性
  • 网站定制开发怎么写泸州设计公司有哪些
  • 上海网站建设zj kt迅速编程做网站
  • 郑州服装 网站建设网站栏目合理性
  • 平面设计在线网站最新汽油价格调整最新消息
  • 刷单网站建设wordpress缩略图 裁剪
  • 视差 网站泰州公司做网站
  • 广州网站优化系统怎么做淘客网站
  • 类似凡科互动的网站wordpress网站下载
  • 临沂网站制作公司安卓app开发实例教程
  • 泰州做网站 泰公网络科技公司网站升级中html
  • 如何做授权网站网站设计心得
  • 网站排名快速上升wordpress自动标签页
  • 做的好的手机网站有哪些万网域名交易
  • 网站怎么做漂亮点做陶瓷的公司网站
  • 软件开发设计制作网站下载自己怎么做视频收费网站
  • 江苏省建设安全协会网站天津网站建设哪家公司好
  • 资源类网站怎么做的网站上线准备工作
  • 长沙专业网站建设怎么做企业建站公司服务
  • 肇庆市有限公司网站建设手机直接看的网站有哪些
  • 织梦修改网站后备份英语作文模板高中
  • 个人网站域名用什么好上海公司拍沪牌需要什么条件
  • 网站建设 保密做网站赚钱交税