当前位置: 首页 > news >正文

用php做的单车租赁网站淘宝联盟自建网站教程

用php做的单车租赁网站,淘宝联盟自建网站教程,免费算命,wordpress 精简我们都知道Spark是弹性分布式数据集#xff0c;数据会存储在多台机器上#xff0c;那么如何确保在分布式数据计算中#xff0c;数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。 Spark 主要提供了3个层面的数据容错机制。分别是 调度层#xff0c;RDD…         我们都知道Spark是弹性分布式数据集数据会存储在多台机器上那么如何确保在分布式数据计算中数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。 Spark 主要提供了3个层面的数据容错机制。分别是 调度层RDD血统层, Checkpoint 层。在这3大层面中包括Spark RDD容错的4大核心要点. (调度层)Stage输出失败上层调度器DAGScheduler重试。(调度层)Spark计算中Task内部任务失败底层调度器重试。(血统层)RDD Lineage血统中窄依赖宽依赖计算。(Checkpoint层)Checkpoint 缓存。 调度层 DAG生成层 Stage 输出失败上层调度器DAGScheduler 会进行重试 详细源码详见 Spark大数据商业实战三部曲p58 Task计算层 Spark计算过程中计算内部某个Task任务出现失败底层调度器会对此Task进行若干次重试默认4次 详细源码详见 Spark大数据商业实战三部曲p58 血统层 SparkRDD 实现基于Lineage的容错机制基于RDD的各项transformation 构成compute chain, 在部分计算结果丢失的时候可以根据Lineage重新恢复计算。 窄依赖  在子RDD的分区丢失需要重算父RDD分区时。父RDD相应分区的所有数据都是子RDD分区的数据并不存在冗余计算。 宽依赖 丢失一个RDD分区重算的每个父RDD的每个分区的所有数据并不是都丢给丢失的RDD的子RDD分区用的会有一部分数据相当于对应的是未丢失的子RDD分区中需要的数据这样就会产生冗余计算开销和巨大的性能浪费。 Checkpoint层 Spark checkpoint 通过将RDD写入Disk作为检查点是Spark lineage容错的辅助lineage过长会造成容错成本过高这时在中间阶段做检查点容错如果之后有节点出现问题而丢失分区从做检查点的RDD开始重做Lineage, 就会减少开销。 checkpoint 主要适用于以下两种情况 DAG中的Lineage过长如果重算开销太大如PageRank, ALS等尤其适合于在宽依赖上作checkpoint,这个时候就可以避免为Lineage重新计算而带来的冗余计算。
http://www.w-s-a.com/news/886734/

相关文章:

  • 关注城市建设网站居众装饰
  • 网站建设的语言优化企业网站
  • 成都旅游网站建设规划女性门户资讯类网站织梦dedecms模板
  • 二手车为什么做网站网站建设合作合同范文
  • 网站建设维护和网页设计做网站都需要服务器吗
  • 成都网站设计报告书系统平台
  • 怎样进行网站推广wordpress微博图床
  • 做一个平台 网站服务器搭建网架公司股价
  • 链家在线网站是哪个公司做的一个虚拟主机做2个网站
  • 网站开发实训报告模板学校网站建设计划
  • 免费手机网站制作方法什么事网站开发
  • 我们的爱情网站制作阿里云wordpress配置
  • 电脑网站页面怎么调大小唐山网站建设技术外包
  • 科威网络做网站怎么样wordpress分页样式
  • 泰安公司网站建设自助建站程序
  • 网站建设工程设计图建网站怎样往网站传视频
  • 做网站月入企业网站建设运营
  • 网站建设中的ftp地址公众号微官网
  • 手机wap网站开发与设计app开发公司电话
  • 网站页脚代码大沥网站开发
  • 重庆网站制作公司 广州天成网络技术有限公司
  • 佛山网站改版wordpress 是否有后门
  • 如何承接网站建设外包wordpress产品布局
  • 洛阳建站洛阳市网站建设视觉设计专业
  • 婚恋网站建设分析网站建设硬件需求
  • 北京做网站电话wordpress如何换图片
  • 电影网站做cpa深圳信息网
  • 单县网站建设优化大师电脑版官网
  • 番禺区住房和建设局物业网站浦东新区网站设计
  • 外贸网站外包WordPress仿牌