当前位置: 首页 > news >正文

用asp做的一个网站实例源代码网页设计基础教程第七章课后习题

用asp做的一个网站实例源代码,网页设计基础教程第七章课后习题,学校网站 制作,各大网站投稿方式MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据#xff0c;通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业#xff0c;如文本处理、数据分析和大规模数据集的聚合等。然而#xff0c;MapReduce也有… MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业如文本处理、数据分析和大规模数据集的聚合等。然而MapReduce也有其局限性比如对于需要快速迭代的任务或者实时数据处理MapReduce可能不是最佳选择。 总的来说MapReduce是大数据技术中的一个重要概念它在Hadoop生态系统中发挥着关键作用特别是在处理大规模数据集时它提供了一种可靠且高效的方法来并行处理数据。本篇我们来讲解一下MapReduce的相关内容。 一 MapReduce模型介绍 随着需要处理的数据量激增我们开始借助分布式并行编程来提高程序的性能分布式并行程序运行在大规模计算机集群上可以并行执行大规模数据处理任务从而获得海量计算的能力。 谷歌公司最先提了分布式并行模型MapReducehadoop MapReduce则是其的开源实现。但是在MapReduce出现之前就已经有MPI一类的并行计算框架了两者的区别主要在于 传统并行计算框架MapReduce集群架构共享式共享内存/共享存储非共享式 容错性 容错性差容错性好价格贵相对较低硬件扩展性刀片服务器高速网SAN扩展性差普通PC机扩展性好学习难度高低使用场景实时、细粒度、计算密集型批处理、非实时、数据密集型 可以看出两者最大的区别在与其适用的场景不同之前我们对于并行计算的要求更多注重计算密集型而云计算则更注重对“大数据”的处理因此传统的并行计算框架已经远远不能满足我们的需求了。 MapReduce的优点在于其易于编程、具有良好的扩展性以及高容错性可以实现上千台服务器集群并发工作提供数据处理能力。但同样的MapReduce也不适合进行实时计算或流式计算。 MapReduce将复杂的、运行于大规模集群上的并行计算过程高度抽象到了两个函数——map和reduce。通过MapReduce框架我们不需要掌握分布式编程的细节也能够容易的将自己的程序运行在分布式系统上。 MapReduce的一个重要理念就是“计算向数据靠拢”而不是传统的“数据向计算靠拢”。 MapReduce框架采用了master/slave架构包括一个master和若干个slavemaster上运行作业跟踪器JobTracker负责整个作业的调度和处理以及失败和恢复slave上运行负责具体任务执行的组件TaskTracker负责接受JobTracke发给它的作业处理指令完成具体的任务处理。 map函数的输入为k,v键值对每一个输入的k,v键值对会输出一批k2,v2中间结果。 reduce函数的输入为k,list(v)输出为k,v键值对。listv表示一批属于同一个k的value。 二 MapReduce体系结构 MapReduce的体系结构包括 Client 客户端。 用户编写的MapReduce程序通过Client提交到JobTracker端 用户可通过Client提供的一些接口查看当前提交作业的运行状态。 JobTracker 作业跟踪器。 JobTracker负责资源监控和作业调度。 JobTracker 监控所有TaskTracker与Job的健康状况一旦发现失败就将相应的任务转移到其他节点 JobTracker负责任务的调度即将不同的Task分派到相应的TaskTracker中。 JobTracker 会跟踪任务的执行进度、资源使用量等信息并将这些信息发送给TaskScheduler而调度器会在资源出现空闲时 选择合适的任务去使用这些资源 TaskScheduler 任务调度器 负责任务的调度即将不同的Task分派到相应的TaskTracker中。 TaskTracker  TaskTracker会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker同时接收JobTracker 发送过来的命令并执行相应的操作如启动新任务、杀死任务等 。 TaskTracker 使用“slot”等量划分本节点上的资源量CPU、内存等。 一个Task 获取到一个slot 后才有机会运行而Hadoop调度器的作用就是将各个TaskTracker上的空闲slot分配给Task使用。slot 分为Map slot 和 Reduce slot 两种分别供MapTask 和Reduce Task 使用两者不通用。 Task  Task 分为Map Task 和Reduce Task 两种在一台机器上可以同时运行两种任务均由TaskTracker启动。 三 MapReduce工作流程 不同的map任务之间不会进行通信。 不同的Reduce任务之间不会发生任何信息交换。 用户不能显式地从一台机器向另一台机器发送消息。 所有的数据交换都是通过MapReduce框架自身去实现。 1 MapReduce 框架使用 InputFormat模块做Ma前的预处理比如验证输入的格式是否符合输入定义然后将输入文件切分为逻辑上的多个 InputSplit。 InputSplit是 MapReduce对文件进行处理和运算的输入单位只是一个逻辑概念每个 InputSplit并没有对文件进行实际切分只是记录了要处理的数据的位置和长度 2因为 InputSplit是逻辑切分而非物理切分所以还需要通过 RecordReaderRR根据InputSplit中的信息来处理 InputSplit中的具体记录加载数据并将其转换为适合Map任务读取的键值对输入给Map任务 3Map任务会根据用户自定义的映射规则输出一系列的keyvalue作为中间结果 4为了让Reduce可以并行处理Map的结果需要对Map的输出进行一定的分区Partition、排序Sort、合并Combine、归并Merge等操作得到keyvalue-list形式的中间结果再交给对应的Reduce来处理,这个过程称为Shuffle。 5Reduce以一系列key,value-list中间结果作为输入执行用户定义的逻辑输出结果交给OutputFormat模块。 6OutputFormat 模块会验证输出目录是否已经存在以及输出结果类型是否符合配置文件中的配置类型如果都满足就输出Reduce的结果到分布式文件系统。 本篇我们简单介绍了MapReduce模型及其工作流程下面我们会借助章鱼大数据平台完成我们的第一个MapReduce练习通过代码编写进一步理解MapReduce的原理及流程。
http://www.w-s-a.com/news/148740/

相关文章:

  • 浏览器正能量网站网页文章导入wordpress
  • 江西中国建设银行网站首页永久免费自助建网站
  • 创建自己网站的步骤吸引人的微信软文
  • 网站建设与网页设计论述题软件开发公司在哪里
  • 二级网站建设方案模板亚马逊网站建设案例
  • 网站开发兼职团队门户网站如何制作
  • 高州市网站建设开发区招聘信息
  • 上海专业网站制作设计公司企业邮箱怎样注册
  • 网站建设在商标第几类网站建设 设计创意
  • 做一网站APP多少钱重庆中色十二冶金建设有限公司网站
  • 网上做效果图网站有哪些软件徐州泉山区建设局网站
  • 凯里网站制作网站篡改搜索引擎js
  • 如何使用凡科建设网站武安城乡建设网站
  • 网站建设网站及上传wordpress火车头发布
  • 有没有做网站的团队电脑版传奇网站
  • 建立企业网站公司医疗创意小产品设计
  • 深圳 做网站 车公庙免费的招标网有哪些
  • 网站在那里备案成都成华区网站建设
  • 做网站选哪家好搜索引擎优化的目标体系包括哪些
  • 做数据可视化的网站ppt2016是制作网页的软件
  • 济宁市建设工程质量监督站网站徐州网站优化推广
  • 北京网站设计多少钱php做商品网站
  • 能打开的网站你了解的彩票网站开发dadi163
  • 手机做网站价格优秀企业网站建设价格
  • 电商网站建设企业做网站的客户多吗
  • 有做思维图的网站吗西安建设市场诚信信息平台网站
  • 网站建设求职具备什么30岁学网站开发
  • 官方网站minecraft北京低价做网站
  • 网站建设报价兴田德润机械加工网络接单
  • 免费的推广网站安卓app制作平台