当前位置: 首页 > news >正文

曹县有没有做网站禅城区网站建站网站

曹县有没有做网站,禅城区网站建站网站,收废品做网站怎么做,同程网 网站模板概述 四大特点#xff1a;大量化、快速化、多元化、价值化 关键技术#xff1a;采集、存储管理、处理分析、隐私和安全 计算模式#xff1a;批处理、流、图、查询分析计算 Hadoop处理架构 了解就好 2007年#xff0c;雅虎在Sunnyvale总部建立了M45——一个包含了4000…概述 四大特点大量化、快速化、多元化、价值化 关键技术采集、存储管理、处理分析、隐私和安全 计算模式批处理、流、图、查询分析计算 Hadoop处理架构 了解就好 2007年雅虎在Sunnyvale总部建立了M45——一个包含了4000个处理器和1.5PB容量的Hadoop集群系统 启动haoop Start-all.sh查看状态 jpsNameNod:负责协调数据存储 DataNod:存储被拆分的数据块 JobTracker协调计算 TaskTracker负责完成JobTrack的计算 SecondaryNameNod 帮助NameNod收集系统运行数据 Hadoop特点 高可靠性 高效性 高可扩展性 高容错性 成本低 运行在Linux平台上 支持多种编程语言 HDFS 计算机集群结构 分布式文件系统把文件存储在多个计算机节点上、所有的计算机节点构成一个集群 相比多个处理器和专用高级硬件的并行化处理装置 大大降低的成本开销 图无需记忆仅仅帮助理解 分布式文件系统的结构 由 MasterNode NameNode SlaveNode DataNode构成 图无需记忆仅仅帮助理解 HDFS实现目标 廉价设备 流数据读写 大数据集 简单文件模型 跨平台 HDFS 局限 无法 多用户写入和修改任意文件 不适 低延迟数据访问 很难高效存储打大量小文件 HDFS默认一个块64MB 寻址方式 从NameNode中找到构成目标文件的数据快的位置列表、从位置列表中得到存储各数据块的数据节点位置数据节点找到文件返回给客户端 HDFS采用抽象数据块好处 支持大规模文件存储 一个大文件会被拆分成小文件分发到各个节点、所以文件大小不受单个节点影响 简化系统设计 适合数据备份 每个文件都可以冗余存储到各个节点、提高了容错性 三个副本如何存储 第一个副本放置在上传文件的数据节点如果是集群外提交则随机挑选一台磁盘不太满、CPU不太忙的节点 第二个副本放置在与第一个副本不同的机架的节点上 第三个副本与第一个副本相同机架的其他节点上 更多副本随机节点 NameNod DataNode FsImage 维护整个系统的所有目录和文件信息 保存了最新的元数据检查点、包含了整个系统的所有目录和文件信息扩展 EditLog 存储了对所有文件 操作编辑、删除、添加…… 的日志 FsImage EditLog 的备份(其备份在secondaryNamenode上 NameNode暂停使用EditLog创建 EditLong.new. secondaryNamenode 获取到NameNode上的fsimage 和 editlog通过get方式 secondaryNamenode 将fsimage存入内存一条一条执行editlog中的更新操作将fsimage和editlog合并 SecondaryNameNode 通过post方式将 Fsimage发送到 NameNode上 Namenode 用Editlog.new 替代 Editlog 数据节点出错 每个数据节点会定期的向NameNode发送“心跳”报告自己的状态 当数据节点出错“心跳”将停止、这时数据节点就会被标记为“宕机”NameNode将不再向该节点发送任何I/O 由于数据节点不可用可能会出现数据块的副本数量小于****冗余因子**** 当系统检测到莫数据节点出现 3.这种情况就会为该节点生成新的副本 建议看视频15分钟左右 读数据的过程 ​ 和寻址方式有一定 类似 重要 写数据的过程 HDFS常用命名 建议命名头使用 hadoop fs 运用 Hdfs dfs -ls 指定路径显示指定路径的所有文件Hdfs dfs -madir 指定路径创建指定路径下的指定name的文件夹…… -put 本地文件 目标位置…… -get 目标文件 指定位置复制文件到本地文件系统hadoop fs -copyFromLocal localsrc dst将本地源文件localsrc复制到路径dst指定的文件或文件夹中…… -cat 指定文件查看指定文件MapReduce MapReduce将计算过程抽象到了两个函数Map和Reduce MapReduce采用“分而治之”策略将大量数据分割成片这些片可以被map处理 MapReduce计算向数据靠拢因为 移动数据需要大量网络传输开销 I MapReduce 采用Master/slave 架构及一master和若干slave。 Master上运行JobTrackerslave上运行TaskTrackerJobTracker协调计算TaskTracker负责完成JobTrack的计算 Habse Habse是对bigtable的实现 Habse是一个稀疏、多维、排序的映射表。根据行键排序 表的索引是行键、列族、列限定符、时间戳确定 Habse存储的是 字符串没有数据类型 更新操作时不会删除旧的版本总版本数达到建立表时所设立的版本数时会删除最旧的版本 habse功能组件 库函数一个Master主服务器许多region区域、分区服务器 region服务器存储和维护Master服务器分配给自己region、处理客户端请求 Master服务器管理维护Habse表分区信息、维护region队列、分配region、维持整体Habse region 一个region 1G-2G 同一个Region不会被拆分到多个Region服务器上 每个Region服务器可以有10-1000Region及 10G–1T region定位 原数组表META表存放region和region服务器的映射关系 当数据Habse表过大时META也会被分成多个region Root表记录元数据的具体位置其只有一个region zookeepre记录root表位置 HBase有三层结构 计算方式 假设.META.表的每行一个映射条目在内存中大约占用1KB并且每个Region限制为128MB那么上面的三层结构可以保存的用户数据表的Region数目的计算方法是 root最多有 128MB/1kB 2^17行 每个mate最大只有 128MB/1kB 2^17行 所有最多只能存2^17 * 2^17 HLong工作原理 采用预写式日志及先写日志在存入数据 Habse 命令 启动Habse、先启动hadoopstart-all.sh再启动habse start-habse.sh 通过habse shell打开habse 的shell界面 通过exit退出shell界面 stop-habse.sh停止habse 创建表 create student,name,sex,{NAMEcourse,VERSIONS2} 插入数据 put student,95001,name,xiaogput student,95001,name,xiaoming 列族下可以再分 put student,95001,course:math,31 删除指定数据 delete student,95001,name 删除指定一行 deleteall student,95001 查看指定一行 get studet,95001 查看指定版本数据 get student,95001,{COLUMNname,VERSIONS1} 查看整个表 scan student 停用表 disable student 删除表 drop studenteixtHive 因为使用java编程效率比较低、提供一种利用sql的语言进行查询 操作 Hive可以用自带的derby来存储元数据 启动 hadoop在启动hive start-all.shhive 数据类型 TINYINT 1个字节 SMALLINT 2个字节 INT 4个字节 BIGINT 8个字节 FLOAT 4个字节 Double 8个 ARRAY有序字段 MAP 无序字段 STRUCT一组命名的字段 与sql不同的是hive有时需要指定分隔符和数据位置 指定分隔符 row format delimited fields terminated by , 指定是数据位置 location /C/…… 分区不能在创建表中写 partitioned by(city string,state string)创建数据库 create database if not exists hive 使用数据库 use hive 创建表 create table if not exists hiveusr( name string comment username, sex string, course int)创建外部表关键字external create external if not exists usr2 name string, address structstreet:string,city:string,QQ:string,weixi:string, identyfy mapint,tinytin ff mapint,int) row format delimited filds terminated by , location /usr/....增加列 alter table hiveusr add columns(age int); 删除列 alter table hiveusr replace columns(age int);导入数据 load data local inpath usr/local/.... overwrite table hiveusr. 如果数据在本地要加上local关键字利用overwrite可以让追加效果变成覆盖插入数据 insert overwrite table hivesur values(xx,man,1)从其他表中导入 insert overwirte table hivesur select name,age,course from stu where (条件)mapint,int) row format delimited filds terminated by ‘,’ location ‘/usr/…’ 增加列 alter table hiveusr add columns(age int); 删除列 alter table hiveusr replace columns(age int); 导入数据 load data local inpath ‘usr/local/…’ overwrite table hiveusr. 如果数据在本地要加上local关键字利用overwrite可以让追加效果变成覆盖 插入数据 insert overwrite table hivesur values(‘xx’,‘man’,‘1’) 从其他表中导入 insert overwirte table hivesur select name,age,course from stu where (条件)
http://www.w-s-a.com/news/146078/

相关文章:

  • 电商网站建设企业做网站的客户多吗
  • 有做思维图的网站吗西安建设市场诚信信息平台网站
  • 网站建设求职具备什么30岁学网站开发
  • 官方网站minecraft北京低价做网站
  • 网站建设报价兴田德润机械加工网络接单
  • 免费的推广网站安卓app制作平台
  • 长春火车站附近美食建设信用卡银行积分兑换商城网站
  • 网站提交网址如何备份wordpress网页
  • 龙腾盛世网站建设医院管理系统
  • 网站切换图片做背景怎么写外贸营销邮件主题一般怎么写
  • 基于html5的网站开发wordpress主题工具
  • php网站开发的成功经历公司网站现状
  • 软件发布网站源码中国企业公示信息网
  • flash 的网站网站型销售怎么做
  • 营销型网站单页网站的域名和密码
  • 建网站保定seo自动发布外链工具
  • 做公众号关注网站做课件用这15大网站
  • 怎么制作公司自己网站店铺设计软件手机版
  • 深圳网站关键词优化公司哪家好怎么选择锦州网站建设
  • 标准网站优势项目合作网站
  • 无人机东莞网站建设wordpress站群管理破解版
  • 深圳企业官网网站建设教育培训学校
  • 医疗网站建设及优化西安网站建设开发公司
  • 网站建设详细流程ydg wordpress theme
  • 湖北黄石域名注册网站建设编程网站项目做哪个比较好
  • 旺道网站排名优化咸阳建设网站
  • 建设一个类似淘宝的网站律师做推广宣传的网站
  • 东阳网站建设方案网站建设asp
  • 模板网站建设一条龙平面设计师招聘信息
  • 制作一个网站流程企业建设网站的母的