当前位置: 首页 > news >正文

北京网站建设出名 乐云践新服务器搭建网站

北京网站建设出名 乐云践新,服务器搭建网站,品牌设计师工资一般多少,网站设计公司排行数据仓库是一个面向主题的、集成的、非易失的、随时间变化的#xff0c;用来支持管理人员决策的数据集合#xff0c;数据仓库中包含了粒度化的企业数据。 数据仓库的主要特征是#xff1a;主题性、集成性、非易失性、时变性。 数据仓库的体系结构通常包含4个层次#xff…数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理人员决策的数据集合数据仓库中包含了粒度化的企业数据。 数据仓库的主要特征是主题性、集成性、非易失性、时变性。 数据仓库的体系结构通常包含4个层次数据源、数据存储和管理、数据服务以及数据应用。 数据源数据仓库的数据来源包括外部数据、现有业务系统和文档资料等。数据存储和管理为数据提供的存储和管理包括数据仓库、数据集市、数据仓库监视、运行与维护工具和元数据管理等。数据服务为前端工具和应用提供数据服务包括直接从数据仓库中获取数据提供给前端使用或者通过OLAP服务器为前端应用提供更为复杂的数据服务。数据应用直接面向最终用户包括数据工具、自由报表工具、数据分析工具、数据挖掘工具和各类应用系统。 1.概述 Hive是建立在Hadoop之上的一种数仓工具。该工具的功能是将结构化、半结构化的数据文件映射为一张数据库表基于数据库表提供了一种类似SQL的查询模型HQL用于访问和分析存储在Hadoop文件中的大型数据集。   Hive本身并不具备存储功能其核心是将HQL转换为MapReduce程序然后将程序提交到Hadoop集群中执行。 2.数据模型 ①库   MySQL中默认数据库是default用户可以创建不同的database在database下也可以创建不同的表。Hive也可以分为不同的数据仓库和传统数据库保持一致。在传统数仓中创建database。默认的数据库也是default。Hive中的库相当于关系数据库中的命名空间它的作用是将用户和数据库的表进行隔离。 ②表   Hive中的表所对应的数据是存储在HDFS中而表相关的元数据是存储在关系数据库中。Hive中的表分为内部表和外部表两种类型两者的区别在于数据的访问和删除 内部表的加载数据和创建表的过程是分开的在加载数据时实际数据会被移动到数仓目录中之后对数据的访问是在数仓目录实现。而外部表加载数据和创建表是同一个过程对数据的访问是读取HDFS中的数据 内部表删除时因为数据移动到了数仓目录中因此删除表时表中数据和元数据会被同时删除。外部表因为数据还在HDFS中删除表时并不影响数据。 创建表时不做任何指定默认创建的就是内部表。想要创建外部表则需要使用External进行修饰 ③分区   分区是一个优化的手段目的是减少全表扫描提高查询效率。在Hive中存储的方式就是表的主目录文件夹下的子文件夹子文件夹的名字表示所定义的分区列名字。 ④分桶   分桶和分区的区别在于分桶是针对数据文件本身进行拆分根据表中字段例如编号ID的值经过hash计算规则将数据文件划分成指定的若干个小文件。分桶后HDFS中的数据文件会变为多个小文件。分桶的优点是优化join查询和方便抽样查询。 3.HQL的执行 Hive在执行一条HQL语句时会经过以下步骤 语法解析Antlr定义SQL的语法规则完成SQL词法语法解析将SQL转化为抽象语法树AST Tree语义解析遍历AST Tree抽象出查询的基本组成单元QueryBlock生成逻辑执行计划遍历QueryBlock翻译为执行操作树OperatorTree优化逻辑执行计划逻辑层优化器进行OperatorTree变换合并不必要的ReduceSinkOperator减少shuffle数据量生成物理执行计划遍历OperatorTree翻译为MapReduce任务优化物理执行计划物理层优化器进行MapReduce任务的变换生成最终的执行计划。 参考 https://datawhalechina.github.io/juicy-bigdata/#/ch07-Hive?id_702-%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e6%a6%82%e5%bf%b5
http://www.w-s-a.com/news/42879/

相关文章:

  • 广东深圳最新情况临安网站seo
  • 华为快速建站女人做春梦网站
  • 建外贸网站费用手机排行榜zol
  • 长治网站制作的网站做网站要什么知识条件
  • discuz 做门户网站wordpress怎么添加图片不显示图片
  • 东营网站建设方案范文百度应用搜索
  • 网站 常见推广js代码放wordpress哪里
  • 靖江网站开发徐州住房和城乡建设局网站
  • 南宁网站建设公司如何为老板打造网站赚钱的wordpress optimizer
  • 做微商好还是开网站好网站网络推广
  • 网站建设岗位所需技能泊头网站优化
  • 企业网站建设是什么网络营销岗位介绍
  • 网站做cdn怎么弄昆明网站seo报价
  • 拖拽网站如何建立微网站
  • 网站网站做代理微信群卖房卡南宁建站模板大全
  • 网络公司怎么优化网站百度快速排名技术培训教程
  • 建e室内设计网 周婷站长工具seo综合查询源码
  • 塔式服务器主机建网站定制美瞳网站建设
  • 网站是先解析后备案吗永久免费网站模板
  • wordpress站点演示php根据ip 跳转网站
  • 东莞市凤岗建设局网站网站开发有哪些职位
  • 企业网站手机版模板免费下载辣条网站建设书
  • 南昌网站建设维护vc 做网站源码
  • 网站动态logo怎么做织梦移动端网站怎么做
  • 三亚城乡建设局网站app下载安装官方网站
  • 公司被其它人拿来做网站郑州哪家做网站最好
  • 山东省建设厅官方网站抖音代运营业务介绍
  • 网站制作 牛商网wordpress商城 微信支付
  • 平面设计培训网站建文帝网站建设
  • python网站建设佛山乐从网站建设