当前位置: 首页 > news >正文

合肥网站建设设计公司哪家好庆阳网站设计价格

合肥网站建设设计公司哪家好,庆阳网站设计价格,有固定ip自己做网站,正规的国内网站建设公司​​​​#x1f34b;#x1f34b;大数据学习#x1f34b;#x1f34b; #x1f525;系列专栏#xff1a; #x1f451;哲学语录: 用力所能及#xff0c;改变世界。 #x1f496;如果觉得博主的文章还不错的话#xff0c;请点赞#x1f44d;收藏⭐️留言#x1f4…​​​​大数据学习 系列专栏 哲学语录: 用力所能及改变世界。 如果觉得博主的文章还不错的话请点赞收藏⭐️留言支持一下博主哦 1. HDFS 运行时角色 HDFS 是分布式存储系统其运行时角色主要围绕数据存储和管理展开 角色功能描述NameNode- 管理文件系统的命名空间元数据如目录结构、文件权限等。 - 协调客户端对文件的访问。 - 监控 DataNode 的健康状态。DataNode- 存储实际的数据块Block。 - 执行数据块的读写操作。 - 定期向 NameNode 汇报心跳和块状态。Secondary NameNode- 辅助 NameNode定期合并 NameNode 的编辑日志EditLog和镜像文件FsImage防止日志过大。 类比NameNode 类似于图书馆的目录系统记录所有书籍的位置DataNode 类似于书架存放实际的书籍。 2. Hive 运行时角色 Hive 是数据仓库工具其运行时角色主要围绕 SQL 查询的执行展开 角色功能描述HiveServer2- 提供 JDBC/ODBC 接口允许客户端如 Beeline、JDBC 程序提交 SQL 查询。Driver- 解析 SQL 查询生成执行计划如 MapReduce、Spark 或 Tez 任务。Compiler- 将 SQL 查询转换为逻辑执行计划再优化为物理执行计划。Metastore- 存储元数据如表结构、分区信息、列信息等通常使用关系型数据库如 MySQL存储。Executor- 执行编译后的物理计划调用底层计算引擎如 MapReduce、Spark处理数据。 类比Hive 类似于一个翻译官将 SQL 查询翻译为底层计算引擎能理解的任务。 3. Spark 运行时角色 Spark 是通用分布式计算引擎其运行时角色主要围绕分布式计算展开 角色功能描述Driver Program- 用户编写的 Spark 应用程序的主程序负责提交任务和协调执行。Cluster Manager- 管理集群资源如 YARN、Mesos、Kubernetes 或 Spark 自带的 Standalone 模式。Executor- 在 Worker 节点上运行执行具体的任务Task并缓存数据到内存或磁盘。Worker Node- 运行 Executor 的节点负责实际的数据处理。Task- Executor 中执行的最小单元处理一个数据分区。 类比Driver Program 类似于项目经理分配任务Executor 类似于工人执行具体的任务。 4. MapReduce 运行时角色 MapReduce 是分布式计算框架其运行时角色主要围绕 Map 和 Reduce 阶段展开 角色功能描述JobTracker- 管理 MapReduce 作业的生命周期分配任务给 TaskTracker。TaskTracker- 运行在节点上执行具体的 Map 或 Reduce 任务并向 JobTracker 汇报状态。Map Task- 处理输入数据的分片生成键值对Key-Value Pairs。Reduce Task- 对 Map Task 的输出进行聚合生成最终结果。Shuffle/Sort Phase- 在 Map 和 Reduce 之间进行数据传输和排序。 类比JobTracker 类似于工厂经理分配任务TaskTracker 类似于工人执行具体的任务。 5. Flink 运行时角色 Flink 是流处理和批处理统一框架其运行时角色主要围绕实时数据处理展开 角色功能描述JobManager- 管理作业的生命周期协调 TaskManager 的资源分配和任务调度。TaskManager- 运行具体的任务Task处理数据流。Task- 执行用户定义的操作如 Map、Filter、Aggregate 等。Source- 从外部数据源如 Kafka、文件系统读取数据流。Sink- 将处理结果写入外部存储系统如 HDFS、数据库。Checkpoint Coordinator- 管理检查点Checkpoint确保流处理的容错性。 类比JobManager 类似于交通指挥中心协调任务TaskManager 类似于车辆执行具体的运输任务。 总结对比 组件核心运行时角色HDFSNameNode元数据管理、DataNode数据存储HiveHiveServer2接口、Driver查询解析、Executor任务执行SparkDriver Program任务提交、Executor任务执行、Cluster Manager资源管理MapReduceJobTracker作业管理、TaskTracker任务执行、Map/Reduce Task数据处理FlinkJobManager作业管理、TaskManager任务执行、Source/Sink数据流处理 注意 HDFS 中的 NameNode 元数据管理和 Hive 中的 Metastore 元数据在功能上虽然都涉及“元数据”但两者的管理对象、作用范围、存储内容和使用场景存在显著差异。以下是两者的详细对比 1. 元数据内容对比 特性HDFS NameNode 元数据Hive Metastore 元数据管理对象文件系统的元数据如文件路径、权限、块信息等。数据库表的元数据如表结构、分区信息、列信息、存储格式等。存储内容文件名、目录结构、文件权限、副本数、数据块位置等。表名、列名、数据类型、分区键、存储格式如 ORC、Parquet、表注释等。作用范围仅管理 HDFS 上的文件和目录。管理 Hive 表与底层存储如 HDFS之间的映射关系。依赖关系NameNode 是 HDFS 的核心组件没有它 HDFS 无法工作。Metastore 是 Hive 的组件Hive 可以独立运行如使用本地模式但通常依赖 Metastore。 类比 NameNode 的元数据类似于图书馆的目录系统记录书籍的位置和分类。Hive Metastore 的元数据类似于书籍的详细描述如作者、出版社、ISBN 等帮助用户理解数据内容。 2. 存储实现对比 特性HDFS NameNode 元数据Hive Metastore 元数据存储方式内存中维护定期持久化到磁盘FsImage 和 EditLog。通常存储在关系型数据库中如 MySQL、PostgreSQLHive 本身不直接存储元数据。高可用性NameNode 支持高可用HA配置通过 Active/Standby NameNode 实现。Metastore 可以通过数据库的高可用机制如主从复制实现高可用。扩展性NameNode 的元数据存储在内存中受限于单节点内存大小可通过 Federation 扩展。Metastore 的元数据存储在外部数据库中扩展性取决于数据库的能力。 类比 NameNode 的元数据存储类似于图书馆的中央目录系统需要快速访问。Hive Metastore 的元数据存储类似于图书馆的在线数据库可以支持复杂的查询和管理。 3. 使用场景对比 场景HDFS NameNode 元数据Hive Metastore 元数据文件操作创建、删除、重命名文件或目录设置权限等。创建、删除、修改 Hive 表查询表结构等。数据查询通过 HDFS API 访问文件内容但无法直接通过元数据查询文件内容。通过 HiveQL 查询表数据Hive 会根据 Metastore 的元数据定位底层存储并执行查询。数据治理提供文件级别的元数据适合文件管理。提供表级别的元数据适合数据仓库管理和数据分析。
http://www.w-s-a.com/news/109962/

相关文章:

  • html网站设计实例代码重庆多个区划定风险区
  • 推广方案设计同一个网站可以同时做竞价和优化
  • 论坛网站开发 go电商扶贫网站建设
  • 个人建站教程优秀的定制网站建设
  • 农村建设集团有限公司网站下载百度极速版
  • 微信公众号个人可以做网站么做企业网站需要哪些
  • 如何用付费音乐做视频网站wordpress如何设置首页
  • 杨凯做网站网站首页 排版
  • 网站图片标签江苏省建设类高工申报网站
  • 网站建设中的英文什么网站可以做医疗设备的
  • 柳州购物网站开发设计服装网站的建设与管理
  • 做网站的上海市哪家技术好北京百姓网免费发布信息
  • 网站文章排版制作网站软件
  • 云南网站开发公司网站商城定制网站建设
  • 企业网站的新闻资讯版块有哪些肇庆自助建站模板
  • 怎么做平台网站吗为网站做seo需要什么
  • 苏州吴江建设局招标网站海南网站搭建价格
  • 网站建设主要研究内容用哪个程序做网站收录好
  • 网站建设如何开单装修设计图免费
  • 做内容网站赚钱吗seo推广具体做什么
  • 连山区网站建设seo简历
  • 自助建站系统官方版太仓高端网站制作
  • 怎样只做自己的网站建设银行唐山分行网站
  • 咸阳鑫承网站建设软件开发公司网站模板
  • 百度怎么免费做网站网站建设大作业有代码
  • 小说素材网站设计素材网站特点
  • 如何建设一个好的网站WordPress主题设置数据库
  • 网站被模仿十堰网站制作公司
  • 怎么样做免费网站个人网站备案幕布
  • 做ppt的动图下载哪些网站制作一个网站需要多少时间