当前位置: 首页 > news >正文

个人网站备案 网站服务内容网站管理后台密码忘记了

个人网站备案 网站服务内容,网站管理后台密码忘记了,高端设计网站,网络服务器是指为网络提供资源文章目录 前言一、关于数据仓库需求场景分类二、数据仓库线下部署场景2.1、线下部署场景介绍及优劣势说明2.2、线下部署场景对应的客户需求 三、数据仓库公有云部署场景3.1、公有云部署场景介绍及优劣势说明3.2、公有云部署场景对应的客户需求 四、为何重视数据共享#xff08… 文章目录 前言一、关于数据仓库需求场景分类二、数据仓库线下部署场景2.1、线下部署场景介绍及优劣势说明2.2、线下部署场景对应的客户需求 三、数据仓库公有云部署场景3.1、公有云部署场景介绍及优劣势说明3.2、公有云部署场景对应的客户需求 四、为何重视数据共享含湖仓一体4.1、传统数据共享业务场景4.2、数据共享含湖仓一体能力解决掉的问题 五、数据仓库技术架构演进5.1、Shared Storage 架构5.2、Shared Nothing 架构5.3、存算分离架构 六、GaussDBDWS演进历程七、DWS 云原生架构技术解析7.1、极致弹性、数据共享、高灵活度、高性价比7.2、按需弹性实践适应灵活多变的业务需求7.3、湖仓一体与大数据互联互通7.4、数据生产线与 AI 生产线的高效配合7.5、灵活可配的性能优化选择7.6、提供按需权衡、灵活可配的缓存7.7、深度优化存算分离架构 总结 前言 云计算时代数仓能为我们带来哪些便利GaussDBDWS即将发布的云原生数仓如何构筑新一代数据仓库的技术底座在云原生数仓的地基之上数据时代的产业又将如何扩张、拓展在本文中我们将带您解密华为云新一代云数仓 GaussDBDWS 3.0 的核心技术与划时代意义。 一、关于数据仓库需求场景分类 数据仓库是一个用于存储大量结构化和非结构化数据的集中式数据存储区域。它旨在帮助组织更好地理解其数据并支持决策制定过程。数据仓库通常由多个数据源提供数据并使用 ETL提取转换加载过程将这些数据集成到一个单独的位置中。数据仓库通常用于支持商业分析、数据挖掘、业务智能和决策制定。 数据仓库的重要性在于它提供了一种将数据从各种来源集成到单个位置的方法。这使得对整个组织的数据进行分析和报告变得更加容易。数据仓库还可以帮助组织更好地了解其数据模型从而更好地规划未来的IT项目。使用数据仓库可以提高组织的数据质量、数据集成能力和数据分析能力从而提高组织的效率和决策质量。 我们将数据仓库需求场景分为两类分别是线下部署场景和公有云场景。 二、数据仓库线下部署场景 2.1、线下部署场景介绍及优劣势说明 数据仓库的线下部署场景是指将数据仓库部署在本地服务器或数据中心的情况。适用于需要访问敏感数据或需要高度定制化的企业系统。 优势线下部署可以提供更高的安全性和数据隐私保护因为数据不需要通过互联网传输而是在公司的内部网络中处理。劣势通常需要专业的 IT 团队来管理和维护服务器、网络和软件以确保数据仓库正常运行并满足业务需求。 2.2、线下部署场景对应的客户需求 线下部署场景客户需求主要集中在以下几点 稳定、隔离。如在金融行业中第一要求就是系统是稳定的并且负载之间具有比较好的隔离能力系统之间的影响是比较小的。数据共享含湖仓一体。弹性。 三、数据仓库公有云部署场景 3.1、公有云部署场景介绍及优劣势说明 数据仓库需求场景的公有云场景是指将数据仓库部署在公有云中的场景。其中公有云指的是由第三方服务商提供的云计算基础设施例如亚马逊云服务AWS、微软云服务Azure、谷歌云平台GCP等。 公有云部署场景具备的优势集中在以下几点 弹性伸缩公有云提供强大的弹性伸缩能力可以根据实际需求灵活扩充或缩减计算和存储资源而无需担心硬件设备和系统软件的更新维护问题。高可用性公有云提供多区域部署可以做到容灾和数据备份保证数据的高可用性。管理简单公有云提供了全套的云端管理服务包括监控、日志、备份、自动化部署等。这些服务可以降低数据仓库运维的复杂性提高数据仓库运行效率和稳定性。降低成本公有云采用按需计费的模式能够根据实际使用情况灵活调整资源降低了企业的成本。 公有云部署场景面临的劣势集中在以下几点 安全性问题部分企业存在数据安全和隐私保护的顾虑担心采用公有云会导致数据被泄露和攻击等问题。因此需要严格的数据安全策略和监测手段。可控性问题公有云中数据仓库的运行状态和系统配置等由云服务商托管企业并不能完全掌控因此需要与云服务商进行密切合作。稳定性问题公有云的稳定性和服务质量会受到云服务商的影响如果云服务商的服务出现问题可能会导致数据仓库的运行受到影响。依赖互联网公有云场景需要依赖互联网如果网络不稳定或有意外中断可能会影响数据仓库的使用和管理。 3.2、公有云部署场景对应的客户需求 公有云部署场景客户需求主要集中在以下几点 成本。客户希望成本能够随着业务曲线变化也能动态变化负载低的时候成本能够降下来负载高的时候成本可以做相应的提升成本能够跟业务量有正比的关系而不是固定成本具体如下图所示 灵活、实时弹性。对弹性的要求更加实时收到系统告警之后能够马上对服务的吞吐或并发做弹性扩容。数据共享含湖仓一体。很多客户在建设数据处理技术站的时候会和大数据一起建设大数据作为数据旅程的一部分在不同的处理环节使用的是不同组件既有湖仓一体的诉求也有本身数仓的数据共享诉求。 四、为何重视数据共享含湖仓一体 4.1、传统数据共享业务场景 业务场景客户搭建一套系统上面跑一个业务 1里面有一些数据。现在客户需要新上一个业务 2传统做法就是把这个新作业加到这个原来系统 A 上但是原来这个系统可能撑不住原因可能是并发数、吞吐或者其他原因。这个时候我们需要对系统做扩容但是仅扩容单个集群节点到一个规模的时候线性比的提升并不明显尤其是并发很高的时候单纯的增加节点并不能够很好的解决问题。 传统措施这个时候我们需要搭建一个系统用一个新系统服务新业务新业务可能要访问业务 1 数据就会把业务 1 的数据复制一份放到这个数据 2类似于读写分离但是这样的话会造成以下问题 系统扩展性弱通过数据 copy 实现数据共享。系统间存在大量的数据冗余甚至不一致。系统间存在大量的数据传递。 4.2、数据共享含湖仓一体能力解决掉的问题 为了规避掉上述问题我们采用数据共享含湖仓一体能力其具备的优势有以下几点 一份数据支持不同业务访问数据零 copy。快速、敏捷支持新业务上线。业务之间具备良好的隔离能力性能稳定。 不同的场景对需求的优先级是不一样的我们数仓要考虑在面对这两类不同的场景的时候怎么用一套数仓的价格去解决这个问题这是在需求场景上我们看到的一些变化。 五、数据仓库技术架构演进 5.1、Shared Storage 架构 早期的数仓就挂了一个共享存储我们称其为 Shared Storage。 特点共享存储和状态计算节点像访问单机一样访问最新的全局数据。 优点无需数据分片无需分布式 plan 执行对业务透明。 缺点 计算节点需要引入协调机制cache 同步保证数据的一致性扩展性有上限。单个 SQL 无法利用所有计算节点的扩展能力 5.2、Shared Nothing 架构 后面又出了这种 Shared Nothing 架构像 GaussDB 十几年前刚开始做的时候也是这么一个架构。 特点一种分布式计算架构CPU、内存、磁盘等资源都是私有的整个系统中不存在共享资源每个节点只处理自己分片的数据没有单点的竞争。 优点扩展性好。 缺点 计算存储耦合需要同时扩容不够灵活。扩容需要较长的数据重分布时间。 5.3、存算分离架构 特点存储类似 Shared Storage计算类似 Shared Nothing每个节点只处理自己分片的数据。 优点 计算存储分层扩展计算节点扩容无需数据重分布速度快灵活存储节点按需扩容无限容量。计算节点之间无需协调机制只需保证计算节点只处理自己分片的数据。 六、GaussDBDWS演进历程 我们先回顾一下 DWS 演进历程具体如下图所示 GaussDBDWS在十年前就开始在做了当时是针对于线下的这种场景采用的就是 Shared Nothing 架构在14年之前主要是做数仓里面比较通用的技术包括分布式的执行、现代化引擎、列存储机制后面开始在大行里面做连创就遇到了更多的产品化的需求包括这种大集群的通信、负载管理以及怎么跟用户这种大数据的生态做互通等等再到后面随着市场的推广越来越多就有更多产品化诉求和企业级特性诉求。在 2020 年的时候开始做 DWS内部叫 3.0 版本主要就是一个云原生数仓也是我们本文将要给大家分享的内容。 七、DWS 云原生架构技术解析 7.1、极致弹性、数据共享、高灵活度、高性价比 三层解耦 管理层计算层存储层独立灵活伸缩。计算资源以逻辑集群方式组织。 灵活弹性 分钟级单逻辑集群扩缩容。分钟级快速创建销毁逻辑集群。快速扩缩容无数据重分布、拷贝。 一数多用 任意逻辑集群均可承载读写负载。多逻辑集群间共享数据无需拷贝。提供跨逻辑集群建的同时和近实时两种数据共享方式。 按需配置 逻辑集群隔离不同业务。业务承载量/并发量的线性扩展。读写分离、不同负载隔离。 7.2、按需弹性实践适应灵活多变的业务需求 我们把弹性需求可以分成两大类一类就是较长周期随着公司业务的增长逐渐增加的另外一种是短周期的可能每天都在变或者是每天的同时间点的业务负载都不一样像对于这种比较稍微长周期或者稳态一点的业务可以用这种在单位 vw 内增加计算资源的方式去来承载。 7.3、湖仓一体与大数据互联互通 在湖仓一体上进一步增强体验使用大数据的生态更加简单、维护代价更低体验横向融合分析。 传统的维护当外表的数量是一张、两张的时候还比较好维护当外表有有成千上万张的时候就比较麻烦你首先要把这些外表都创建出来其次如果大数据这边把表的结构改了不管是改了字段的类型或者是新加了字段外表都需要做同步的维护维护的代价就会高而新的湖仓一体就完美解决掉了这个问题。 无缝访问数据湖 对接 Hive Metastore 元数据管理直接访问数据湖的数据表定义。支持主要数据格式ORC、Parquet、Hudi、Carbon。 融合查询 混合查询数据湖和仓内的任意数据。查询一步到位输出到仓内/数据湖无需额外数据中转拷贝。 极致查询性能 使用数仓高质量的查询计划和高效的执行引擎。使用数仓的负载管理手段精准控制。 7.4、数据生产线与 AI 生产线的高效配合 AI 有自己的一套系统即 ModelArts数据是 DWSAI 如何访问到 DWS 的数据DWS 又该如何利用 ModelArts 的模型主要就是解决这两个问题。数据共享我们可以把数据都放到 obs上去用开放的格式这样数据共享的问题就比较好解决在 AI 模型这方面我们通过在 DWS 里面写 SQL的形式去使用 ModelArts 的 AI 能力。 数据生产线→AI 生产线无缝数据通路 面向批量生产通过 OBS 共享开放格式数据。面向快速开发通过 ConnectorX 等以查询取数的方式嵌入 Python 开发生态重点是 Pandas。 AI 生产线→数据生产线 AI for Data 提供 SQL 语法在数据分析过程中提供驱动 AI 训练、应用 AI 推理的能力。将推理能力引入分析直接调用部署的推理服务端点灵活性好将模型二进制部署为 UDF性能好。 7.5、灵活可配的性能优化选择 在性能方面存算分离之后关心的就是计算存储保证性能主要的手段有冷热分区高效缓存、近数据计算和大带宽云存储三个方面我们来看下图这个效果是非常显著的。 7.6、提供按需权衡、灵活可配的缓存 系统会把 obs 上的数据缓存到本地解决很多性能的问题缓存现在支持大小可配想获得更好的性能可以多买一点本地缓存如果对这个性能没有太高诉求可以少买成本完全由自己决定。 无缝配合缓存 热数据优先缓存使用本地的算子下推能力。冷数据优先下推使用云存储的近数据计算资源池。 近数据计算 将数据下推到云存储显著降低数据读取量。 7.7、深度优化存算分离架构 计算和存储分离之后这种时延天然存在物理上是不可避免的在这种时延下如果不做任何优化性能肯定会下降所以在这里做了一个通过并发来换取带宽的手段虽然单线程作 IO延迟变高但是可以开更高的并发的来把 obs 带宽打满。 更低时延充分利用云存储的带宽优势弥补其相较传统 MPP 的高延迟劣势。更优资源调度单查询充分利用资源为并发查询提供稳定、可预测的性能保证。更灵活配置多级资源池灵活配置。 总结 传统数据仓库常常需要企业投入大量人力、物力和财力进行维护和升级等工作这不仅耗时耗力而且容易带来安全和风险问题。GaussDB (DWS) 云原生数仓利用云计算、自动化和管理工具等技术可以降低企业的成本和风险同时提升数据仓库的质量和效率。数字化转型是企业发展的必由之路而数据仓库是数字化转型的重要基础设施。GaussDB (DWS) 云原生数仓的发展将为企业提供更全面、更优质、更高效的数据处理和分析能力有助于企业更快速地实现数字化转型更好地应对市场变化和竞争挑战。 我是白鹿一个不懈奋斗的程序猿。望本文能对你有所裨益欢迎大家的一键三连若有其他问题、建议或者补充可以留言在文章下方感谢大家的支持
http://www.w-s-a.com/news/709413/

相关文章:

  • 医疗器械类网站前置审批网站临时域名
  • 金融网站策划方案网站开发表格整体页面居中
  • 句容本地网站黄石下陆区建设局网站
  • 免费网站服务陕西省咸阳市建设银行网站
  • 网站建设活动计划做网站意义
  • 莱芜新闻主持人名单seo sem 外贸建站 网站建设 文化墙设计
  • 易语言可以做网站嘛赣州网站建设开发
  • 网站建设规范布局网站建设费往什么科目
  • 乐清手机网站设计哪个汽车网站汽贸店免费做
  • 网站建设课程总结报告推广软文
  • 企业网站哪里可以做烟台seo网站推广
  • 怎样建设网站优化珠海网站建设开发
  • 泰兴住房和城乡建设厅网站福州app开发
  • 免费制作公司网站seo前线
  • 导购网站怎么推广有网站源码怎么搭建网站
  • 网站开发问题杭州制作公司网站
  • 网站推广seo是什么wordpress 去除顶部
  • 建筑学不会画画影响大吗电子商务沙盘seo关键词
  • 重庆网站建设找承越上海建设工程招投标网
  • 网站建设四个步骤下单的网站建设教程
  • 网站建设合同的验收表响应式网站建设哪家好
  • 手机网站建设视频长沙百家号seo
  • 网站未备案怎么访问网站开发前端需要学什么
  • 正黄集团博弘建设官方网站wordpress设置固定链接和伪静态
  • wordpress 建网站视频如何实现网站生成网页
  • 杭州品牌网站建设推广个人的网站建设目标
  • 济南有哪些网站是做家具团购的贸易公司自建免费网站
  • wap网站psd成立公司在什么网站
  • 网站建设婚恋交友聊城网站建设费用
  • 沈阳网站建设联系方式尉氏县金星网架公司