当前位置: 首页 > news >正文

南昌网站排名优化报网站中留言板怎么做

南昌网站排名优化报,网站中留言板怎么做,巩义网站建设指标点,百度推广怎么运营文章目录 ODS层及DWD层构建01#xff1a;课程回顾02#xff1a;课程目标03#xff1a;数仓分层回顾04#xff1a;Hive建表语法05#xff1a;Avro建表语法 ODS层及DWD层构建 01#xff1a;课程回顾 一站制造项目的数仓设计为几层以及每一层的功能是什么#xff1f; ODS课程回顾02课程目标03数仓分层回顾04Hive建表语法05Avro建表语法 ODS层及DWD层构建 01课程回顾 一站制造项目的数仓设计为几层以及每一层的功能是什么 ODS原始数据层存放从Oracle中同步采集的所有原始数据DW数据仓库层 DWD明细数据层存储ODS层进行ETL以后的数据DWB轻度汇总层对DWD层的数据进行轻度聚合关联和聚合 基于每个主题构建主题事务事实表 DWS维度数据层对DWD层的数据进行维度抽取 基于每个主题的维度需求抽取所有维度表 ST数据应用层 基于DWB和DWS的结果进行维度的聚合 DM数据集市层 用于归档存储公司所有部门需要的shuju 一站制造项目的数据来源是什么核心的数据表有哪些 数据来源业务系统ERP公司资产管理系统、财务数据 工程师信息、零部件仓储信息 CISS客户服务管理系统 工单信息、站点信息、客户信息 呼叫中心系统 来电受理信息、回访信息 一站制造项目中在数据采集时遇到了什么问题以及如何解决这个问题 技术选型Sqoop问题发现采集以后生成在HDFS上文件的行数与实际Oracle表中的数据行数不一样多了原因Sqoop默认将数据写入HDFS以普通文本格式存储一旦遇到数据中如果包含了特殊字符\n将一行的数据解析为多行解决 方案一Sqoop删除特殊字段、替换特殊字符【一般不用】方案二更换其他数据文件存储类型AVRO 数据存储Hive数据计算SparkSQL 什么是Avro格式有什么特点 二进制文本读写性能更快独立的Schema生成文件每一行所有列的信息 对列的扩展非常友好 Spark与Hive都支持的类型 如何实现对多张表自动采集到HDFS 需求 读取表名执行Sqoop命令 效果将所有增量和全量表的数据采集到HDFS上 全量表路径维度表数据量、很少发生变化 /data/dw/ods/one_make/ full_imp /表名/分区/数据增量表路径事实表数据量不断新增整体相对较大 /data/dw/ods/one_make/ incr_imp /表名/分区/数据Schema文件的存储目录 /data/dw/ods/one_make/avscShell业务简单Linux命令支持 Python业务复杂是否Python开发接口 调用了LinuxShell来运行 Python面向对象的基本应用 语法 定义类 class 类名:# 属性变量# 方法函数定义变量 key value定义方法 def funName(参数):方法逻辑return面向对象将所有事物以对象的形式进行编程万物皆对象 对象是类的实例 对象类专门用于构造对象的一般称为Bean代表某一种实体Entity 类的组成 class 类名:# 属性变量# 方法函数业务实现人购买商品 人 class Person:# 属性id 1name zhangsanage 18gender 1……# 方法def eat(self,something):print(f{self.name} eating {something})def buy(self,something)print(f{self.name} buy {something})每个人都是一个Person类的对象 商品 class Product:# 属性id 001price 1000.00size middlecolor blue……# 方法def changePrice(self,newPrice):self.price newPirce工具类专门用于封装一些工具方法的utils代表某种操作的集合 类的组成一般只有方法 class 类名:# 方法函数字符串处理工具类拼接、裁剪、反转、长度、转大写、转小写、替换、查找 class StringUtils:def concat(split,args*):split.join(args)def reverse(sourceString)return reverse(sourceString)……日期处理工具类计算、转换 class TimeUitls:def computeTime(time1,time2):return time1-time2def transTimestamp(timestamp):return newDateyyyy-MM-dd HH:mm:ss)def tranfData(date)return timestamp常量类专门用于定义一些不会发生改变的变量的类 类的组成一般只有属性 class 类名:# 属性不发生变化的属性定义一个常量类 class Common:ODS_DB_NAME one_make_ods……file1.py创建数据库 create database if not exists Common.ODS_DB_NAME;file2.py创建表 create table if not exists Common.ODS_DB_NAME.tbnamefile3.py插入数据到表中 insert into table Common.ODS_DB_NAME.tbname问题1容易写错 问题2不好修改 02课程目标 目标自动化的ODS层与DWD层构建实现 掌握Hive以及Spark中建表的语法规则实现项目开发环境的构建自己要实现所有代码注释ODS层与DWD层整体运行测试成功 03数仓分层回顾 目标回顾一站制造项目分层设计 实施 ODS层 原始数据层 来自于Oracle中数据的采集 数据存储格式AVRO ODS区分全量和增量 实现 数据已经采集完成 /data/dw/ods/one_make/full_imp /data/dw/ods/one_make/incr_impstep1创建ODS层数据库one_make_ods step2根据表在HDFS上的数据目录来创建分区表 step3申明分区 DWD层 来自于ODS层数据数据存储格式ORC不区分全量和增量的实现 step1创建DWD层数据库one_make_dwdstep2创建DWD层的每一张表step3从ODS层抽取每一张表的数据写入DWD层对应的表中 小结 回顾一站制造项目分层设计 04Hive建表语法 目标掌握Hive建表语法 实施 CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name (col1Name col1Type [COMMENT col_comment],co21Name col2Type [COMMENT col_comment],co31Name col3Type [COMMENT col_comment],co41Name col4Type [COMMENT col_comment],co51Name col5Type [COMMENT col_comment],……coN1Name colNType [COMMENT col_comment]) [PARTITIONED BY (col_name data_type ...)] [CLUSTERED BY (col_name...) [SORTED BY (col_name ...)] INTO N BUCKETS] [ROW FORMAT row_format]row format delimited fields terminated by lines terminated by [STORED AS file_format] [LOCATION hdfs_path] TBLPROPERTIESEXTERNAL外部表类型删除表的时候不会删除hdfs中数据 内部表、外部表、临时表 PARTITIONED BY分区表结构 普通表、分区表、分桶表 CLUSTERED BY分桶表结构ROW FORMAT指定分隔符 列的分隔符\001行的分隔符\n STORED AS指定文件存储类型 ODSavroDWDorc LOCATION指定表对应的HDFS上的地址 默认/user/hive/warehouse/dbdir/tbdir TBLPROPERTIES指定一些表的额外的一些特殊配置属性 小结 掌握Hive建表语法 05Avro建表语法 目标掌握Hive中Avro建表方式及语法 路径 step1指定文件类型step2指定Schemastep3建表方式 实施 Hive官网https://cwiki.apache.org/confluence/display/Hive/LanguageManualDDL#LanguageManualDDL-CreateTable DataBrics官网https://docs.databricks.com/spark/2.x/spark-sql/language-manual/create-table.html Avro用法https://cwiki.apache.org/confluence/display/Hive/AvroSerDe 指定文件类型 方式一指定类型 stored as avro方式二指定解析类 --解析表的文件的时候用哪个类来解析 ROW FORMAT SERDEorg.apache.hadoop.hive.serde2.avro.AvroSerDe --读取这张表的数据用哪个类来读取 STORED AS INPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat --写入这张表的数据用哪个类来写入 OUTPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat指定Schema 方式一手动定义Schema CREATE TABLE embedded COMMENT 这是表的注释 ROW FORMAT SERDEorg.apache.hadoop.hive.serde2.avro.AvroSerDe STORED AS INPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat OUTPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat TBLPROPERTIES (avro.schema.literal{namespace: com.howdy,name: some_schema,type: record,fields: [ { name:string1,type:string}]} ); 方式二加载Schema文件 CREATE TABLE embedded COMMENT 这是表的注释 ROW FORMAT SERDEorg.apache.hadoop.hive.serde2.avro.AvroSerDe STORED as INPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat OUTPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat TBLPROPERTIES (avro.schema.urlfile:///path/to/the/schema/embedded.avsc );建表语法 方式一指定类型和加载Schema文件 create external table one_make_ods_test.ciss_base_areas comment 行政地理区域表 PARTITIONED BY (dt string) stored as avro location /data/dw/ods/one_make/full_imp/ciss4.ciss_base_areas TBLPROPERTIES (avro.schema.url/data/dw/ods/one_make/avsc/CISS4_CISS_BASE_AREAS.avsc);方式二指定解析类和加载Schema文件 create external table one_make_ods_test.ciss_base_areas comment 行政地理区域表 PARTITIONED BY (dt string) ROW FORMAT SERDEorg.apache.hadoop.hive.serde2.avro.AvroSerDe STORED AS INPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat OUTPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat location /data/dw/ods/one_make/full_imp/ciss4.ciss_base_areas TBLPROPERTIES (avro.schema.url/data/dw/ods/one_make/avsc/CISS4_CISS_BASE_AREAS.avsc);create external table 数据库名称.表名 comment 表的注释 partitioned by ROW FORMAT SERDEorg.apache.hadoop.hive.serde2.avro.AvroSerDe STORED AS INPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat OUTPUTFORMATorg.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat location 这张表在HDFS上的路径 TBLPROPERTIES 这张表的Schema文件在HDFS上的路径​ 小结 掌握Hive中Avro建表方式及语法
http://www.w-s-a.com/news/328369/

相关文章:

  • 共享虚拟主机普惠版做网站产品推广包括哪些内容
  • 广州市网站建站免费咨询医生有问必答
  • app网站建设制作哪个网站可以做魔方图片
  • 教育培训网站建设方案模板下载网站文风
  • 电龙网站建设wordpress文章两端对齐
  • 做外单网站亚马逊免费的网站加速器
  • 英文网站推广工作一个虚拟主机可以做几个网站吗
  • 微网站 合同重庆电力建设设计公司网站
  • 网站怎么设置支付网站源码下载后怎么布置
  • 广州市公需课在哪个网站可以做手机商城软件下载
  • app网站建设需要什么长治网站建设公司
  • 网站模板平台广告宣传网站
  • cc域名的网站做网站放太多视频
  • 让公司做网站要注意什么建设工程公司企业文化
  • 佛山搭建建网站哪家好微信如何建立自己的公众号
  • 联想公司网站建设现状广州建网站兴田德润团队
  • 网站开发的技术有网页设计实训报告工作内容和步骤
  • 视频做网站长沙网站制作平台
  • js网站建设北京seo公司优化网络可见性
  • 付款网站源码建网站卖东西
  • 用php做的录入成绩的网站wordpress等级插件
  • 网站运营优化方案广西桂林公司
  • 快递网站策划怎么做ppt长春建设信息网站
  • 做服装搭配图的网站有哪些经营一个网站要怎么做
  • 呼市品牌网站建设那家好增城住房和建设局网站
  • 网站首页布局设计代码太仓网站开发建设服务
  • 学校网站建设与管理porto wordpress模板
  • 余姚做网站公司网站建设有哪些基本流程
  • 门户网站建设的报价百度医生在线问诊
  • 北京公司注册在哪个网站浏览器打开网址404