当前位置: 首页 > news >正文

网站流量统计怎么做自己动手制作网站

网站流量统计怎么做,自己动手制作网站,seo教程大秦英扬,网站开发需求列表TopN 定义#xff08;⽀持 Batch\Streaming#xff09;#xff1a; TopN 对应离线数仓的 row_number()#xff0c;使⽤ row_number() 对某⼀个分组的数据进⾏排序。 应⽤场景#xff1a; 根据 某个排序 条件#xff0c;计算 某个分组 下的排⾏榜数据。 SQL 语法标准⽀持 Batch\Streaming TopN 对应离线数仓的 row_number()使⽤ row_number() 对某⼀个分组的数据进⾏排序。 应⽤场景 根据 某个排序 条件计算 某个分组 下的排⾏榜数据。 SQL 语法标准 SELECT [column_list] FROM (SELECT [column_list],ROW_NUMBER() OVER ([PARTITION BY col1[, col2...]]ORDER BY col1 [asc|desc][, col2 [asc|desc]...]) AS rownumFROM table_name) WHERE rownum N [AND conditions];ROW_NUMBER() 标识 TopN 排序⼦句PARTITION BY col1[, col2…] 标识分区字段代表按照这个 col 字段作为分区粒度对数据排序取 topN下述案例中的 partition by key 根据需求中的搜索关键词key做为分区ORDER BY col1 [asc|desc][, col2 [asc|desc]…] 标识 TopN 的排序规则是按照哪些字段、顺序或逆序进⾏排序WHERE rownum N 这个⼦句是必须的加上这个⼦句Flink 才能将其识别为 TopN 查询其中 N 代表 TopN 的条⽬数[AND conditions] 其他的限制条件也可以加上。 实际案例 取某个搜索关键词下的搜索热度前 10 名的词条数据。 输⼊数据为搜索词条数据的搜索热度数据当搜索热度发⽣变化时会将变化后的数据写⼊到数据源的 Kafka 中 数据源 schema-- 字段名 备注 -- key 搜索关键词 -- name 搜索热度名称 -- search_cnt 热搜消费热度⽐如 3000 -- timestamp 消费词条时间戳 CREATE TABLE source_table (name STRING NOT NULL,search_cnt BIGINT NOT NULL,key STRING NOT NULL,row_time timestamp(3),WATERMARK FOR row_time AS row_time ) WITH (connector filesystem, path file:///Users/hhx/Desktop/source_table.csv,format csv );A,100,a,2021-11-01 00:01:03 A,200,a,2021-11-02 00:01:03 A,300,a,2021-11-03 00:01:03 B,200,b,2021-11-01 00:01:03 B,300,b,2021-11-02 00:01:03 B,400,b,2021-11-03 00:01:03 C,300,c,2021-11-01 00:01:03 C,400,c,2021-11-02 00:01:03 C,500,c,2021-11-03 00:01:03 D,400,d,2021-11-01 00:01:03 D,500,d,2021-11-02 00:01:03 D,600,d,2021-11-03 00:01:03-- 数据汇 schema -- key 搜索关键词 -- name 搜索热度名称 -- search_cnt 热搜消费热度⽐如 3000 -- timestamp 消费词条时间戳 CREATE TABLE sink_table (key BIGINT,name BIGINT,search_cnt BIGINT,timestamp TIMESTAMP(3) ) WITH (... );-- DML 逻辑 INSERT INTO sink_table SELECT key, name, search_cnt, row_time as timestamp FROM (SELECT key, name, search_cnt, row_time, -- 根据热搜关键词 key 作为 partition key然后按照 search_cnt 倒排取前 2 名ROW_NUMBER() OVER (PARTITION BY key ORDER BY search_cnt desc) AS rownumFROM source_table) WHERE rownum 2输出结果 注意 包含回撤流。 上⾯ SQL 会翻译成以下三个算⼦ 数据源 数据源即最新的词条下⾯的搜索词的搜索热度数据消费到 Kafka 中数据后按照 partition key 将数据进⾏ hash 分发到下游排序算⼦相同的 key 数据将会发送到⼀个并发中 排序算⼦ 为每个 Key 维护了⼀个 TopN 的榜单数据接受到上游的⼀条数据后如果 TopN 榜单还没有到达 N 条则将这条数据加⼊ TopN 榜单后直接下发数据如果到达 N 条之后经过 TopN 计算发现这条数据⽐原有的数据排序靠前那么新的 TopN 排名就会有变化就变化了的这部分数据之前下发的排名数据被撤回即回撤数据然后下发新的排名数据 数据汇 接收到上游的数据之后然后输出到外部存储引擎中。
http://www.w-s-a.com/news/145155/

相关文章:

  • 网站切换图片做背景怎么写外贸营销邮件主题一般怎么写
  • 基于html5的网站开发wordpress主题工具
  • php网站开发的成功经历公司网站现状
  • 软件发布网站源码中国企业公示信息网
  • flash 的网站网站型销售怎么做
  • 营销型网站单页网站的域名和密码
  • 建网站保定seo自动发布外链工具
  • 做公众号关注网站做课件用这15大网站
  • 怎么制作公司自己网站店铺设计软件手机版
  • 深圳网站关键词优化公司哪家好怎么选择锦州网站建设
  • 标准网站优势项目合作网站
  • 无人机东莞网站建设wordpress站群管理破解版
  • 深圳企业官网网站建设教育培训学校
  • 医疗网站建设及优化西安网站建设开发公司
  • 网站建设详细流程ydg wordpress theme
  • 湖北黄石域名注册网站建设编程网站项目做哪个比较好
  • 旺道网站排名优化咸阳建设网站
  • 建设一个类似淘宝的网站律师做推广宣传的网站
  • 东阳网站建设方案网站建设asp
  • 模板网站建设一条龙平面设计师招聘信息
  • 制作一个网站流程企业建设网站的母的
  • 九州建网站网页游戏平台代理
  • 培训课程网站网上下载的网站模板怎么用
  • 重庆山艺网站建设塘厦理工学校
  • 做网站的人叫什么软件玩具网站设计
  • 网站说服力营销型网站策划 pdf深圳有什么公司名称
  • 做物流的可以在那些网站找客户男生晚上正能量你懂我意思
  • 宁德市城乡住房建设厅网站教育机构logo
  • 做定制网站价格有网站了怎么做app
  • 做网站和制作网页的区别北京朝阳区最好的小区