当前位置: 首页 > news >正文

视频播放网站开发小超人成都网站建设

视频播放网站开发,小超人成都网站建设,建筑网站首页大图,小说排行榜2020前十名搜索引擎日志分析 要求#xff1a; 读取文件转换成RDD#xff0c;并完成#xff1a; 打印输出#xff1a;热门搜索时间段#xff08;小时精度#xff09;Top3打印输出#xff1a;热门搜索词Top3打印输出#xff1a;统计黑马程序员关键字在哪个时段被搜索最多将数据转…搜索引擎日志分析 要求 读取文件转换成RDD并完成 打印输出热门搜索时间段小时精度Top3打印输出热门搜索词Top3打印输出统计黑马程序员关键字在哪个时段被搜索最多将数据转换为JSON格式写出为文件 代码 综合案例 要求读取文件转换成RDD并完成打印输出热门搜索时间段小时精度Top3打印输出热门搜索词Top3打印输出统计黑马程序员关键字在哪个时段被搜索最多将数据转换为JSON格式写出为文件# 构建执行环境入口对象 import json from pyspark import SparkConf, SparkContext import osos.environ[PYSPARK_PYTHON] D:/Python/Python311/python.exe conf SparkConf().setMaster(local[*]).setAppName(test_spark) conf.set(spark.default.parallelism, 1) sc SparkContext(confconf)# 读取文件转换成RDD并完成 rdd sc.textFile(E:/百度网盘/1、Python快速入门8天零基础入门到精通/资料/第15章资料/资料/search_log.txt) # print(rdd.collect()) # TOOP 需求1热门搜索时间段小时精度Top3 # 1.1 取出全部的时间并转换为小时 # 1.2 转换为小时1的二元元组 # 1.3 Key分组聚合Value # 1.4 排序降序 # 1.5 取前三 # result1 rdd.map(lambda x: x.split(\t)).\ # map(lambda x: x[0][:2]).\ # map(lambda x: (x, 1)).\ # reduceByKey(lambda a, b: a b).\ # sortBy(lambda x: x[1], ascendingFalse, numPartitions1).\ # take(3) # print(需求1的结果, result1) result1 rdd.map(lambda x: (x.split(\t)[0][:2], 1)). \reduceByKey(lambda a, b: a b). \sortBy(lambda x: x[1], ascendingFalse, numPartitions1). \take(3) print(需求1的结果, result1)# TOOP 需求2热门搜索词Top3 # 2.1 取出全部的搜索词 # 2.2 词1二元元组 # 2.3 分组聚合 # 2.4 排序 # 2.5 Top3 result2 rdd.map(lambda x: (x.split(\t)[2], 1)). \reduceByKey(lambda a, b: a b). \sortBy(lambda x: x[1], ascendingFalse, numPartitions1). \take(3) print(需求2的结果, result2)# TOOP 需求3统计黑马程序员关键字在哪个时段被搜索最多 # 3.1 过滤内容只保留黑马程序员关键字 # 3.2 转换为小时1的二元元组 # 3.3 Key分组聚合Value # 3.4 排序降序 # 3.5 取前1 result3 rdd.map(lambda x: x.split(\t)).\filter(lambda x: x[2] 黑马程序员).\map(lambda x: (x[0][:2], 1)).\reduceByKey(lambda a, b: a b).\sortBy(lambda x: x[1], ascendingFalse, numPartitions1).\take(1) print(需求3的结果, result3)# TOOP 需求4将数据转换为JSON格式写出为文件 # 4.1 转换为JSON格式的RDD # 4.2 写出为文件 rdd.map(lambda x: x.split(\t)).\map(lambda x: {time: x[0], user_id: x[1], key_word: x[2], rank1: x[3], rank2: x[4], url: x[5]}).\saveAsTextFile(D:/output_json)
http://www.w-s-a.com/news/41170/

相关文章:

  • 网络公司怎么优化网站百度快速排名技术培训教程
  • 建e室内设计网 周婷站长工具seo综合查询源码
  • 塔式服务器主机建网站定制美瞳网站建设
  • 网站是先解析后备案吗永久免费网站模板
  • wordpress站点演示php根据ip 跳转网站
  • 东莞市凤岗建设局网站网站开发有哪些职位
  • 企业网站手机版模板免费下载辣条网站建设书
  • 南昌网站建设维护vc 做网站源码
  • 网站动态logo怎么做织梦移动端网站怎么做
  • 三亚城乡建设局网站app下载安装官方网站
  • 公司被其它人拿来做网站郑州哪家做网站最好
  • 山东省建设厅官方网站抖音代运营业务介绍
  • 网站制作 牛商网wordpress商城 微信支付
  • 平面设计培训网站建文帝网站建设
  • python网站建设佛山乐从网站建设
  • 网站 免费 托管运营app软件大全
  • 爱网站找不到了网站设计制作要交印花税
  • 分销平台是什么意思网站如何从行为数据进行优化
  • 做网站公司职务做民俗酒店到哪些网站推荐
  • 从0到建网站wordpress导航主题模板下载地址
  • 以3d全景做的网站统计网站的代码
  • 北辰网站建设WordPress换主题文件夹
  • 做网站的合同范文百度分析工具
  • 深圳企业网站制作公司单位注册wordpress发送邮件
  • 兰州专业网站建设团队wordpress 拉取点击数
  • 基于php房产网站开发ppt模板免费下载第一ppt
  • 网站盈利模式分析怎么做山东营销网站建设联系方式
  • 二级网站建设 知乎我的个人主页模板
  • wordpress小说网站模板下载地址百度优化服务
  • 云南网页设计制作seo计费系统源码