当前位置: 首页 > news >正文

义乌哪里做网站好无锡优化网站价格

义乌哪里做网站好,无锡优化网站价格,wordpress琪亚娜,台州市建设规划局网站班子成员在之前的文章中#xff0c;我们学习了如何在spark中使用键值对中的学习键值对方法中的lookup#xff0c;cogroup两种方法。想了解的朋友可以查看这篇文章。同时#xff0c;希望我的文章能帮助到你#xff0c;如果觉得我的文章写的不错#xff0c;请留下你宝贵的点赞#…在之前的文章中我们学习了如何在spark中使用键值对中的学习键值对方法中的lookupcogroup两种方法。想了解的朋友可以查看这篇文章。同时希望我的文章能帮助到你如果觉得我的文章写的不错请留下你宝贵的点赞谢谢。 Spark-Scala语言实战14-CSDN博客文章浏览阅读1.5k次点赞33次收藏25次。今天开始的文章我会带给大家如何在spark的中使用我们的键值对方法今天学习键值对方法中的lookupcogroup两种方法。希望我的文章能帮助到大家也欢迎大家来我的文章下交流讨论共同进步。https://blog.csdn.net/qq_49513817/article/details/137441090 今天的文章开始我会带着大家来做三道任务运用之前学到的方法温故知新举一反三将知识紧紧掌握希望你能在我的文章中有所收获。  目录 一、知识回顾 二、任务实现 1.使用Spark完成单词去重 2.使用Spark统计133 136 139开头的总流量 3.完成统计相同字母组成的单词 一、知识回顾 上一篇文章中我们学习了RDD键值对的两种方法分别是lookupcogroup。 lookup是我们的查找方法它用于返回我们指定键所对应的值。 我们创建了两个RDD一个名为p包含了我们的键值对一个名为pp包含了我们需要查找的键。然后使用 map来实现我们的lookoup方法。  运行代码它就会返回我们需要的键所对应的值没有就会输出None 然后就是我们 cogroup方法。它是一种常见的组合操作用于合并两个或多个数据组中具有相同键的数据。 可以看到代码我们通过 cogroup方法将p1p2组合到一起了那么收集结果打印出来会是什么样子呢 它将我们值通过键全部合并在一起了 复习完毕现在开始今天的学习吧~ 二、任务实现 1.使用Spark完成单词去重 现在我们有一个名为text01的txt文件 它里面的数据如下 java php hello word php hi exe java  python hello kitty php happy abc java 现在我们需要用到之前所学的知识将它进行去重操作 解题思路 首先我们肯定要将文件的内容读取出来 val p sc.textFile(C:\\IDEA\\P1\\p1\\text01.txt) 然后就是切分我们文件的内容将它里面的单词转换成一个数组啊列表啊或者其他根据需求转化。 def pp(line: String): Array[String] {line.split(\\s)//\s中\ 是转义字符。s 是代表空白字符的元字符。 表示前面的字符或组在这里是 \s可以出现一次或多次。} 这里我们使用了一个\\s它的意思注释的很清楚主要作用还是设置我们的切分。 现在准备工作做完了就可以开始去重了 val ppp p.flatMap(pp)val pppp ppp.distinct().collect()pppp.foreach(println) 使用我们的distinct()方法进行去重操作最后收集RDD数据并打印 完整代码 import org.apache.spark.{SparkConf, SparkContext}object p1 {def main(args: Array[String]): Unit {val conf new SparkConf().setMaster(local).setAppName(ppp)val sc new SparkContext(conf)val p sc.textFile(C:\\IDEA\\P1\\p1\\text01.txt)def pp(line: String): Array[String] {line.split(\\s)//\s中\ 是转义字符。s 是代表空白字符的元字符。 表示前面的字符或组在这里是 \s可以出现一次或多次。}val ppp p.flatMap(pp)val pppp ppp.distinct().collect()pppp.foreach(println)} } 运行代码 可以看到成功完成任务需求读取外部文件并去重。  2.使用Spark统计133 136 139开头的总流量 我们这里有两对数据分别是手机号和使用的流量 13326293050 81 13626594101  50 13326435696  30 13926265119  40 13326564191  2106 13626544191  1432 13919199499  300 我们需要将它通过手机号前三位区分然后统计133 136 139开头的总流量 解题思路 在这里我想到的方法是创建一个键值对将手机号和流量进行一个对应 val p sc.parallelize(Array((13326293050L, 81),(13626594101L, 50),(13326435696L, 30),(13926265119L, 40),(13326564191L, 2106),(13626544191L, 1432),(13919199499L, 300)//int超出存储限制添加L变为long)) 然后进行取前手机号三位并且使用groupByKey方法分组的方法 val pp p.map { case (phone, value) val prefix (phone / 1000000).toString.take(3)(prefix, value)}.groupByKey()//取出前三位并分组 最后将我们三个组里的数据进行一个sum求和并打印 val ppppp.mapValues(_.sum)//值相加ppp.foreach(println) 完整代码 import org.apache.spark.{SparkConf, SparkContext}object p2 {def main(args: Array[String]): Unit {val conf new SparkConf().setMaster(local).setAppName(ppp)val sc new SparkContext(conf)val p sc.parallelize(Array((13326293050L, 81),(13626594101L, 50),(13326435696L, 30),(13926265119L, 40),(13326564191L, 2106),(13626544191L, 1432),(13919199499L, 300)//int超出存储限制添加L变为long))val pp p.map { case (phone, value) val prefix (phone / 1000000).toString.take(3)(prefix, value)}.groupByKey()//取出前三位并分组val ppppp.mapValues(_.sum)//值相加ppp.foreach(println)} } 运行代码 完成任务分组并统计流量 3.完成统计相同字母组成的单词 现在我们有一个名为text02的txt文件 它里面的数据如下 abc acb java avaj bac cba abc jvaa php hpp pph python thonpy 现在我们需要用到之前所学的知识将它统计相同字母组成的单词出现的次数。 解题思路 首先肯定还是要读取文件 val p sc.textFile(C:\\IDEA\\P1\\p1\\text02.txt) 然后对单词中的字母排序 def sortLetters(word: String): String {word.toLowerCase().replaceAll(\\s, ).sorted} 最后分割单词进行排序与reduceByKey方法统计  val pp p.flatMap(_.split(\\s)) // 分割每行文本为单词.map(word (sortLetters(word), 1)) // 对单词中的字母进行排序并映射到计数1.reduceByKey(_ _) // 统计相同字母组成的单词数量 收集数据并打印 pp.collect().foreach(println) 完整代码 import org.apache.spark.{SparkConf, SparkContext}object p3 {def main(args: Array[String]): Unit {val conf new SparkConf().setMaster(local).setAppName(ppp)val sc new SparkContext(conf)val p sc.textFile(C:\\IDEA\\P1\\p1\\text02.txt)// 用于对单词中的字母进行排序def sortLetters(word: String): String {word.toLowerCase().replaceAll(\\s, ).sorted}// 对每一行文本进行处理统计具有相同字母组成的单词数量val pp p.flatMap(_.split(\\s)) // 分割每行文本为单词.map(word (sortLetters(word), 1)) // 对单词中的字母进行排序并映射到计数1.reduceByKey(_ _) // 统计相同字母组成的单词数量pp.collect().foreach(println)} } 运行代码 完成任务统计相同字母组成的单词次数 最后代码的可变性很多不同的写法不同的方法有时候也能完成相同的任务。我的解题思路可以当作一种参考期待大家能用自己不同的方式完成任务。
http://www.w-s-a.com/news/585552/

相关文章:

  • 网站开发 视频存在哪检察院前期网站建设
  • 备案中的网站信息怎么填如何做分享赚钱的网站
  • 网站行程表怎么做注册公司费用要多少
  • 常见电子商务网站基本模式南山网站公司定
  • 网站搭建代码网站里面送礼物要钱怎么做代码
  • 大学英文网站建设举措wordpress 学院 模板
  • 爱 做 网站吗php网站作业模版
  • wordpress代码乱吗台州做网站seo的
  • 做ptt网站wordpress中文企业网站
  • 深圳雨棚制作深圳 网站优化公司排名
  • 深圳优秀网站建设价格wordpress没人用
  • 国企网站建设需要注意沈阳招标信息网
  • 东莞360推广的网站是谁做的上海网络推广产品
  • 网站可以换主机吗中国十大网站建设企业
  • 怎么做盗版小说网站官网做有下拉列表的网站的图片
  • 邢台网站建设电话网站界面类型
  • 网站制作合同模板做一个网站能挣多少钱
  • 汶上1500元网站建设互联网高端官网
  • 广州做公司网站网站开发培训机构
  • 网站建设与维护 课件网页版qq安全中心登录入口
  • 做三个月网站广告收入dw如何制作网页
  • ...课程网站建设简介工信部 网站备案查询
  • 网站代码建设 实例企业网站建设大概的费用
  • 制作网站软件排行榜过年做啥网站致富
  • 哪里有做网站企业seo关键词优化
  • 上海金山网站建设公司手机淘宝客网站怎么做的
  • 网站开发需要公司做网站费用计入什么科目
  • 网站优化有哪些类型免费制作app的傻瓜软件
  • 如何做网站咨询wordpress get
  • 企业网站建设网站做网站用别人的图片