当前位置: 首页 > news >正文

昆明快速建站模板きょこんきょうしゃ在线

昆明快速建站模板,きょこんきょうしゃ在线,王占山事迹,wordpress搭建网盘创建RDD 在Spark中创建RDD的方式分为三种: 从外部存储创建RDD从集合中创建RDD从其他RDD创建 textfile 调用SparkContext.textFile()方法#xff0c;从外部存储中读取数据来创建 RDD parallelize 调用SparkContext 的 parallelize()方法#xff0c;将一个存在的集合从外部存储中读取数据来创建 RDD parallelize 调用SparkContext 的 parallelize()方法将一个存在的集合变成一个RDD makeRDD 方法一 /** Distribute a local Scala collection to form an RDD.** This method is identical to parallelize.*/def makeRDD[T: ClassTag](seq: Seq[T],numSlices: Int defaultParallelism): RDD[T] withScope {parallelize(seq, numSlices)} 方法二分配一个本地Scala集合形成一个RDD为每个集合对象创建一个最佳分区。 /*** Distribute a local Scala collection to form an RDD, with one or more* location preferences (hostnames of Spark nodes) for each object.* Create a new partition for each collection item.*/def makeRDD[T: ClassTag](seq: Seq[(T, Seq[String])]): RDD[T] withScope {assertNotStopped()val indexToPrefs seq.zipWithIndex.map(t (t._2, t._1._2)).toMapnew ParallelCollectionRDD[T](this, seq.map(_._1), math.max(seq.size, 1), indexToPrefs)} 举例 scala val rdd sc.parallelize(1 to 6, 2) val rdd: org.apache.spark.rdd.RDD[Int] ParallelCollectionRDD[2] at parallelize at console:1scala rdd.collect() val res4: Array[Int] Array(1, 2, 3, 4, 5, 6)scala val seq List((American Person, List(Tom, Jim)), (China Person, List(LiLei, HanMeiMei)), (Color Type, List(Red, Blue))) val seq: List[(String, List[String])] List((American Person,List(Tom, Jim)), (China Person,List(LiLei, HanMeiMei)), (Color Type,List(Red, Blue)))scala val rdd2 sc.makeRDD(seq) val rdd2: org.apache.spark.rdd.RDD[String] ParallelCollectionRDD[0] at makeRDD at console:1scala rdd2.partitions.size val res0: Int 3scala rdd2.foreach(println) American Person Color Type China Personscala val rdd1 sc.parallelize(seq) val rdd1: org.apache.spark.rdd.RDD[(String, List[String])] ParallelCollectionRDD[1] at parallelize at console:1scala rdd1.partitions.size val res1: Int 2scala rdd2.collect() val res2: Array[String] Array(American Person, China Person, Color Type)scala rdd1.collect() val res3: Array[(String, List[String])] Array((American Person,List(Tom, Jim)), (China Person,List(LiLei, HanMeiMei)), (Color Type,List(Red, Blue)))scala var lines sc.textFile(/root/tmp/a.txt,3) var lines: org.apache.spark.rdd.RDD[String] /root/tmp/a.txt MapPartitionsRDD[4] at textFile at console:1scala lines.collect() val res6: Array[String] Array(a,b,c)scala lines.partitions.size val res7: Int 3转换算子 flatMap map reduceByKey groupByKey 举例 scala var lines sc.textFile(/root/tmp/a.txt,3) var lines: org.apache.spark.rdd.RDD[String] /root/tmp/a.txt MapPartitionsRDD[13] at textFile at console:1scala lines.flatMap(xx.split(,)).map(x(x,1)).reduceByKey((a,b)ab).foreach(println) (c,2) (b,1) (d,1) (a,2)scala lines.collect() val res27: Array[String] Array(a,b,c, c, a,d)scala lines.map(_.split(,)).collect() val res25: Array[Array[String]] Array(Array(a, b, c), Array(c), Array(a, d))scala lines.flatMap(_.split(,)).collect() val res26: Array[String] Array(a, b, c, c, a, d) 行动算子
http://www.w-s-a.com/news/193047/

相关文章:

  • 江苏城乡与住房建设厅网站wordpress 添加导航
  • 免费单页网站在线制作网站制作与网站建设pdf
  • 网站开发使用云数据库技术教程大连模板开发建站
  • 佘山网站建设创造网站需要多少钱
  • 南海佛山网站建设网站维护需要什么技能
  • 阿里云服务器开源做几个网站想找公司做网站
  • 一般做网站是用什么语言开发的域名查询 查询网
  • 地方门户网站源码下载揭阳专业网站建设
  • 网站做优化好还是推广好wordpress百家号模版
  • 淘宝网网站建设的的意见校园微网站建设
  • 小说网站建设之前需求分析免费下载京东购物
  • 园林景观设计案例网站wordpress 文章内容页
  • 网站什么做才会更吸引客户楚雄网站开发rewlkj
  • 电商网站构建预算方案视频制作网站怎么做
  • 包装设计灵感网站ps软件下载电脑版多少钱
  • 手机网站图片做多大原网站开发新功能
  • 网站设计培训成都陕西网站建设公司哪有
  • expedia电子商务网站建设辽宁网站设计
  • 深圳网站建设网站运营绥芬河市建设局网站
  • 家政服务网站做推广有效果吗做图软件ps下载网站有哪些
  • 北京市建设教育协会网站flash网站制作单选框和复选框ui组件
  • 国外有没有做问卷调查的网站网站网页怎么做
  • 简单个人网站模板下载网站建设整体情况介绍
  • 网站建设做到哪些内容荆门网站建设电话咨询
  • 玉树网站建设公司双11主机 wordpress 2015
  • dw做网站背景图片设置汕头seo管理
  • 个人又什么办法做企业网站唐山哪里建轻轨和地铁
  • 手机网站404页面室内设计公司排名前100
  • 做民宿需要和多家网站合作吗创建软件的步骤
  • 网站导航栏设计要求辽宁省住房和城乡建设厅