当前位置: 首页 > news >正文

张家港网站制作公司gettext wordpress

张家港网站制作公司,gettext wordpress,网页设计费用标准,wordpress设置html代码高亮Spark 操作 创建操作(Creation Operation) 用于RDD创建工作。RDD创建只有两种方法#xff0c;一种是来自于内存集合和外部存储系统#xff0c;另一种是通过转换操作生成的RDD 转换操作(Transformation Operation) 将RDD通过一定的操作变成新的RDD#xff0c;比如HadoopR…Spark 操作 创建操作(Creation Operation) 用于RDD创建工作。RDD创建只有两种方法一种是来自于内存集合和外部存储系统另一种是通过转换操作生成的RDD 转换操作(Transformation Operation) 将RDD通过一定的操作变成新的RDD比如HadoopRDD可以使用map操作变换为MappedRDD RDD的转换操作是惰性操作它只是定义了一个新的RDDs,并没有立即执行 控制操作(Control Operation) 进行RDD持久化可以让RDD按不同的存储策略保存在磁盘或内存中比如cache接口默认将RDD缓存在内存中 行动操作(Action Operation) 能够触发Spark运行的操作例如对RDD进行collect就是行动操作 Spark中行动操作分为两类一类的操作结果变成Scala集合或者变量另一类将RDD保存到外部文件系统或者数据库中 创建操作 parallelize[T](seq:Seq[T], numSlices:Int) parallelize 在一个已经存在的Scala集合上创建(一个Seq对象)。集合的对象将会被复制创建出一个可以被并行操作的分布式数据集 makeRDD[T](seq:Seq[(T, Seq[String])]):RDD[T] 并行化集合创建操作 基础转换操作 map[U](f:(T) U):RDD[U] map操作是对RDD中的每个元素都执行一个指定的函数来产生一个新的RDD任何原RDD中的元素在新RDD中都有且只有一个元素与之对应 distinct():RDD[(T)]/distinct(nPartitions):RDD[(T)] distinct操作是去除RDD重复的元素返回所有元素不重复RDD flatMap[U](f:(T) TraversableOnce[U]):RDD[U] flatMap操作与map类似区别是原RDD中的每个元素经过map处理后只能生成一个元素而在flatMap操作中原RDD中的每个元素可生成一个或多个元素来构建RDD coalesce(numPartitions:Int,shuffle:Boolean false):RDD[T] coalesce操作使用HashPartitioner进行重分区第一个参数为重分区的数目第二个是否进行shuffle默认情况为false repartition(numPartitions:Int):RDD[T] repartition操作是coalesce函数第二个参数为true的实现 randomSplit(weights:Array[Double], send:Long):Array[RDD[T]] randomSplit操作是根据weights权重将一个RDD分隔为多个RDD glom():RDD[Array[T]] glom操作则是RDD中每一个分区所有类型为T的数据转变成元素为T的数组[Array[T]] union(other:RDD[T]):RDD[T] union操作是将两个RDD合并返回两个RDD的并集返回元素不去重 intersection(other:RDD[T]):RDD[T] intersection操作类似SQL中的inner join操作返回两个RDD交集返回元素去重 subtract(other:RDD[T]):RDD[T] subtract 返回在RDD中出现且不在otherRDD中出现的元素 mapPartitions[U](f:(Iter), preserversPartitons:Boolean) mapPartitions操作和map操作类似只不过映射的参数由RDD中的每一个元素变成了RDD中每一个分区的迭代器 其中preserversPartitons表示是否保留父RDD的partitioner分区信息 如果在映射的过程中需要频繁创建额外的对象使用mapPartitions操作要比map操作高效得多 比如将RDD中的所有数据通过JDBC连接写入数据库如果使用map函数可能要为每一个元素都创建一个connection这样开销很大 如果使用mapPartitions那么只需要针对每一个分区建立一个connection mapPartitionsWithIndex[U](f:(Iter), preserversPartitons:Boolean):RDD[U] mapPartitionsWithIndex 操作作用类似于mapPartitions只是输入参数多一个了分区索引 zip[U](other:RDD[U]):RDD[(T,U)] zip操作用于将两个RDD组合成Key/Value形式的RDD这里默认两个RDD的partition数量以及元素数量相同否则会抛出异常 zipPartitions[B,V](rdd2:RDD[B]) zipPartitions 操作将多个RDD按照partition组合成新的RDD该操作需要组合的RDD具有相同的分区数但对于每个分区内的元素数量没有要求 zipWithIndex():RDD[(T,Long)] zipWithIndex操作将RDD中的元素和这个元素在RDD中的ID(索引号)组合成键/值对 zipWithUniqueId():RDD[(T,Long)] zipWithUniqueId 操作将RDD中的元素和一个唯一ID组合成键/值对该唯一ID生成算法如下: 每个分区中第一个元素的唯一ID值为: 该分区索引号每个分区中第N个元素的唯一ID值为:(前一个元素的唯一ID值) (该RDD总的分区数) 键值转换操作 partitionBy(partitioner: Partitioner):RDD[(K, V)] partitionBy 操作根据partitioner函数生成新的ShuffleRDD mapValues[U](f:(V) U):RDD[(K, U)] mapValues类似于map只不过mapValues是针对[K,V]中的V值进行map操作 flatMapValues[U](f:(V) TraverableOnce[U]):RDD[(K,U)] flatMapValues 相对flatMap, flatMapValues是针对[K,V]中的V值进行flatMap操作 combineByKey[C](createCombiner:(V), mergeValue:(C, V), mergeCombiners) combineByKey 操作用于将RDD[K,V]转换成RDD[K,C].这里V类型和C类型可以相同也可以不同 combineByKey 参数含义 createCombiner: 组合器函数用于将V类型转换成C类型输入参数为RDD[K,V]中的V输出为CmergeValue: 合并值函数将一个C类型和一个V类型值合并成一个C类型输入参数为(C,V),输出为CmergeCombiners: 合并组合器函数用于将两个C类型值合并成一个C类型输入参数为(C,C)输出为CnumPartitons: 结果RDD分区数默认保持原有的分区数partitioner: 分区函数默认为HashPartitionermapSideCombine: 是否需要在Map端进行combine操作类似于MapReduce中的combine,默认为true foldByKey(zeroValue:V)(func:(V, V)V):RDD[(K,V)] foldByKey 操作用于RDD[K, V]转换K将V做折叠、合并处理。其中参数zeroValue表示先根据映射函数将zeroValue应用于V 进行初始化V再将映射函数应用于初始化后的V reduceByKey(func:(V, V) V):RDD[(K,V)] reduceByKey操作用于将RDD[K,V]中每个K对应的V值根据映射函数来运算其中参数numPartitions用于指定分区数参数partitioner用于指定分区函数 reduceByLocally(func:(V, V) V):Map[K,V] reduceByLocally 和 reduceByKey 功能类似不同的是reduceByLocally运算结果映射到一个Map[K,V]中而不是RDD[K,V] groupByKey():RDD[(K, Iterable[V])] groupByKey 操作用于将RDD[K,V]中每个K对应的V值合并到一个集合Iterable[V]中 cogroup[W](other:RDD[(K,V)]):RDD[(K,(Iterable[V], Iterable[W]))] cogroup 相当于SQL中的全外关联返回左右RDD中的记录关联不上的为空 可传入的参数有1~3个RDD参数numPartitons用于指定分区数参数partitioner用于指定分区函数 join、fullOuterJoin、leftOuterJoin、rightOuterJoin join、fullOuterJoin、leftOuterJoin、rightOuterJoin 都是针对RDD[K,V]中K值相等的连接操作 分别对应内连接、全连接、左连接和右连接。这些操作都调用cogroup进行实现subtractByKey和基本操作subtract,只是subtractByKey针对的是键值操作 其中参数numPartions用于指定分区数参数partitioner用于指定分区函数 控制操作 cache():RDD[T] 缓存 persist():RDD[] persit(level:StorageLevel):RDD[T] 行动操作 集合标量行动操作 first(): T 表示返回RDD中的第一个元素不排序 count(): Long 表示返回RDD中的元素个数 reduce(f:(T, T) T):T 根据映射函数f对RDD中的元素进行二元计算 collect(): Array[T] 表示将RDD转换成数组 take(num: Int): Array[T] 表示获取RDD中从0到num-1下标的元素不排序 top(num: Int): Array[T] 表示从RDD中按照默认(降序)或者指定的排序规则返回前num个元素 takeOrdered(num: Int): Array[T] 和top类似只不过以和top相反的顺序返回元素 aggregate[U](zeroValue: U)(seqOp: (U, T) U, combOp: (U,U) U) 用户聚合RDD中的元素先使用seqOp将RDD中每个分区中的T类型聚合成U类型 再使用combOp将之前每个分区聚合后的U类型聚合成U类型特别注意seqOp和combOp都会使用zeroValue的值zeroValue的类型的为U fold(zeroValue: T)(op: (T, T)T): Taggregate fold是aggregate的简化将aggregate中的seqOp和combOp使用同一个函数op lookup(key: K): Seq[V] lookup用于(K,V)类型的RDD指定K值返回RDD中该K对应的所有V值 countByKey(): Map[K, Long] countByKey 统计RDD[K, V]中每个K的数量 foreach(f:(T) Unit): Unit foreach 遍历RDD将函数f应用于每一个元素 要注意如果对RDD执行foreach只会在Executor端有效而并不是Driver端 foreachPartition(f:(Iterator[T]) Unit): Unit foreachPartition 和 foreach类似只不过是对每一个分区使用f sortBy[K](f:(T), ascending:Boolean, numPartitions):RDD[T] sortBy根据给定的排序k函数将RDD中的元素进行排序 存储行动操作 saveAsTextFile(path: String): Util saveAsTextFile 用于将RDD以文本文件的格式存储到文件系统中codec参数可以指定压缩的类名 saveAsTextFile 用于将RDD以SequenceFile的文件格式保存到HDFS上 saveAsObjectFile(path: String): Util saveAsObjectFile 用于将RDD中的元素序列化对象存储到文件中对于HDFS默认采用SequenceFile保存 saveAsHadoop saveAsHadoopFile 是将RDD存储在HDFS上的文件中 saveAsHadoopDataset(conf: JobConf): Unit 用于将RDD保存到除了HDFS的其他存储中比如HBase 在JobConf中通常需要关注或者设置5个参数: 文件的保存路径、key值的class类型、value值的class类型、RDD的输出格式以及压缩相关参数
http://www.w-s-a.com/news/564994/

相关文章:

  • 什么网站可以找手工活做一站式服务平台官网
  • 做购物网站的步骤网站核心词如何做
  • 做品牌设计网站公司网站没做301怎么做301
  • 服务流程企业网站wordpress文章的使用
  • 网站开发组合淘宝网站开发选什么类目
  • 广东手机网站建设个人电脑做网站主机
  • 健身俱乐部网站开发文档建一个网站需要什么条件
  • 买的网站模板怎么做建设行政管理部门网站
  • 怎么让百度多收录网站关键词seo深圳
  • 陕西交通建设集团网站体检个人网站设计模板田田田田田田田田
  • ae模板网站推荐安徽建筑信息平台
  • 新网站建设代理商wordpress模板商店
  • 中国十大设计素材网站wordpress发布失败
  • 江西省建设监理网站网页制作与设计是什么
  • 在招聘网站做销售怎么样网址你懂我意思正能量不用下载ios
  • 高端企业网站定制公司企业网站2000元
  • 成都网站建设:河北省建设工程质量监督网站
  • 四川省建设厅官网信息查询平台北京seo关键词优化外包
  • 网站建设响应式是什么意思wordpress弹窗打开网页
  • 做美工需要参考的网站漳州做网站的公司
  • 用源码建设网站关于网站开发的自我评价
  • 网站设计师图片自助建站编辑器
  • 网站建设的常用技术有哪些深圳建筑工地招工
  • 做软装找图片的网站wordpress 替代
  • 制作网站的后台公众号做视频网站会封吗
  • 广西企业建站邯郸景区网站制作
  • 开发商城网站多少钱城厢区建设局网站
  • 网站外链多的危害天水市建设局网站
  • 网站接入商学交互设计网站
  • 目前最新的网站后台架构技术综述什么网站可以做名片