当前位置: 首页 > news >正文

前端主要做什么seo优化教程培训

前端主要做什么,seo优化教程培训,创建网站的基本步骤,深圳工程交易服务主页spark的算子 1.spark的单Value算子 Spark中的单Value算子是指对一个RDD中的每个元素进行操作#xff0c;并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能#xff1a; map#xff1a;逐条映射#xff0c;将RDD中的每个元素通过指定的函数转换成另一个值并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能 map逐条映射将RDD中的每个元素通过指定的函数转换成另一个值最终返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.map(lambda x: x * 2) # result: [2, 4, 6, 8, 10]flatMap: 扁平化映射将RDD中的每个元素通过指定的函数转换成多个值并将这些值展开为一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.flatMap(lambda x: range(x, x3)) # result: [1, 2, 3, 2, 3, 4, 3, 4, 5, 4, 5, 6, 5, 6, 7]glom将一个分区中的多个单条数据转换为相同类型的单个数组进行处理。返回一个新的RDD其中每个元素是一个数组。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 两个分区 result rdd.glom().collect() # result: [[1, 2], [3, 4, 5]]groupBy: 将RDD中的元素按照指定条件分组返回一个键值对RDD其中的每个元素是一个(key, iterator)对key为分组的条件iterator为对应分组的元素迭代器。 rdd sc.parallelize([apple, banana, cherry, date]) result rdd.groupBy(lambda x: x[0]) # result: [(a, [apple]), (b, [banana]), (c, [cherry]), (d, [date])]filter根据指定的规则过滤出符合条件的元素返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.filter(lambda x: x % 2 0) # result: [2, 4]sample从RDD中进行采样返回一个包含采样结果的新的RDD。 rdd sc.parallelize(range(10)) result rdd.sample(False, 0.5) # result: [0, 2, 3, 4, 5, 7]distinctshuffle去重将RDD中重复的元素去除返回一个由不重复元素组成的新的RDD。 rdd sc.parallelize([1, 2, 2, 3, 3, 3]) result rdd.distinct() # result: [1, 2, 3]coalesceshuffle缩减分区将RDD的分区数缩减为指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 4) # 4个分区 result rdd.coalesce(2) # result: [1, 2, 3, 4, 5]分区数变为2repartitionshuffle扩增分区数底层是coalesce。将RDD的分区数扩增到指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 2个分区 result rdd.repartition(4) # result: [1, 2], [3, 4], [5]分区数变为4sortByshuffle根据指定的规则对数据源中的数据进行排序默认为升序。 rdd sc.parallelize([3, 1, 4, 2, 5]) result rdd.sortBy(lambda x: x) # result: [1, 2, 3, 4, 5]这些单Value算子能够对RDD中的每个元素进行处理并返回一个新的RDD可以用于各种数据转换、过滤、去重等操作。 2. Spark的双Value算子 双Value算子是指对两个RDD进行操作并返回一个新的RDD。下面介绍一些常用的双Value算子及其功能 union: 对两个RDD求并集返回包含两个RDD中所有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.union(rdd2) # result: [1, 2, 3, 3, 4, 5]intersection: 对两个RDD求交集返回包含两个RDD中共有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.intersection(rdd2) # result: [3]subtract: 对两个RDD求差集返回只属于第一个RDD而不属于第二个RDD的元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.subtract(rdd2) # result: [1, 2]cartesian: 对两个RDD进行笛卡尔积操作返回所有可能的元素对组成的新RDD。 rdd1 sc.parallelize([1, 2]) rdd2 sc.parallelize([a, b]) result rdd1.cartesian(rdd2) # result: [(1, a), (1, b), (2, a), (2, b)]zip: 将两个RDD的元素按照索引位置进行配对返回键值对组成的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([a, b, c]) result rdd1.zip(rdd2) # result: [(1, a), (2, b), (3, c)]join: 对两个键值对RDD进行内连接操作返回具有相同键的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (2, yellow)]) result rdd1.join(rdd2) # result: [(1, (apple, red)), (2, (banana, yellow))]leftOuterJoin: 对两个键值对RDD进行左外连接操作返回左侧RDD中所有元素以及与之匹配的右侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.leftOuterJoin(rdd2) # result: [(1, (apple, red)), (2, (banana, None))]rightOuterJoin: 对两个键值对RDD进行右外连接操作返回右侧RDD中所有元素以及与之匹配的左侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.rightOuterJoin(rdd2) # result: [(1, (apple, red)), (3, (None, yellow))]这些双Value算子能够对两个RDD进行操作并返回一个新的RDD可以用于求并集、交集、差集等操作也可以进行连接操作根据键值对进行配对。 3. Spark的Key-Value算子 Key-Value算子是指对键值对RDD进行操作的算子这些算子主要用于处理具有键值对结构的数据其中键位于第一列值位于第二列。下面介绍一些常用的Key-Value算子及其功能 reduceByKey: 对具有相同键的元素进行聚合操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.reduceByKey(lambda x, y: x y) # result: [(1, 5), (2, 9)]groupByKey: 对具有相同键的元素进行分组操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.groupByKey() # result: [(1, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e370), (2, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e3d0)]sortByKey: 按照键的顺序对RDD进行排序操作默认升序排列。 rdd sc.parallelize([(3, apple), (1, banana), (2, orange)]) result rdd.sortByKey() # result: [(1, banana), (2, orange), (3, apple)]mapValues: 对键值对RDD中的值进行操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.mapValues(lambda x: fruit x) # result: [(1, fruit apple), (2, fruit banana)]flatMapValues: 对键值对RDD中的值进行扁平化操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, hello world), (2, goodbye)]) result rdd.flatMapValues(lambda x: x.split()) # result: [(1, hello), (1, world), (2, goodbye)]keys: 返回所有键组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.keys() # result: [1, 2]values: 返回所有值组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.values() # result: [apple, banana]除了上述提到的常用Key-Value算子还有一些其他常见的Key-Value算子它们在处理键值对RDD时也非常有用。以下是其中几个 countByKey: 统计每个键出现的次数返回一个字典。 rdd sc.parallelize([(1, apple), (1, banana), (2, orange), (2, banana)]) result rdd.countByKey() # result: {1: 2, 2: 2}collectAsMap: 将键值对RDD转换为字典形式。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.collectAsMap() # result: {1: apple, 2: banana}lookup: 查找具有给定键的所有值并返回一个列表。 rdd sc.parallelize([(1, apple), (2, banana), (1, orange)]) result rdd.lookup(1) # result: [apple, orange]foldByKey: 对具有相同键的元素进行折叠操作类似于reduceByKey但可以指定初始值。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.foldByKey(0, lambda x, y: x y) # result: [(1, 5), (2, 9)]aggregateByKey: 对具有相同键的元素进行聚合操作可以指定初始值和两个函数一个用于局部聚合另一个用于全局聚合。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.aggregateByKey(0, lambda x, y: x y, lambda x, y: x y) # result: [(1, 5), (2, 9)]这些Key-Value算子能够对键值对RDD进行操作实现聚合、分组、排序、映射等功能。使用这些算子可以更方便地处理具有键值对结构的数据。
http://www.w-s-a.com/news/622154/

相关文章:

  • 五金东莞网站建设技术支持wordpress 添加模板
  • 网站申请专利春节网页设计素材
  • 进网站备案md风格的wordpress主题
  • 如何建站网站十大免费建站app
  • 工作号做文案素材的网站晋城网站设计人
  • 建设部网站官网 施工许可怎样建网站 需要
  • 什么网站都能打开的浏览器同城小程序怎么推广
  • 在电脑上怎么做网站网址seo分析
  • 石家庄做网站网络公司电子商务营销推广
  • 网站开发 前端专做婚礼logo的网站
  • 同创企业网站建设拖拽建设网站源码
  • wordpress调用网站标题网站页面排版
  • 哈尔滨营销网站建设电子商城网站开发要多少钱
  • 免费织梦导航网站模板下载地址自己建站网站
  • 获取网站访客qq号码代码做抽奖网站违法吗
  • 湖南大型网站建设公司排名偷网站源码直接建站
  • 网站建设周期规划北京网站设计必看刻
  • 如何做自己的在线作品网站深圳网站设计公司的
  • 网站开发外包公司wordpress最简单模板
  • 湖南省建设人力资源网站wordpress主机pfthost
  • 淮安软件园哪家做网站各网站特点
  • 网站长尾关键词排名软件重庆荣昌网站建设
  • 建个商城网站多少钱茂名专业网站建设
  • 开通公司网站免费的网站app下载
  • 跨境电商网站模板wordpress壁纸
  • 国内做网站网站代理电子商务网站建设与维护概述
  • 如何做地方网站推广沈阳网势科技有限公司
  • 哈尔滨网站优化技术涵江网站建设
  • 做网站搞笑口号wordpress全屏动画
  • 怎么可以建网站小程序代理项目