当前位置: 首页 > news >正文

dedecms医院网站wap模板(橙色)4512345公司网站系统建设策划书

dedecms医院网站wap模板(橙色)4,512345,公司网站系统建设策划书,继续访问这个网站,余姚做网站公司使用Hadoop MapReduce实现各省学生总分降序排序#xff0c;根据省份分出输出到不同文件 本文将展示如何使用Hadoop MapReduce对一组学生成绩数据进行处理#xff0c;将各省的学生成绩按总分降序排序并按照省份进行分区将结果分别输出到不同的文件中。 数据样例 我们将使用…使用Hadoop MapReduce实现各省学生总分降序排序根据省份分出输出到不同文件 本文将展示如何使用Hadoop MapReduce对一组学生成绩数据进行处理将各省的学生成绩按总分降序排序并按照省份进行分区将结果分别输出到不同的文件中。 数据样例 我们将使用以下格式的数据 实现步骤 我们将通过以下步骤来实现这一目标 **1、Mapper类**解析每一行数据提取省份和总分并输出为键值对。 **2、Reducer类**对每个省份的数据按总分降序排序后输出到相应的文件中。 **3、Partitioner类**确保同一省份的数据被发送到同一个Reducer。 **4、Driver类**配置并运行MapReduce作业。 代码实现 Mapper类 Mapper类将每一行数据解析为省份和总分并输出为键值对键是省份值是总分和学生信息的组合。 package org.example.mapReduce;import java.io.IOException; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper;public class ProvinceScoreMapper extends MapperObject, Text, Text, Text {Overrideprotected void map(Object key, Text value, Context context) throws IOException, InterruptedException {String line value.toString();// Skip the header lineif (line.startsWith(考号)) {return;}String[] fields line.split( );String province fields[11];String totalScore fields[10];context.write(new Text(province), new Text(totalScore , line));} } Reducer类 Reducer类将每个省份的数据按总分降序排序后输出使用MultipleOutputs将每个省的数据写入单独的文件。 package org.example.mapReduce;import java.io.IOException; import java.util.Collections; import java.util.LinkedList; import java.util.List; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.output.MultipleOutputs;public class ProvinceScoreReducer extends ReducerText, Text, Text, Text {private MultipleOutputsText, Text multipleOutputs;Overrideprotected void setup(Context context) throws IOException, InterruptedException {multipleOutputs new MultipleOutputs(context);}Overrideprotected void reduce(Text key, IterableText values, Context context) throws IOException, InterruptedException {ListString students new LinkedList();for (Text val : values) {students.add(val.toString());}// Sort students by total score in descending orderCollections.sort(students, (a, b) - {int scoreA Integer.parseInt(a.split(,)[0]);int scoreB Integer.parseInt(b.split(,)[0]);return Integer.compare(scoreB, scoreA);});for (String student : students) {String[] parts student.split(,, 2);multipleOutputs.write(new Text(parts[1]), null, key.toString() /part);}}Overrideprotected void cleanup(Context context) throws IOException, InterruptedException {multipleOutputs.close();} } Partitioner类 Partitioner类确保同一省份的数据被发送到同一个Reducer。 package org.example.mapReduce;import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Partitioner;public class ProvincePartitioner extends PartitionerText, Text {Overridepublic int getPartition(Text key, Text value, int numPartitions) {String province key.toString();return (province.hashCode() Integer.MAX_VALUE) % numPartitions;} } Driver类 Driver类配置并运行MapReduce作业。 package org.example.mapReduce;import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import org.apache.hadoop.mapreduce.lib.output.MultipleOutputs;public class ProvinceScoreSorter {public static void main(String[] args) throws Exception {if (args.length ! 2) {System.err.println(Usage: ProvinceScoreSorter input path output path);System.exit(-1);}Configuration conf new Configuration();Job job Job.getInstance(conf, Province Score Sorter);job.setJarByClass(ProvinceScoreSorter.class);job.setMapperClass(ProvinceScoreMapper.class);job.setPartitionerClass(ProvincePartitioner.class);job.setReducerClass(ProvinceScoreReducer.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);FileInputFormat.addInputPath(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));MultipleOutputs.addNamedOutput(job, province, FileOutputFormat.class, Text.class, Text.class);System.exit(job.waitForCompletion(true) ? 0 : 1);} } 运行MapReduce作业 总结 通过以上步骤我们实现了一个Hadoop MapReduce作业来对各省的学生总分进行降序排序并将结果写入不同的文件中。 如有遇到问题可以找小编沟通交流哦。另外小编帮忙辅导大课作业学生毕设等。不限于MapReduce MySQL, pythonjava大数据模型训练等。 hadoop hdfs yarn spark Django flask flink kafka flume datax sqoop seatunnel echart可视化 机器学习等
http://www.w-s-a.com/news/530456/

相关文章:

  • 梅州南站济南做网络安全的公司
  • 网站源代码 phpseo营销推广费用
  • 南京专业制作网站深圳整装装修公司排名
  • 网站制作在哪里比较好网页设计的要点有哪些
  • 自己做网站原始代码高端品牌服装
  • 九度企业网站推广软件龙泉市建设局网站
  • 做个企业网网站怎么做专业3合1网站建设公司
  • 龙岩网站建设teams熊掌号公司网站的实例
  • 电商模板网站免费省级精品课程网站建设
  • 网站建设的规划书桂林生活最新网
  • 广东省建设工程执业中心网站wordpress的分类目录和标签
  • 甘肃省两学一做专题网站广东外发加工网
  • 用python导入wordpress公司网络优化方案
  • 效益成本原则网站建设wordpress 上传rar
  • 大连网站制作 连城传媒渠道网络公司官网
  • 电影天堂网站用什么程序做的wordpress 添加链接地址
  • 购买空间网站哪个好重庆英文网站建设
  • 建设网站需要注意什么问题设计网页通常使用什么语言
  • 彩票网站建设要多少钱西安英文网站建设
  • 静态班级网站印象云笔记 wordpress
  • 网站表单及商品列表详情模板永川网站制作联系电话
  • 网站建设与维护难不难网络服务机构的网站
  • 用三权重的网站做友链有好处没企业年金怎么查询
  • 工行网站跟建设网站区别wordpress加入地图
  • 网站的风格对比信息表广告门
  • 教育网站建设毕业设计说明书门户网站模式
  • 洛阳霞光建设网站html做分模块的网站
  • 域名建议网站wordpress 伪静态html
  • 网站风格化设计方案免费模式营销案例
  • 凤翔网站建设农村建设自己的网站首页