当前位置: 首页 > news >正文

网站ftp密码品牌策划招聘

网站ftp密码,品牌策划招聘,做网站的基本要素,免费的海报模板网站文章目录 任务目标0. 版本信息1. 计算生成renkou.txt2. 文件上传至spark3. 上传文件时#xff0c;可能出现的常见错误4. 编写spark文件5. 上传集群6. 集群环境下提交任务 任务目标 在虚拟机上部署spark集群#xff0c;给定renkou.txt文件#xff0c;输出平均年龄 renkou.t… 文章目录 任务目标0. 版本信息1. 计算生成renkou.txt2. 文件上传至spark3. 上传文件时可能出现的常见错误4. 编写spark文件5. 上传集群6. 集群环境下提交任务 任务目标 在虚拟机上部署spark集群给定renkou.txt文件输出平均年龄 renkou.txt: 集群运作spark spark web界面显示结果 0. 版本信息 信息版本Scala2.11.8Java1.8spark2.2.0 hadoop安装 尚硅谷Hadoop spark spark集群搭建 tip: 按照上述spark博客集群搭建时node1是虚拟机的域名记得换成自己虚拟机的域名。如果没有填写真实ip地址即可 maven坐标 !-- https://mvnrepository.com/artifact/org.apache.spark/spark-core --dependencygroupIdorg.apache.spark/groupIdartifactIdspark-core_2.11/artifactIdversion2.2.0/version/dependency1. 计算生成renkou.txt 因为数据量很庞大, 1000万行因此采用Java多线程的方式生成数据 package com.xhf.java;import com.xhf.java.entity.Person;import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.util.Random; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.TimeUnit;/*** 生成renkou.txt*/ public class RenkouGen {static Random random new Random();static Object lock new Object();public static void main(String[] args) throws Exception {// 创建文件File file new File(E:\\B站视频创作\\Java计算人口平均_spark\\src\\main\\resources\\renkou.txt);// 判断file是否存在if (file.exists()) {file.delete();}else {file.createNewFile();}// 创建流管到BufferedWriter bw new BufferedWriter(new FileWriter(file, false));// 创建线程池 1000万, 100万(每个线程)ExecutorService executorService Executors.newFixedThreadPool(10);for (int i 0; i 10; i) {// 生成数据executorService.execute(() - {// 100万for (int j 0; j 1000000; j) {Person person new Person(j, random.nextInt(20) 40);// 数据写入文件try { // synchronized (lock) {// 加锁bw.write(person.toString()); // bw.newLine(); // }} catch (IOException e) {e.printStackTrace();}}});}// 关闭线程池executorService.shutdown();executorService.awaitTermination(10000L, TimeUnit.SECONDS);bw.close();} }tip 生成完的文件需要上传到hadoop文件系统中这样便于spark程序部署时获取文件信息如果不上传至hadoop中在集群环境下运行时可以通过main的args参数指定路径又或者将文件存放在resouce目录下打jar包后代码通过resource资源目录进行定位 2. 文件上传至spark 如果遇到问题请往下看 3.上传文件时可能出现的常见错误 文件访问url: ‘hdfs://hadoop102:8020/spark/renkou.txt’ 3. 上传文件时可能出现的常见错误 在上传的过程中可能会遇到各种报错我这里整理好参考资料 解决hadoop Permission denied: userdr.who, accessWRITE, inode“/“:kfk:supergroup:drwxr-xr-x问题Name node is in safe mode 4. 编写spark文件 package com.xhf.sparkimport org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext}object RenkouCal2_Cluster {def main(args: Array[String]): Unit {// 设置配置, master记得输入你要提交的主节点地址而不是local. 如果是local, 我的版本下能够运行, 但任务无法在UI界面上显示val conf: SparkConf new SparkConf().setAppName(renkou).setMaster(spark://hadoop102:7077)// 连接sparkval sparkContext new SparkContext(conf)val filePath: String hdfs://hadoop102:8020/spark/renkou.txt;// 读取文件 ListStringval lines: RDD[String] sparkContext.textFile(filePath)val begin: Long System.currentTimeMillis()val value: RDD[Long] lines.map(line {// String : 1 27line.split( )(1).toLong});// 计算 (把所有年龄累加 - 除以个数 - 平均年龄)val sum: Long value.reduce((x, y) x y)println(sum / (1.0 * lines.count()))println(System.currentTimeMillis() - begin)// 终止sparksparkContext.stop()} } 如果本地能够运行通过maven打成jar包上传运行 5. 上传集群 笔者采用xshell xftp的方式进行jar包上传上传至如下位置 6. 集群环境下提交任务 找到spark安装位置进入bin目录 执行如下指令 ./spark-submit \ --class com.xhf.spark.RenkouCal2 \ --master spark://hadoop102:7077 \ --executor-memory 1G \ --total-executor-cores 2 \ /export/servers/spark_demo/java_spark-1.0-SNAPSHOT.jar–class 指定运行jar包具体的启动类笔者运行的时RenkouCal2这个类–master 指定master节点的地址/export/servers/spark_demo/java_spark-1.0-SNAPSHOT.jar 指定jar包路径这个由自己决定 其它参数见名知意不在过多赘述 spark启动
http://www.w-s-a.com/news/99987/

相关文章:

  • 网后台的网站怎么做网站代理商
  • 网站如何转移到新的空间服务器上手机无人区离线地图app
  • 网站建设模板的买域名做网站的坏处
  • 长春做网站qianceyun做景观素材有哪几个网站
  • 自己建的网站也要注册域名吗邯郸市做网站
  • 天津网站建设制作软件潍坊个人做网站
  • 重庆城市建设集团官方网站php用什么做网站服务器
  • 深圳坪山站重庆市园林建设有限公司网站
  • 网站建设图片教程如何用自己的电脑建网站
  • 《网页设计与网站建设》A卷答案广东新闻联播
  • 海南专业网站运营托管wordpress 去掉主题
  • 企业品牌网站制作甜品制作网站
  • 手机网站怎么制作影响力网站建设
  • 猪八戒网站做私活赚钱吗一尊网 又一个wordpress站点
  • 上海市做网站的公司滨州哪里做网站
  • 简单的网站建设步骤wordpress 贴吧主题
  • 金泉网做网站找谁表格做网站
  • 北京做兼职从哪个网站好江西省建设监督网站电子网
  • 什么网站做生鲜比较好安徽建设厅城乡官网
  • 域名购买网站有哪些问题上海装修网站建设
  • 找人做seo要给网站程序河北建设网网站
  • 哪家做网站性价比高wordpress最新文章链接插件
  • 维修网站怎么做移动互联网应用程序指的是什么
  • 张家界建设网站门户网站的建设原理
  • 企业通用网站模板湖南网站建设企业
  • 能看网站的视频app如何运行asp网站
  • 公司做网站还是做阿里好呢国外的旅游网站做的如何
  • 怎么做wep网站长沙seo排名公司
  • 海南网站网络推广做转运网站
  • 门户网站方案用户等待网站速度