当前位置: 首页 > news >正文

北京网站建设 爱牛软文推广特点

北京网站建设 爱牛,软文推广特点,linux网站服务器配置,网站建设辶首选金手指十五目录 spark概述 spark集群搭建 1.Spark安装 2.环境变量配置 3.Spark集群配置 4.启动Spark集群 存在问题及解决方案 请参考以下文章 spark概述 Spark是一个开源的大数据处理框架#xff0c;它可以在分布式计算集群上进行高效的数据处理和分析。Spark的特点是速度快、易…目录 spark概述 spark集群搭建 1.Spark安装 2.环境变量配置 3.Spark集群配置 4.启动Spark集群 存在问题及解决方案 请参考以下文章  spark概述 Spark是一个开源的大数据处理框架它可以在分布式计算集群上进行高效的数据处理和分析。Spark的特点是速度快、易用性高、支持多种编程语言和数据源。Spark的核心是基于内存的计算模型可以在内存中快速地处理大规模数据。Spark支持多种数据处理方式包括批处理、流处理、机器学习和图计算等。Spark的生态系统非常丰富包括Spark SQL、Spark Streaming、MLlit GraphX等组件可以满足不同场景下的数据处理需求。 spark集群搭建 在部署spark集群时我们知道有三种 一种是本地模式一种是Standalone 集群还有一种是云端。 1.Spark安装 首先我们需要在master节点上进行Spark的安装。 其中1台机器节点作为Master节点主机名为hadoop1,另外两台机器节点作为Slave节点即作为Worker节点主机名分别为hadoop2和hadoop3。 在Master节点机器上访问Spark官方下载地址Downloads | Apache Spark按照如下图下载: 我们选择2.1.0的版本也可以选择其他的版本但是需要注意的是如果你选择的Spark版本过高可能导致无法与你的hadoop版本适配。 完成下载后进行如下的命令行操作和hadoop安装时十分类似。 $ tar -zxvf scala.2.11.8.tgz  #解压到当前路径 $ cd /usr/local $ sudo mv ./spark-2.1.0-bin-without-hadoop/ ./spark #重命名 spark安装与上述Scala步骤一致 2.环境变量配置 同样在master机器上打开bashrc文件进行环境变量配置。 $ vim ~/.bashrc 在文件中添加如下内容 export PATH$PATH:/usr/local/scala/bin并使其生效。 保存文件并退出vim编辑器执行如下命令让改环境变量生效 $ source ~/.bashrc 设置好后可以使用Scala命令来检验一下是否设置正确 $ scala 输入scala命令以后屏幕上会显示Scala和java版本信息并进入“scala”提示符状态这时就可以开始使用Scala解释器了可以输入scala语句来调试scala代码。 3.Spark集群配置 进入到/usr/local/spark的conf路径下进行以下文件的配置。 a)配置slaves文件 但是由于其开始并没有这个文件而只有slaves.template文件所以我们需要先拷贝重命名一下。 $ cd /usr/local/spark/conf/ $ cp ./slaves.template ./slaves 然后打开这个slaves文件并将默认的localhost替换相应的两个slave结点 hadoop2 hadoop3 分别在三台虚拟机上修改slaves文件 hadoop1 hadoop2 hadoop3 b)配置spark-env.sh文件 同样的我们需要先将template文件拷贝重命名。 将 spark-env.sh.template 拷贝到 spark-env.sh $ cp ./spark-env.sh.template ./spark-env.sh 然后在文件中添加如下内容 export SPARK_DIST_CLASSPATH$(/usr/local/hadoop/bin/hadoop classpath) export SPAEK_MASTER_HOSThadoop1 export SPARK_MASTER_PORT7077 export SPARK_MASTER_WEBUI_PORT8080 export SPARK_WORKER_MEMORY1g export SPARK_WORKER_CORES1 export SPARK_WORKER_INSTANCES1 export HADOOP_CONF_DIR/usr/local/hadoop/etc/hadoop分别在三台虚拟机上修改spark-env.sh文件 hadoop1 hadoop2 hadoop3 c)集群规划 节点 spark节点 hadoop节点 hadoop1 master worker datanode namenode secondarynamenode(hadoop) resourcemanager nodemanager(yarn) hadoop2 worker datanode nodemanager hadoop3 worker datanode nodemanager 4.启动Spark集群 因为我们的Spark是基于hadoop来运行的因此我们首先需要将hadoop启动起来。 启动Hadoop集群 在master机器上运行如下指令启动hadoop集群 $ cd /usr/local/hadoop/ $ sbin/start-all.sh hadoop1 hadoop2 hadoop3 启动spark集群 然后我们再再master机器上启动Spark的master进程。 $ cd /usr/local/spark/ $ sbin/start-master.sh 使用jps命令查看master机器上的进程情况结果如下。 hadoop1 我们发现除了hadoop的相关进程之外还多了一个Master进程,证明master节点已经成功启动。 然后我们同样在master机器上再启动worker进程。 用以下命令启动所有的slave节点 $ sbin/start-slaves.sh hadoop1 分别在hadoop2、hadoop3节点上运行jps命令可以看到多了个Worker进程 hadoop2 hadoop3 我们发现同样的除了hadoop的相关进程多出来一个Worker进程证明worker节点也已经成功启动。 在浏览器上查看Spark独立集群管理器的集群信息 在master主机上打开浏览器 分别访问http://192.168.43.33:50070,如下图 分别访问http://192.168.43.33:8080,如下图 $ spark-shell  #进入shell 关闭spark集群 ①关闭master节点 $ sbin/stop-master.sh ②关闭worker节点 $ sbin/stop-slaves.sh ③关闭Hadoop集群 $ cd /usr/local/hadoop/ $ sbin/stop-all.sh 存在问题及解决方案 请参考以下文章  大数据技术——搭建spark集群出现的问题_肉肉肉肉肉肉~丸子的博客-CSDN博客
http://www.w-s-a.com/news/174345/

相关文章:

  • 沈阳酒店企业网站制作公司竞价网站怎么做seo
  • 中山企业网站多少钱学网站建设的好处
  • 做官网网站哪家公司好jianux wordpress
  • 插件素材网站新站seo优化快速上排名
  • 网站注销主体填写原因asp响应式h5网站源码下载
  • 电商类网站模板下载济南市建设网官网
  • 万户网络做网站如何采集器wordpress
  • 襄阳网站建设企业查看 wordpress 插件
  • 网站地址申请京东联盟怎么做网站
  • 三亚市城乡建设局网站网站口碑营销
  • 图书租借网站 开发企业网站搜索优化外
  • 新乡个人网站建设哪家好免费的图片做视频在线观看网站
  • 洛阳工程建设信息网站山西响应式网页建设哪里好
  • 企业网站建设市场的另一面wordpress分类插件
  • 网站建设名头公司展厅装修
  • 小型购物网站开发费用郑州企业网站模板建站
  • 个体商户建自己的网站做销售建设积分兑换官方网站
  • 网站建设与维护培训网页制作专业用语
  • 建站特别慢wordpress网页制作与设计项目策划书
  • 视频制作素材免费网站头像制作在线生成器
  • 网站建设是不是可以免费建站广州做网站 信科网络
  • 闸北区网站设计叫别人做网站后怎么更改密码
  • 为什么想做网站运营建设工程教育网站
  • 站长基地百度推广整体优化网站
  • 门窗 东莞网站建设wordpress外链论坛
  • 安徽省建设部网站官网还能用的wap网站
  • 企业网站设计开发网站关键词优化seo
  • 郑州高档网站建设台州网站建设推广
  • 广东省建设信息港网站WordPress手机缩略图设置
  • 优秀网站主题平顶山专业做网站公司