当前位置：首页 > news >正文

江门专业网站制作公司手机访问网站建设中

news 2025/12/20 4:42:48

江门专业网站制作公司,手机访问网站建设中,网站样式下载,深圳旅游网站建设索引前言1. Zookeeper1.1 主机下载Zookeeper安装包1.2 主机解压Zookeeper1.3 ★解决解压后文件缺失1.4 主机配置Zookeeper文件1.4.1 配置zoo_sample.cfg文件1.4.2 配置/data/myid文件 1.5 主机传输Zookeeper文件到从机1.6 从机修改Zookeeper文件1.6.1 修改zoo.cfg文件1.6.2 修… 索引前言1. Zookeeper1.1 主机下载Zookeeper安装包1.2 主机解压Zookeeper1.3 ★解决解压后文件缺失1.4 主机配置Zookeeper文件1.4.1 配置zoo_sample.cfg文件1.4.2 配置/data/myid文件 1.5 主机传输Zookeeper文件到从机1.6 从机修改Zookeeper文件1.6.1 修改zoo.cfg文件1.6.2 修改myid文件 1.7 设置环境变量1.8 启动Zookeeper1.9 ★解决无法启动Zookeeper1.10 验证Zookeeper安装成功1.11 ★解决找不到JAVA_HOME 2. HBase2.1 主机下载HBase2.2 主机解压HBase2.3 主机配置HBase文件2.3.1 hbase-env.sh文件2.3.2 hbase-site.xml文件2.3.3 regionservers文件 2.4 主机配置环境变量2.5 主机最后的调整2.5.1 ★解决错误找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaProperty2.5.2 ★解决SLF4J... 2.6 主机传输HBase文件到从机2.7 主机启动HBase2.8 Hbase Shell2.9 终极HBase测试2.10 ★遇到解决不了的问题 3.Maven访问HBase3.1 主机下载Maven3.2 主机解压Maven3.3 配置环境变量3.4 设置阿里云镜像3.5 Maven项目3.5.1 创建项目3.5.2 如何编译项目3.5.3 如何测试项目3.5.4 如何打包项目3.5.5 如何安装项目 3.6 Eclipse打开Maven项目3.7 Maven访问HBase3.8 ★解决代码爆红3.9 ★虚拟机重启后需要进行的操作 4. HBase集群实验4.1 实验代码4.2 二班的修改4.3 解释HBase的逻辑结构和物理结构4.4 分析HBase的插入和MySQL的插入有何不同10分前言本篇博客内容大部分参考了涛哥的博客在此基础上进行了整合、补充以及融合了我自己的操作向学长表示敬意本次操作为什么说是操作不是实验呢因为这个不算课内的作业而是必须要完成的额外任务是在完成了【李老师云计算】实验一Hadoop伪分布式集群部署与Eclipse访问Hadoop进行单词计数统计的前提下进行的。后来又布置了一个新的实验也添加上了。共分成四大部分第一部分是Zookeeper的搭建第二部分是HBase的搭建第三部分是Maven访问以及第四部分HBase集群实验。带★的是可能遇到的问题可以看一下以防后续操作出问题。内容可能来自博主自己手搓、吸取同学的经验、网络上内容的整合等等仅供参考更多内容可以查看大三下速通指南专栏。 1. Zookeeper ZooKeeper是一个分布式应用程序协调服务是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件提供的功能包括配置维护、域名服务、分布式同步、组服务等。 1.1 主机下载Zookeeper安装包 Apache官方下载地址我下载的版本是apache-zookeeper-3.7.1-bin.tar 1.2 主机解压Zookeeper 将下载好的文件放到Master节点下的/usr/local/目录下在该目录下右键打开终端(确保路径是local)使用以下指令 tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz根据自己下载的版本修改之后再继续使用以下指令 mv apache-zookeeper-3.7.1-bin zookeeper来把目录的版本号去掉(方便之后的操作) 当然上面的操作也可以直接右键文件夹重命名为zookeeper。总之就是最终把解压出来的文件重命名为zookeeper即可。 1.3 ★解决解压后文件缺失如果从桌面向虚拟机拖文件可能压缩包没有完全的导入。如果出现了下面的错误反而不会导入失败只需要点击重试就可以了。如果说压缩包的大小不一样就说明导入时出现错误了可以尝试多导入几次或者用其他方法通过虚拟机获取。 1.4 主机配置Zookeeper文件 1.4.1 配置zoo_sample.cfg文件进入到/usr/local/zookeeper/conf目录下。首先把zoo_sample.cfg重命名为zoo.cfg同样两种方法使用下面的指令(确保此时终端位置是conf): cp zoo_sample.cfg zoo.cfg 或者直接右键重命名都可以。编辑zoo.cfg文件将第12行的dataDir/tmp/zookeeper并修改为dataDir/usr/local/zookeeper/data/。然后在文件末尾添加以下内容(注意把slave改成自己的slave主机名) server.10.0.0.0:2881:3881 server.2slave1-60:2881:3881 server.3slave2-60:2881:3881上面本机是0.0.0.0:2881:3881另外两台机器都是主机名:2881:3881。 1.4.2 配置/data/myid文件创建并配置/data/myid文件执行以下指令即可 mkdir -p /usr/local/zookeeper/data cd /usr/local/zookeeper/data touch myid vi myid打开myid文件后写入数字1 注意保证myid文件中只有数字1没有多余的内容(包括空格、换行、注释等)如果之后出现错误请查看此文件。 1.5 主机传输Zookeeper文件到从机因为配置Hadoop时已经关闭了防火墙这里默认已经关闭了。上面把master配置完了我们可以直接把所有的文件都传输给从机包括Zookeeper及其配置文件等。把下面slave1-xx以及slave2-xx修改为自己的即可。 scp -r /usr/local/zookeeper slave1-60:/usr/local scp -r /usr/local/zookeeper slave2-60:/usr/local1.6 从机修改Zookeeper文件虽然传过来了配置文件但是还是要进行修改 1.6.1 修改zoo.cfg文件文件的路径是/usr/local/zookeeper/conf/zoo.cfg 打开以后dataDir我们已经在主机修改过了就不需要修改了。把刚才在文件末尾添加的三行修改为以下内容(根据自己的slave主机名修改) slave1: server.1master60:2881:3881 server.20.0.0.0:2881:3881 server.3slave2-60:2881:3881slave2: server.1master60:2881:3881 server.2slave1-60:2881:3881 server.30.0.0.0:2881:38811.6.2 修改myid文件文件的路径是/usr/local/zookeeper/data/myid 在slave1中内容修改为数字2在slave2中内容修改为数字3。注意保证myid文件中只有数字2或3没有多余的内容(包括空格、换行、注释等)如果之后出现错误请查看此文件。 1.7 设置环境变量在三台虚拟机上都进行以下的操作vi ~/.bashrc进入.bashrc文件。在文件末尾添加以下内容并wq保存退出 export PATH$PATH:/usr/local/zookeeper/bin 最后使用source ~/.bashrc来刷新环境变量。在三台虚拟机都完成了以上操作之后进行下一步。 1.8 启动Zookeeper Zookeeper的命令如下启动命令 zkServer.sh start 重启命令 zkServer.sh restart 关闭命令 zkServer.sh stop 状态命令 zkServer.sh status在三台虚拟机上都使用指令打开Zookeeper: zkServer.sh start 如果每个节点都显示以下提示说明到这里为止没什么问题。使用zkServer.sh status查看状态可以发现其中一个是Mode:leader另外两个是Mode:follower谁是leader无所谓不必在意。 1.9 ★解决无法启动Zookeeper Zookeeper运行产生的data数据都在刚才创建的/usr/local/zookeeper/data/目录中如果没有使用zkServer.sh stop关闭Zookeeper而关闭虚拟机可能会产生问题此时删除该目录下除myid以外的所有文件即可。 1.10 验证Zookeeper安装成功在master使用以下指令(修改为自己的master主机名) zkCli.sh -server master60:2181 之后会出现以下的命令框依次使用下面指令对照下图即可 create /nihao nihao!get /nihaoquit 至此Zookeeper成功安装。 1.11 ★解决找不到JAVA_HOME 如果没有遇到这个问题就别改找到一个JDK路径添加进去vi /etc/profile(不要直接复制粘贴下面的) 注意区别JDK和JREJDK的目录里有bin文件也有JRE文件然后JRE里还有一个bin文件。我这里用的应该是当时用yum指令生成的另一个JDK。在里面添加 JAVA_HOMEjava-1.8.0-openjdk-1.8.0.362.b08-1.el7_9.x86_64 JRE_HOMEjava-1.8.0-openjdk-1.8.0.362.b08-1.el7_9.x86_64/jre PATH$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib地址一定是JDK而不是JRE。JDK文件里有一个bin并且有一个jre并且jre里也有一个bin具体什么是JDK什么是JRE请参考菜鸟教程。 source /etc/profile刷新。 2. HBase 2.1 主机下载HBase Apache官方下载地址我下载的版本是hbase-2.2.2-bin.tar.gz 2.2 主机解压HBase 将下载好的文件放到Master节点下的/usr/local/目录下. 在该目录下右键打开终端(确保路径是local)使用以下指令 tar -zxvf hbase-2.2.2-bin.tar.gz根据自己下载的版本修改之后再继续使用以下指令 mv /usr/local/hbase-2.2.2 /usr/local/hbase来把目录的版本号去掉(方便之后的操作) 当然上面的操作也可以直接右键文件夹重命名为hbase。总之就是最终把解压出来的文件重命名为hbase即可。 2.3 主机配置HBase文件目录的路径是/usr/local/hbase/conf直接通过GUI进行操作即可。 2.3.1 hbase-env.sh文件文件末尾添加以下内容根据自己的情况修改。 export JAVA_HOME/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.242.b08-1.el7.x86_64 export HBASE_CLASSPATH/user/hadoop/hadoop-3.3.1/etc/hadoop export HBASE_MANAGES_ZKfalseJAVA_HOME之前配置过如Hadoop的/etc/hadoop中hadoop-env.sh中有出现过。· HBASE_CLASSPATH后面是Hadoop/etc/hadoop请根据自己Hadoop的路径修改。 2.3.2 hbase-site.xml文件文件末尾添加以下内容根据自己的情况修改。注意!configuration标签在文件中已经给出请覆盖掉否则会出现错误。主要是把value标签内的东西给修改成自己的 configurationpropertynamehbase.cluster.distributed/name valuetrue/value /propertypropertynamehbase.rootdir/namevaluehdfs://Master60:9000/hbase/value /propertypropertynamehbase.zookeeper.quorum/namevalueMaster60,Slave1-60,Slave2-60/valuedescriptionThe directory shared by RegionServers. /description/propertypropertynamehbase.unsafe.stream.capability.enforce/namevaluefalse/value/propertypropertynamehbase.zookeeper.property.dataDir/namevalue/usr/local/zookeeper/value/property /configurationhdfs://Master60:9000/hbase的端口一般就是9000如果在Hadoop中修改过请查看Hadoop/etc/hadoopcore-site.xml文件。 2.3.3 regionservers文件删掉原有的localhost添加两台从机的主机名 slave1-60 slave2-602.4 主机配置环境变量使用指令vi ~/.bashrc 添加下面的内容 export HBASE_HOME/usr/local/hbase export PATH$HBASE_HOME/bin:$PATH export PATH$HBASE_HOME/lib:$PATH并source ~/.bashrc刷新。 2.5 主机最后的调整使用hbase version指令可能出现的错误有以下两种下面依次讲解如何解决以上错误 2.5.1 ★解决错误找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaProperty 进入到usr/local/hbase/bin目录下我们来修改hbase文件。共修改四处。首先在大概327行附近修改两处第一处在if [ -n ${HADOOP_IN_PATH} ] [ -f ${HADOOP_IN_PATH} ]; then下面添加的代码如下 # If built hbase, temporarily add hbase-server*.jar to classpath for GetJavaProperty# Exclude hbase-server*-tests.jartemporary_cpfor f in ${HBASE_HOME}/lib/hbase-server*.jar; doif [[ ! ${f} ~ ^.*\-tests\.jar$ ]]; thentemporary_cp:$ffidone第二处将HADOOP_JAVA_LIBRARY_PATH$(HADOOP_CLASSPATH$CLASSPATH ${HADOOP_IN_PATH} \修改为HADOOP_JAVA_LIBRARY_PATH$(HADOOP_CLASSPATH$CLASSPATH${temporary_cp} ${HADOOP_IN_PATH} \ 最后第三处、第四处在大概187行附近第三处在下面代码的下面 add_to_cp_if_exists ${HBASE_HOME}/hbase-server/targetfi fi添加以下内容 # Needed for GetJavaProperty check below add_to_cp_if_exists ${HBASE_HOME}/hbase-server/target/classes第四处把一段代码删除要删除的代码如下 #add the hbase jars for each modulefor f in $HBASE_HOME/hbase-jars/hbase*.jar; doif [[ $f *sources.jar ]]then: # Skip sources.jarelif [ -f $f ]thenCLASSPATH${CLASSPATH}:$f;fidone2.5.2 ★解决SLF4J… 具体原因就是hadoop和hbase都有同一个jar包所以产生了冲突因此只需要删除其中一个就可以了这里删除hbase的文件。因为rm -rf指令删除无法恢复请确保路径正确如果错误删除只能重新解压HBase开始做。后面的路径最好是直接复制报错中出现的 rm -rf /usr/local/hbase/lib/client-facing-thirdparty/slf4j-log4j12-1.7.25.jar 2.6 主机传输HBase文件到从机先把HBase传给从机(改为自己的主机名) scp -r /usr/local/hbase slave1-60:/usr/local/ scp -r /usr/local/hbase slave2-60:/usr/local/把配置文件也传给从机 scp -r ~/.bashrc slave1-60:~ scp -r ~/.bashrc slave2-60:~记得给从机刷新一下配置文件:source ~/.bashrc。 2.7 主机启动HBase 一定要记住这条常用的命令启动HBase集群: start-hbase.sh 关闭HBase集群: stop-hbase.sh 在主机启动HBase。 jps看一下主机有没有HMaster以及QuorumPeerMain。从机有没有QuorumPeerMain以及HRegionServer 2.8 Hbase Shell 使用指令hbase shell 在内置命令行输入version以及status来测试。 2.9 终极HBase测试打开浏览器输入网址192.168.64.60:16010(主机名或IP:16010)能打开这个并且看到两台机器就没啥问题了。还能看到Zookeeper的设置 2.10 ★遇到解决不了的问题当你肯定自己的配置文件一点问题也没有但是还是无法成功运行。重启三台虚拟机然后再(3.9) 打开Hadoop 主机使用start-all.sh 打开Zookeeper 三台虚拟机使用 zkServer.sh start; 打开HBase 主机使用 start-hbase.sh。 3.Maven访问HBase 3.1 主机下载Maven Apache官方下载地址我下载的版本是apache-maven-3.6.3-bin.tar.gz 3.2 主机解压Maven 将下载好的文件放到Master节点下的/usr/local/目录下. 在该目录下右键打开终端(确保路径是local)使用以下指令 tar -zxvf apache-maven-3.6.3-bin.tar.gz根据自己下载的版本修改之后再继续使用以下指令 mv /usr/local/apache-maven-3.6.3 /usr/local/maven来把目录的版本号去掉(方便之后的操作) 当然上面的操作也可以直接右键文件夹重命名为maven。总之就是最终把解压出来的文件重命名为maven即可。 3.3 配置环境变量使用指令vi /etc/profile 文件末尾添加 MAVEN_HOME/usr/local/maven PATH$PATH:$MAVEN_HOME/bin export PATH MAVEN_HOME刷新source /etc/profile 查看一下mvn -version 3.4 设置阿里云镜像这个是为了加快依赖包的下载。此时的文件路径是/usr/local/maven/conf/ 打开settings.xml大概在151行附近的mirrors标签中添加以下内容 mirroridaliyunmaven/idmirrorOf*/mirrorOfname阿里云公共仓库/nameurlhttps://maven.aliyun.com/repository/public/url /mirror3.5 Maven项目这一步可以只做3.5.1后面的想试一下也可以。3.6的开始会把3.5.1以外产生的文件全部清除。 3.5.1 创建项目创建一个工作目录mkdir -p ~/workspace/source 进入workspace/source中右键终端。使用指令mvn archetype:generate。如果提示没有mvn再用一遍source /etc/profile。之后会让你手动输入几个参数如果想了解一下具体Maven模板是什么可以看菜鸟教程。包括gtoupId、artifactId、version、package。我分别用的com.test、maven_test、回车、main(用maven-archetype-quickstart没编译成功因此后面改成了main) 最后会出现一个Y直接回车就可以最后看到BUILD SUCCESS。最终成功之后我们可以看到source里出现了一个新的目录目录名是刚才设置的artifactId参数。 3.5.2 如何编译项目进入生成的目录具体路径是/workspace/source/maven_test 右键打开终端输入指令mvn compile 我这边总是莫名奇妙用不了mvn然后刷新一次才可以用。可以看到生成了一个target目录 3.5.3 如何测试项目路径仍然是/workspace/source/maven_test 右键终端使用指令mvn test 在target目录里又会生成test-classes目录。 3.5.4 如何打包项目路径仍然是/workspace/source/maven_test 右键终端使用指令mvn package 在target目录内生成了maven_test-1.0-SNAPSHOT.jar压缩包 3.5.5 如何安装项目路径仍然是/workspace/source/maven_test 右键终端使用指令mvn install 安装到的路径如上红框所示。 3.6 Eclipse打开Maven项目路径仍然是/workspace/source/maven_test 右键终端使用指令mvn clean 此时targer目录被清除。执行下面两条指令 cd ~/.m2 chmod 777 repository之后我们打开eclipse进入以后之后这里的User Settings打开的是maven的conf/settings.xml如果按照上面来位置应该是/usr/local/maven/conf/settings.xml。点击Apply继续下一个设置。这里的路径是maven所在的位置。然后选择刚创建的这个最后我们去给当时创建Maven项目时自动产生的App.java修改权限。chmod 777 App.java 3.7 Maven访问HBase 先把hbase拷贝一份给maven的工作目录 cp -a /usr/local/hbase ~/workspace/source/maven_test/HBase/ 然后再Eclipse中打开项目。之后打开这个maven_test项目再继续配置把所有jar包给加载了如果你有class xx和model xx导入到class里我这里是没有这两个文件夹的。可以先ctrlA全选ctrl鼠标左键把目录(没有文件大小的)给取消了然后就可以导入了。然后再打开目录把目录里的jar包也给导入了。在maven_test建一个conf目录复制一份文件(直接复制也行) cp -a ~/workspace/source/maven_test/HBase/conf/hbase-site.xml ~/workspace/source/maven_test/conf/ 给pom.xml开个权限 chmod 777 ~/workspace/source/maven_test/pom.xml 按照下图再添加一下如果找不到右键项目文件(maven_test)然后刷新(Refresh)。重新回到Eclipse在pom.xml中新加一个dependency标签 dependencygroupIdorg.slf4j/groupIdartifactIdslf4j-simple/artifactIdversion1.7.25/versionscopecompile/scope /dependency打开App.java键入以下代码里面有一个主机名修改成自己的。 package main;import java.io.IOException;import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.hadoop.hbase.HTableDescriptor; import org.apache.hadoop.hbase.TableName; import org.apache.hadoop.hbase.client.Admin; import org.apache.hadoop.hbase.client.Connection; import org.apache.hadoop.hbase.client.ConnectionFactory; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.regionserver.BloomType; import org.apache.hadoop.hbase.util.Bytes;public class App {static Configuration confHBaseConfiguration.create(); static Connection connection;public static void main( String[] args ){ String tablenamehbase_tb; try { App.getConnect(); App.createTable(tablename); App.addData(tablename);}catch (Exception e) { e.printStackTrace(); } }public static void getConnect() throws IOException{conf.set(hbase.zookeeper.quorum, master60);conf.set(hbase.zookeeper.property.clientPort, 2181);//conf.set(zookeeper.znode.parent, /hbase);try{ connectionConnectionFactory.createConnection(conf); }catch(IOException e){ } }//创建一张表通过HBaseAdmin HTableDescriptor来创建 public static void createTable(String tablename) throws Exception { TableName tableName TableName.valueOf(tablename);Admin admin connection.getAdmin(); if (admin.tableExists(tableName)) {admin.disableTable(tableName);admin.deleteTable(tableName);System.out.println(tablename table Exists, delete ......); } SuppressWarnings(deprecation)HTableDescriptor desc new HTableDescriptor(tableName); SuppressWarnings(deprecation)HColumnDescriptor colDesc new HColumnDescriptor(cf1);colDesc.setBloomFilterType(BloomType.ROWCOL);desc.addFamily(colDesc); desc.addFamily(new HColumnDescriptor(cf2)); admin.createTable(desc); admin.close();System.out.println(create table success!); } public static void addData(String tablename) throws Exception { HTable table (HTable)connection.getTable( TableName.valueOf(tablename));Put p1new Put(Bytes.toBytes(row1)); //row key p1.addColumn(Bytes.toBytes(cf1), Bytes.toBytes(name), Bytes.toBytes(Tom)); p1.addColumn(Bytes.toBytes(cf1), Bytes.toBytes(age), Bytes.toBytes(12)); p1.addColumn(Bytes.toBytes(cf2), Bytes.toBytes(math), Bytes.toBytes(80)); p1.addColumn(Bytes.toBytes(cf2), Bytes.toBytes(english), Bytes.toBytes(90)); table.put(p1);table.close();} }其中向这个分布式数据库中添加的数据是最终呈现的结果是最后检查一下终端输入hbase shell之后使用get hbase_tb,row1来获取数据库内容。 3.8 ★解决代码爆红比较玄学我也没搞明白我再pom.xml里添加了两个依赖不爆红了但是不能运行然后我又删了也不爆红也能运行了…… dependencygroupIdorg.apache.hbase/groupIdartifactIdhbase-server/artifactIdversion1.3.1/version /dependency dependencygroupIdorg.apache.hbase/groupIdartifactIdhbase-client/artifactIdversion1.3.1/version /dependency3.9 ★虚拟机重启后需要进行的操作打开Hadoop 主机使用start-all.sh 打开Zookeeper 三台虚拟机使用 zkServer.sh start; 打开HBase 主机使用 start-hbase.sh。 4. HBase集群实验下面是实验的描述分的小标题混乱、不知所云也不知从哪里冒出一个学生信息(下面代码里没写)表内容写的也抽象后来才明白是一班的同学写教师表二班的同学写辅导员表下面给出的是教师表用辅导员表的同学只需要改一下参数就好了没有很大的难度。 1. 搭建HBase集群一主两从给出网页的截屏15分。 2. Eclispe/Idea Maven项目访问HBase 2.1 表内容 1班教师基本信息年龄、性别、职称、职务科研信息发表文章数、横向项目数、纵向项目数。注意职务和科研信息中的所有属性根据实际确定。 2班辅导员基本信息年龄、性别、职称、职务业绩信息红旗班次数、考研率超额次数、就业率超额次数。注意业绩信息根据实际填写。 2. 源程序评分 2.0 导入包和程序结构10分 2.1 创建表源程序和运行结果的截屏10分 2.2 添加三个典型行记录的源程序和运行结果后在HBase shell中看到的结果截屏20分 2.3 浏览所有记录的源程序和运行结果后HBase看到的结果截屏10分 3. 在HBase Shell浏览所有的学生信息10分 4. 根据浏览到的信息解释HBase的逻辑结构和物理结构15分 5. 分析HBase的插入和MySQL的插入有何不同10分。4.1 实验代码实际上就是上面代码的一个改进版然后又多加了一个Teacher类(二班同学应该是Counselor类)。先给出一个项目栏的截图新建一个Teacher Class这里直接用的public String是为了减少麻烦。 package main;public class Teacher {public String name;public String age;public String gender;public String title;public String position;public String articleCount;public String horizontalProjectCount;public String verticalProjectCount;// 构造函数public Teacher(String name, String age, String gender, String title, String position,String articleCount, String horizontalProjectCount, String verticalProjectCount) {this.name name;this.age age;this.gender gender;this.title title;this.position position;this.articleCount articleCount;this.horizontalProjectCount horizontalProjectCount;this.verticalProjectCount verticalProjectCount;}// getter 和 setter 方法// ... } 以及App.java的内容 package main;import java.io.IOException;import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.hadoop.hbase.HTableDescriptor; import org.apache.hadoop.hbase.TableName; import org.apache.hadoop.hbase.client.Admin; import org.apache.hadoop.hbase.client.Connection; import org.apache.hadoop.hbase.client.ConnectionFactory; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.regionserver.BloomType; import org.apache.hadoop.hbase.util.Bytes;public class App {static Configuration confHBaseConfiguration.create(); static Connection connection;public static void main( String[] args ){ String tablenameTeacher; try { App.getConnect(); App.createTable(tablename); Teacher t1 new Teacher(Jack,54,m,AssociateProfessor,Teacher,2,2,2);Teacher t2 new Teacher(Amy,45,m,AssociateProfessor,Teacher,4,4,4);Teacher t3 new Teacher(Mike,40,m,Professor,Teacher,6,6,6);App.addData(tablename,t1,row1);App.addData(tablename,t2,row2);App.addData(tablename,t3,row3);}catch (Exception e) { e.printStackTrace(); } }public static void getConnect() throws IOException{conf.set(hbase.zookeeper.quorum, master60);conf.set(hbase.zookeeper.property.clientPort, 2181);//conf.set(zookeeper.znode.parent, /hbase);try{ connectionConnectionFactory.createConnection(conf); }catch(IOException e){ } }//创建一张表通过HBaseAdmin HTableDescriptor来创建 public static void createTable(String tablename) throws Exception { TableName tableName TableName.valueOf(tablename);Admin admin connection.getAdmin(); if (admin.tableExists(tableName)) {admin.disableTable(tableName);admin.deleteTable(tableName);System.out.println(tablename table Exists, delete ......); } SuppressWarnings(deprecation)HTableDescriptor desc new HTableDescriptor(tableName); SuppressWarnings(deprecation)HColumnDescriptor colDesc new HColumnDescriptor(basic_info);colDesc.setBloomFilterType(BloomType.ROWCOL);desc.addFamily(colDesc); desc.addFamily(new HColumnDescriptor(research_info)); admin.createTable(desc); admin.close();System.out.println(create table success!);} public static void addData(String tablename,Teacher t,String key) throws Exception { HTable table (HTable)connection.getTable( TableName.valueOf(tablename));Put pnew Put(Bytes.toBytes(key)); //row key p.addColumn(Bytes.toBytes(basic_info), Bytes.toBytes(name), Bytes.toBytes(t.name)); p.addColumn(Bytes.toBytes(basic_info), Bytes.toBytes(age), Bytes.toBytes(t.age)); p.addColumn(Bytes.toBytes(basic_info), Bytes.toBytes(gender), Bytes.toBytes(t.gender)); p.addColumn(Bytes.toBytes(basic_info), Bytes.toBytes(title), Bytes.toBytes(t.title)); p.addColumn(Bytes.toBytes(basic_info), Bytes.toBytes(position), Bytes.toBytes(t.position)); p.addColumn(Bytes.toBytes(research_info), Bytes.toBytes(articleCount), Bytes.toBytes(t.articleCount)); p.addColumn(Bytes.toBytes(research_info), Bytes.toBytes(horizontalProjectCount), Bytes.toBytes(t.horizontalProjectCount)); p.addColumn(Bytes.toBytes(research_info), Bytes.toBytes(verticalProjectCount), Bytes.toBytes(t.verticalProjectCount)); table.put(p);table.close();} } 其中信息是通过构造函数直接搞得在这里修改成自己的内容还有表名也在这里修改↑ 这里也改成自己的最后打开进入hbase shell使用指令scan Teacher来查看 4.2 二班的修改首先把教师类改成辅导员类大概把下面三个参数的名改了不改的话就和上面差不多做。如果把参数的名改了记得修改下面的部分。 4.3 解释HBase的逻辑结构和物理结构 1. 逻辑结构- 表TableHBase 数据库中的基本单元由多行和多列族组成每行有唯一的行键Row Key每个列族包含多个列Column。 - 行RowHBase 表中的数据按行存储每行都有唯一的行键行键按照字典序排序可以通过行键查找数据。 - 列族Column FamilyHBase 表中的数据按列族组织每个列族包含多个列每个列都有一个唯一的列名Column Name列名和列值一起构成了列。 - 列ColumnHBase 表中的数据由多个列组成每个列由列名、时间戳和列值组成列名和列值都是字节数组时间戳是 long 类型的整数。2. 物理结构- Region ServerHBase 的数据存储和查询都是通过 Region Server 来完成的Region Server 是 HBase 集群中的一个节点每个 Region Server 管理多个 Region。 - RegionHBase 表的数据被分为多个 Region 存储每个 Region 是一段连续的行每个 Region 包含一个主列族和多个次列族Region 的大小由 HBase 的配置参数决定通常在几百 MB 到几 GB 之间。 - HFileHBase 数据在磁盘上是按 HFile 的格式存储的HFile 是 HBase 中的一个重要的数据结构它是一个稠密的、可变长的文件格式用于存储一段连续的行。 - WALHBase 中的写操作会先写入 Write Ahead LogWALWAL 是一种顺序写入的、不可修改的日志用于保证数据写入的可靠性和一致性。4.4 分析HBase的插入和MySQL的插入有何不同10分 1. 数据模型- MySQL 是关系型数据库其数据存储在表格中每个表格由一组列和行组成每行代表一个记录每列代表一个属性。 - HBase 是基于列族的 NoSQL 数据库其数据存储在表格中每个表格由多个列族和行组成每行代表一个记录每个列族下包含多个列每个列可以包含多个版本。2. 插入方式- MySQL 的插入操作是通过 SQL 语句实现的使用 INSERT INTO 语句将数据插入到指定的表格中。 - HBase 的插入操作是通过 Java API 或 HBase shell 命令实现的使用 Put 操作将数据插入到指定的表格中。3. 数据存储- MySQL 的数据是存储在硬盘中的每次插入数据时MySQL 会将数据写入磁盘。 - HBase 的数据是存储在内存中和硬盘中的每次插入数据时HBase 会将数据先写入内存中的 MemStore当 MemStore 中的数据达到一定大小时会将数据写入硬盘中的 HFile 中。4. 性能- MySQL 的插入操作通常比 HBase 的插入操作更快因为 MySQL 的数据存储方式更简单且 MySQL 的数据通常是存储在本地磁盘上的而 HBase 的数据存储在内存中和硬盘中写入操作需要更多的计算资源和磁盘 I/O。 - HBase 的查询操作通常比 MySQL 的查询操作更快因为 HBase 的数据存储方式更适合于大规模数据的存储和查询且 HBase 支持快速的随机读取和扫描操作。

查看全文

http://www.w-s-a.com/news/575399/