汕头网站建设维护,佛山网上推广,南京网站优化平台,网店怎么开需要什么条件安装需求
基本硬件配置建议#xff1a; CPU 4核或以上#xff08;LSF 没有最低 CPU 需求#xff0c;此处只是建议#xff09;内存 8G或以上#xff08; 当没有作业在运行时#xff0c; Linux x86-64 上集群中的 LSF 守护程序将使用大约 488 MB 内存。#xff09;交换…安装需求
基本硬件配置建议 CPU 4核或以上LSF 没有最低 CPU 需求此处只是建议内存 8G或以上 当没有作业在运行时 Linux x86-64 上集群中的 LSF 守护程序将使用大约 488 MB 内存。交换空间通常配置为物理内存的两倍节点硬件资源的高低取决于集群运行作业的多少、作业类型偏向于CPU、还是偏向于内存 LSF管理节点的配置要求可以参考官方说明Management host selection操作系统要求: 官方正式支持的各种系统常用为Linux系统。配置共享存储。用户统一管理, 提前设置好LSF管理用户lsfadmin或者一个普通用户。集群需要时间同步。root用户可以免密从管理节点到其他节点运行ssh。 节点之间要求双向解析主机和IP。
环境说明
本示例中的IP规划如下 主机名 LSF集群相关服务 IP lsf-master1 LSF管理节点 192.168.75.154 lsf-master2 LSF候选管理节点 192.168.75.155 compute LSF计算节点 192.168.75.156
配置安装LSF前的相关服务
域名解析
保证计算节点之间能正常解析和反解析IP/hostname。
本示例中为配置本地域名解析修改每个节点中的/etc/hosts文件操作如下
# tail -3 /etc/hosts
192.168.75.154 lsf-master1
192.168.75.155 lsf-master2
192.168.75.156 compute
配置ssh免密登录
root用户能够从管理节点通过ssh无密码访问新节点方便从管理节点在新节点远程启动LSF。如果是有密码访问机器少还可以输入密码但是大的集群还是配置无密码访问效率更高。
免密设置可参考如下操作
[rootlsf-master1 ~]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory /root/.ssh.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:4KYpiQOAFK7E1oDsOq1iNOofqea4vlUmkcm65F7St8 rootlsf-master1
The keys randomart image is:
---[RSA 2048]----
| . |
| . |
| . |
|o . . |
| oo . S |
|oo. . |
|*ooX . . |
|*.*.. |
|BOB..E |
----[SHA256]-----
[rootlsf-master1 ~]# ssh-copy-id rootlsf-master2
......
rootlsf-master2s password: # 此处输入lsf-master2密码
[rootlsf-master1 ~]# ssh-copy-id rootcompute
......
rootcomputes password: # 此处输入compute密码
时间同步
确保每个节点时间相同防止认证失败。
请确认集群各节点时间服务器是否一致可以查看/etc/chrony.conf文件。参考如下
# grep server /etc/chrony.conf
server xx.xx.xx.xx prefer iburst minpoll 4 maxpoll 4
配置NFS挂载
LSF安装在共享存储上每个计算节点挂载即可使用无需再次安装。
(1)设置共享目录
[rootlsf-master1 ~]# mkdir /tools/[rootlsf-master1 ~]# echo /tools/ *(rw,sync,no_root_squash) /etc/exports
(2)启动rpcbind服务并设置开机启动
[rootlsf-master1 ~]# systemctl enable rpcbind --now
(3)启动nfs服务并设置开机启动
[rootlsf-master1 ~]# systemctl restart nfs-server
(4)查看挂载状态
[rootlsf-master1 ~]# showmount -e localhostExport list for localhost:/tools/ *
账户管理
可以使用OpenLDAP/NIS来统一管理用户保证同一个用户在每个节点上有相同的UID。
本示例中为便捷操作使用useradd、groupadd创建UID、GID一致的管理员账户。步骤参考如下所示
(1)创建集群管理组
groupadd -g 2001 lsf
(2)创建集群管理用户
useradd -u 2000 -G lsf lsfadmin
安装LSF
lsf-master节点解压修改配置
(1)进入LSF安装包所在的位置。
(2)解压 lsfsce10.2.0.12-x86_64.tar.gz
[rootlsf-master1 ~]# cd /tmp[rootlsf-master1 tmp]# ls lsfsce10.2.0.12-x86_64.tar.gzlsfsce10.2.0.12-x86_64.tar.gz[rootlsf-master1 tmp]# tar -xf lsfsce10.2.0.12-x86_64.tar.gz[rootlsf-master1 tmp]# ls lsfsce10.2.0.12-x86_64/lsf/lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z # LSF运行时使用的包lsf10.1_lsfinstall_linux_x86_64.tar.Z # 安装引导包
(3)解压lsf10.1_lsfinstall_linux_x86_64.tar.Z
[rootlsf-master1 tmp]# cd lsfsce10.2.0.12-x86_64/lsf/[rootlsf-master1 lsf]# tar xzf lsf10.1_lsfinstall_linux_x86_64.tar.Z[rootlsf-master1 lsf]# lslsf10.1_linux2.6-glibc2.3-x86_64.tar.Z lsf10.1_lsfinstall lsf10.1_lsfinstall_linux_x86_64.tar.Z[rootlsf-master1 lsf]# cd lsf10.1_lsfinstall/[rootlsf-master1 lsf10.1_lsfinstall]#
(4)编辑安装配置文件
[rootlsf-master1 lsf10.1_lsfinstall]# vim install.config# 设置安装路径LSF_TOP/tools/lsf # 设置管理员账号以实际管理员名称为准LSF_ADMINSlsfadmin # 设置集群名称LSF_CLUSTER_NAMEcluster1 # master机器列表如果有多台机器建议设置两台master作为冗余备份LSF_MASTER_LISTlsf-master1 lsf-master2 # 指定安装文件lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z路径LSF_TARDIR/tmp/lsfsce10.2.0.12-x86_64/lsf # 添加计算机节点机器也可以安装后配置LSF_ADD_SERVERSlsf-master1 lsf-master2 compute # 添加客户机投递机节点也可以安装后配置#LSF_ADD_CLIENTS
LSF安装
(1)安装lsf集群需要的安装包根据系统版本不同可能会缺少依赖需要的依赖安装过程中会在页面显示。通过root用户来安装。
[rootlsf-master1 lsf10.1_lsfinstall]# yum -y install java nfs-utils java-openjdk ed[rootlsf-master1 lsf10.1_lsfinstall]# ./lsfinstall -f install.config
(2)配置系统开机自启方式
[rootlsf-master1 lsf10.1_lsfinstall]# /tools/lsf/10.1/install/hostsetup --top/tools/lsf --profiley --booty[rootlsf-master1 ~]# systemctl enable lsfd --now
(3)查看LSF环境变量
[rootlsf-master1 lsf10.1_lsfinstall]# . /tools/lsf/conf/profile.lsf[rootlsf-master1 lsf10.1_lsfinstall]# env | grep lsfMANPATH/tools/lsf/10.1/man:HOSTNAMElsf-master1LSF_SERVERDIR/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/etcOLDPWD/root/lsfsce10.2.0.12-x86_64/lsfLSF_LIBDIR/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/libLD_LIBRARY_PATH/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/libPATH/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/etc:/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/binPWD/root/lsfsce10.2.0.12-x86_64/lsf/lsf10.1_lsfinstallLSF_BINDIR/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/binLSF_ENVDIR/tools/lsf/conf
LSF启动
在计算节点挂载共享存储
# mkdir /tools# echo 192.168.75.159:/tools /tools nfs defaults 0 0 /etc/fstab# mount -a# df -hT | grep /tools172.31.27.152:/tools nfs4 20G 8.0G 12G 41% /tools# su - lsfadmin# . /tools/lsf/conf/profile.lsf
在lsf.conf文件中添加如下内容
LSF_RSHssh
启动用root用户操作
# lsfstartup
验证用普通用户操作
$ lsload
$ bhosts