静态网站开发考虑什么,国内WordPress相册插件,东莞市网络推广怎么样,泰州seo白屏#xff1a; 集群、Zone、Observer 常用运维操作 常用运维操作
运维场景步骤时钟同步 OceanBase从Partition的多个副本中选出主对外提供服务。为避免Paxos的活锁问题#xff0c;OceanBase 采用一种基于时钟的选举算法选主 检查 NTP 状态#xff1a;运行 ntpstat 检查 N…白屏 集群、Zone、Observer 常用运维操作 常用运维操作
运维场景步骤时钟同步 OceanBase从Partition的多个副本中选出主对外提供服务。为避免Paxos的活锁问题OceanBase 采用一种基于时钟的选举算法选主 检查 NTP 状态运行 ntpstat 检查 NTP 服务器状态。如果结果为 synchronised to NTP server则可以认定 NTP 的配置处于同步状态 检查 NTP 的偏移量多次执行 ntpq -p|grep -E “\*|\|remote“ 命令确保可以看到稳定的 offset。若 offset 值小于 50ms 则为时钟同步正常 内存不足 OB是准内存数据库任何写操作都需要消耗内存资源只有合并和转储操作能够释放内存资源所以当合并和转储速度长时间低于内存消耗速度时内存最终将被耗尽服务能力跌零调大租户内存 转储 / 合并 外存磁盘不足 运行日志盘满可清空较老的日志clog盘满查询表__all_virtual_server_clog_stat清除较老的日志再合并数据文件满扩容或将较老的数据迁移到历史库再合并
黑屏集群运维管理
在集群中启动或停止Zone的操作通常用于允许或禁止Zone内的所有物理服务器对外提供服务的需求场景
启动或停止Zone:
alter system start zone zone1;
alter system stop zone zone1;修改Zone信息
ALTER SYSTEM {ALTER|CHANGE|MODIFY} ZONE [Zone_Name] SET [Zone_Option_List];
Zone_option_list : region, IDC, Zone_type (READONLY, READWRITE)
查看Zone的状态
Select * from __all_zone;
黑屏Observer运维管理
查看OBServer的信息
select * from __all_server;
select * from __all_server_event_history;管理OBServer状态 进程启动后对OBServer的管理类似对Zone的管理
Start Server操作
ALTER SYSTEM START SERVER ip:port [,ip:port…] [ZONEzone];
示例alter system start server 192.168.100.1:2882;Start Server操作
ALTER SYSTEM START SERVER ip:port [,ip:port…] [ZONEzone];
示例alter system start server 192.168.100.1:2882;Stop Server操作
ALTER SYSTEM STOP SERVER ip:port [,ip:port…] [ZONEzone];
示例alter system stop server 192.168.100.1:2882 zonez1;黑屏Observer服务管理进程
查看OBServer进程登录OceanBase Server所在的宿主机
ps -ef |grep observer
启动OBServer进程登录 OceanBase Server主机
cd /home/admin/oceanbase/
./bin/observer [启动参数]
./bin/observer --help 查看 OBServer 启动参数的详细信息停止 OBServer 进程
kill -15 pgrep observer
kill -9 pgrep observer黑屏Observer服务启动恢复
由于增删改数据在内存中进程启动后
需要与其他副本同步将clog或者ssd基线数据进行同步补齐
需要将上一次合并之后的内存数据恢复出来clog回放才能提供服务
注意事项
停机时间短分钟或者小时级别一般只追齐clog
停机时间长天级别clog落后太多会直接追齐ssd基线数据然后补齐合并版本后的clog
这一过程结束后该OBServer才能对外提供服务可以查询__all_server 表的start service time字段来判断OBServer是否对外提供服务
可以在停止OBServer服务前执行转储alter system minor freeze;以加快 OBServer 服务恢复过程
黑屏服务停止停机运维
机器需要运维操作时需要停止OceanBase服务进程
1. 系统租户登陆确定运维时长如果大于1小时但小于1天为了避免服务恢复后的补副本操作需要设置永久下线时间 alter system set server_permanent_offline_time 86400s’;
2. 将服务从当前 OBServer 切走保证停服务的时候对于业务没有影响alter system stop serverip地址:2882;内含切主动作
3.检查主副本都切走select count(*) from __all_virtual_table t, __all_virtual_meta_table m where t.table_idm.table_id and role1 and m.svr_ipip地址 ; 返回值应为0
4. 停止进程 kill -15 observer pid
黑屏服务恢复停机运维结束
机器需要运维操作结束后需要恢复OceanBase服务进程
机器上电检查该机器ntp同步状态和服务运行情况admin用户启动OBServer进程系统租户登陆启动serveralter system start server ‘ip地址2882’检查__all_server表查看status为‘active’且‘start_service_time’的值0,则表示OBServer正常启动并开始提供服务将永久下线时间改回默认值3600s alter system set server_permanent_offline_time 3600s’;
黑屏故障节点替换
首先要确保集群中有足够的冗余资源OBServer可以代替故障节点进行工作 1.系统租户登陆stop server确保主副本都切走
2. 为目标zone添加新的serveralter system add server ip地址:2882 ZONE zone1;
3. 将故障server下线alter system delete server ip地址:2882 ZONE zone1; OB 会自动将被下线OBServer的 Unit 迁移至新添加的 OBServer 上
4. 检查__all_server表检查server状态旧 OBServer 的信息已经消失