微信扫码抢红包网站做,京东网站建设目的,泰安新闻完整版,网站流量15g1 Maxwell输出格式 database#xff1a;变更数据所属的数据库table#xff1a;变更数据所属的表type#xff1a;数据变更类型ts#xff1a;数据变更发生的时间xid#xff1a;事务idcommit#xff1a;事务提交标志#xff0c;可用于重新组装事务data#xff1a;对于inse…1 Maxwell输出格式 database变更数据所属的数据库table变更数据所属的表type数据变更类型ts数据变更发生的时间xid事务idcommit事务提交标志可用于重新组装事务data对于insert类型表示插入的数据对于update类型表示修改之后的数据对于delete类型表示删除的数据old对于update类习惯表示修改之前的数据只包含变更字段 2.Maxwell部署
2.1 安装Maxwell
1解压安装包
tar -zxvf maxwell-1.29.2.tar.gz -C /opt/module
2修改解压后的maxwell名字
mv maxwell-1.29.2/ maxwell
2.2 配置MySQL
2.2.1 判断MySQL是否已经开启binlog
MySQL服务器的Binlog默认是未开启的如需进行同步需要先进行开启
SHOW VARIABLES LIKE log_bin;查看MySQL的binlog模式
show global variables like binlog%;
开启binlog日志
修改 MySQL 的 my.cnf 配置文件
一般默认在 /etc/my.cnf 下
#第一种方式:
#开启binlog日志
log_binON
#binlog日志的基本文件名
log_bin_basename/var/lib/mysql/mysql-bin
#binlog文件的索引文件管理所有binlog文件
log_bin_index/var/lib/mysql/mysql-bin.index
#配置serverid
server-id1 注MySQL Binlog模式 Statement-based基于语句Binlog会记录所有写操作的SQL语句包括insert、update、delete等。 优点 节省空间 缺点 有可能造成数据不一致例如insert语句中包含now()函数。 Row-based基于行Binlog会记录每次写操作后被操作行记录的变化。 优点保持数据的绝对一致性。 缺点占用较大空间。 mixed混合模式默认是Statement-based如果SQL语句可能导致数据不一致就自动切换到Row-based。 Maxwell要求Binlog采用Row-based模式。 修改完配置后重启MySQL。
重启MySQL服务
systemctl restart mysqld
执行 SHOW VARIABLES LIKE log_bin; value值为 ON 即可。
2.2.2 创建Maxwell所需数据库和用户
Maxwell需要在MySQL中存储其运行过程中的所需的一些数据包括binlog同步的断点位置Maxwell支持断点续传等等故需要在MySQL为Maxwell创建数据库及用户。
1创建数据库
msyql CREATE DATABASE maxwell;
2更改MySQL数据库密码级别(可选操作)
mysql set global validate_password_policy0;
mysql set global validate_password_length4;
3创建Maxwell用户并赋予必要权限
mysql CREATE USER maxwell% IDENTIFIED BY abc;
mysql GRANT ALL ON maxwell.* TO maxwell%;
mysql GRANT SELECT, REPLICATION CLIENT, REPLICATION SLAVE ON *.* TO maxwell%;
2.3 配置Maxwell
1修改Maxwell配置文件
cd /opt/module/maxwell
cp config.properties.example config.properties
vim config.properties#Maxwell数据发送目的地可选配置有stdout|file|kafka|kinesis|pubsub|sqs|rabbitmq|redis
producerkafka
#目标Kafka集群地址
kafka.bootstrap.serversbigdata1:9092,bigdata2:9092,bigdata3:9092
#目标Kafka topic可静态配置例如:maxwell也可动态配置例如%{database}_%{table}
kafka_topicmaxwell#MySQL相关配置
hostbigdata1
usermaxwell
password123456
jdbc_optionsuseSSLfalseserverTimezoneAsia/Shanghai
3.Maxwell使用
3.1启动Kafka集群
若Maxwell发送数据的目的地为Kafka集群则需先确保Kafka集群为启动状态。
3.2 Maxwell启停
1启动
/opt/module/maxwell/bin/maxwell --config /opt/module/maxwell/config.properties --daemon
2停止Maxwell
ps -ef | grep maxwell | grep -v grep | grep maxwell | awk {print $2} | xargs kill -9
3Maxwell启停脚本
创建启停脚本 vim mxw.sh
内容
#!/bin/bashMAXWELL_HOME/opt/module/maxwellstatus_maxwell(){resultps -ef | grep com.zendesk.maxwell.Maxwell | grep -v grep | wc -lreturn $result
}start_maxwell(){status_maxwellif [[ $? -lt 1 ]]; thenecho 启动Maxwell$MAXWELL_HOME/bin/maxwell --config $MAXWELL_HOME/config.properties --daemonelseecho Maxwell正在运行fi
}stop_maxwell(){status_maxwellif [[ $? -gt 0 ]]; thenecho 停止Maxwellps -ef | grep com.zendesk.maxwell.Maxwell | grep -v grep | awk {print $2} | xargs kill -9elseecho Maxwell未在运行fi
}case $1 instart )start_maxwell;;stop )stop_maxwell;;restart )stop_maxwellstart_maxwell;;
esac
赋予权限
chmod 777 mxw.sh
3.3 增量数据同步
1启动Kafka消费者
bin/kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --topic maxwell
2模拟生成数据
java -jar gmall2020-mock-db-2021-01-22.jar
3观察Kafka消费者
{database:gmall,table:comment_info,type:insert,ts:1634023510,xid:1653373,xoffset:11998,data:{id:1447825655672463369,user_id:289,nick_name:null,head_img:null,sku_id:11,spu_id:3,order_id:18440,appraise:1204,comment_txt:评论内容12897688728191593794966121429786132276125164551411,create_time:2020-06-16 15:25:09,operate_time:null}}
{database:gmall,table:comment_info,type:insert,ts:1634023510,xid:1653373,xoffset:11999,data:{id:1447825655672463370,user_id:774,nick_name:null,head_img:null,sku_id:25,spu_id:8,order_id:18441,appraise:1204,comment_txt:评论内容67552221621263422568447438734865327666683661982185,create_time:2020-06-16 15:25:09,operate_time:null}}
3.4 历史数据全量同步
可能需要使用到MySQL数据库中从历史至今的一个完整的数据集。这就需要我们在进行增量同步之前先进行一次历史数据的全量同步。这样就能保证得到一个完整的数据集。
3.4.1Maxwell-bootstrap
历史数据的全量同步的命令
/opt/module/maxwell/bin/maxwell-bootstrap --database gmall --table user_info --config /opt/module/maxwell/config.properties
3.4.2 bootstrap数据格式
采用bootsrtap方式同步输出数据格式
{database: fooDB,table: barTable,type: bootstrap-start,ts: 1450557744,data: {}
}
{database: fooDB,table: barTable,type: bootstrap-insert,ts: 1450557744,data: {txt: hello}
}
{database: fooDB,table: barTable,type: bootstrap-insert,ts: 1450557744,data: {txt: bootstrap!}
}
{database: fooDB,table: barTable,type: bootstrap-complete,ts: 1450557744,data: {}
} 第一条type为bootstrap-start和最后一条type为bootstrap-complete的数据是bootstrap开始和结束的标志不包含数据中间的type为bootstrap-insert的数据才包含数据。 一次bootstrap输出的所有记录的ts都相同为bootstrap开始的时间。