首頁> 資訊 > > 正文

環球微速訊：大數據Canal（四）：Canal HA原理及安裝

2023-03-16 02:15:32來源:騰訊云

Canal HA原理及安裝

一、??????????????Canal HA原理

Canal一般用于實時同步數據場景，那么對于實時場景HA顯得尤為重要，Canal支持HA搭建，canal的HA分為兩部分，canal server和canal client分別有對應的HA實現。大數據中使用Canal同步數據一般同步到Kafka中，這里Kafka相當于是Canal Client，Kafka集群自帶HA屬性，所以這里我們只關注Canal Server HA。Canal Server HA主要是為了減少對mysql dump的請求，不同server上的instance（不同server上的相同instance）要求同一時間只能有一個處于running，其他的處于standby狀態（standby是instance的狀態），Canal Server HA原理如下：

Canal HA 保證步驟如下：

【資料圖】

canal server要啟動某個canal instance時都先向zookeeper_進行一次嘗試啟動判斷。創建zookeeper節點成功后，對應的canal server就啟動對應的canal instance，沒有創建成功的canal instance就會處于standby狀態。一旦zookeeper發現canal server A創建的instance節點消失后，立即通知其他的canal server再次進行步驟1的操作，重新選出一個canal server啟動instance。canal client每次進行connect時，會首先向zookeeper詢問當前是誰啟動了canal instance，然后和其建立鏈接，一旦鏈接不可用，會重新嘗試connect。

二、??????????????Canal HA 搭建

1、機器準備

運行Canal的機器：node3,node4

zookeeper地址:node3:2181,node4:2181,node5:2181

mysql地址：node2:3306

2、在node3，node4上單獨部署配置Canal

將Canal安裝包上傳到node3，node4，并解壓到“/software/canal”目錄下，修改“/software/canal/conf”下的canal.properties文件，加上zookeeper配置

#指定zookeeper集群地址canal.zkServers = node3:2181,node4:2181,node5:2181#配置spring的xml配置文件canal.instance.global.spring.xml = classpath:spring/default-instance.xml#canal將數據寫入Kafka，可配：tcp, kafka, RocketMQ，tcp就是使用canal代碼接收canal.serverMode = kafka#配置canal寫入Kafka地址canal.mq.servers = node1:9092,node2:9092,node3:9092

進入“/software/canal/conf/example”目錄，修改“instance.properties”文件：

#另外一臺機器改成123457，保證slaveId不重復即可canal.instance.mysql.slaveId=123456#配置mysql master 節點及端口canal.instance.master.address=node2:3306#配置連接mysql的用戶名和密碼，就是前面復制權限的用戶名和密碼canal.instance.dbUsername=canalcanal.instance.dbPassword=canal#配置Canal將數據導入到Kafka topiccanal.mq.topic=canal_topic

注意：兩臺機器上的instance目錄的名字需要保證完全一致，HA模式是依賴于instance name進行管理，同時必須都選擇default-instance.xml配置，此配置中才有關于zookeeper的設置信息。

3、啟動兩臺機器的Canal

#在node3上啟動Canal[root@node3 ~]# cd /software/canal/bin[root@node3 bin]# ./startup.sh#在node4上啟動Canal[root@node4 ~]# cd /software/canal/bin[root@node4 bin]# ./startup.sh

啟動完成后，可以查看zookeeper中對應的路徑信息：

三、Canal HA 測試

默認搭建好的Canal HA 后可以通過查看Zookeeper中的“/otter/canal/destinations/examples/running”來查看Active的Canal節點：

測試Canal HA 如下：

1、向Mysql中“testdb.person”表中寫入數據

mysql> insert into person values (4,"s1",21),(5,"s2",22),(6,"s3",23);

可以觀察到Kafka canal_topic中有監控到的數據如下：

{"data":[{"id":"4","name":"s1","age":"21"},{"id":"5","name":"s2","age":"22"},{"id":"6","name":"s3","age":"23"}],"database":"testdb","es":1618849974000,"id":2,"isDdl":false,"mysqlType":{"id":"int","name":"varchar(255)","age":"int"},"old":null,"pkNames":null,"sql":"","sqlType":{"id":4,"name":12,"age":4},"table":"person","ts":1618849975203,"type":"INSERT"}

2、關閉active Canal Server節點，繼續向Mysql表中寫入數據

關閉node3 Canal Server：

[root@node3 ~]# cd /software/canal/bin[root@node3 bin]# ./stop.sh

查看zookeeper “/otter/canal/destinations/examples/running”路徑Active的Canal節點：

繼續向MySQL中“testdb.person”表中寫入數據：

mysql> insert into person values (7,"x1",24),(8,"x2",25),(9,"x3",26);

可以觀察寫入到Kafka “canal_topic”中數據如下：

{"data":[{"id":"7","name":"x1","age":"24"},{"id":"8","name":"x2","age":"25"},{"id":"9","name":"x3","age":"26"}],"database":"testdb","es":1618850233000,"id":2,"isDdl":false,"mysqlType":{"id":"int","name":"varchar(255)","age":"int"},"old":null,"pkNames":null,"sql":"","sqlType":{"id":4,"name":12,"age":4},"table":"person","ts":1618850234136,"type":"INSERT"}

經過以上測試，Canal HA 生效。

注意：經過測試Canal HA 在使用zookeeper存儲binlog position時，當有一個Canal Server重新啟動并切換成Active節點時，每次都會重復讀取最后一條數據。使用非HA 本地存儲binlog position時，沒有此問題。

標簽：

猜你喜歡