前言
我們都知道MySQL用server-id來唯一的標(biāo)識某個數(shù)據(jù)庫實(shí)例,并在鏈?zhǔn)交螂p主復(fù)制結(jié)構(gòu)中用它來避免sql語句的無限循環(huán)。這篇文章分享下我對server-id的理解,然后比較和權(quán)衡生成唯一server-id的幾種方式。
server_id的用途
簡單說來,server_id有兩個用途:
1. 用來標(biāo)記binlog event的源產(chǎn)地,就是SQL語句最開始源自于哪里。
2. 用于IO_thread對主庫binlog的過濾。如果沒有設(shè)置replicate-same-server-id=1,那么當(dāng)從庫的io_thread發(fā)現(xiàn)event的源與自己的server-id相同時,就會跳過該event,不把該event寫入到relay log中。從庫的sql_thread自然就不會執(zhí)行該event。這在鏈?zhǔn)交螂p主結(jié)構(gòu)中可以避免sql語句的無限循環(huán)。
注意:相同server-id的event在io_thread這一層就過濾了;而對于replicate-(do|ignore)-等規(guī)則,則是在sql_thread這一層過濾的。io_thread和sql_thread都有過濾的功能。
server_id為何不能重復(fù)
在同一個集群中,server-id一旦重復(fù),可能引發(fā)一些詭異問題。
看看下面兩種情況:
圖1:主庫與從庫的server-id不同,但是兩個或多個從庫的server-id相同
這種情況下復(fù)制會左右搖擺。當(dāng)兩個從庫的server-id相同時,如果從庫1已經(jīng)連接上主庫,此時從庫2也需要連接到主庫,發(fā)現(xiàn)之前有server-id相同的連接,就會先注銷該連接,然后重新注冊。
參考下面的代碼片段:
int register_slave(THD* thd, uchar* packet, uint packet_length) { int res; SLAVE_INFO *si; ... if (!(si->master_id= uint4korr(p))) si->master_id= server_id; si->thd= thd; pthread_mutex_lock(LOCK_slave_list); /* 先注銷相同server-id的連接*/ unregister_slave(thd,0,0); /* 重新注冊*/ res= my_hash_insert(slave_list, (uchar*) si); pthread_mutex_unlock(LOCK_slave_list); return res; ... }
兩臺從庫不停的注冊,不停的注銷,會產(chǎn)生很多relay log文件,查看從庫狀態(tài)會看到relay log文件名不停改變,從庫的復(fù)制狀態(tài)一會是yes一會是正在連接中。
圖2:鏈?zhǔn)交螂p主結(jié)構(gòu)中,主庫與從庫的server-id相同
從庫1同時又是relay數(shù)據(jù)庫,它能正確同步,然后把relay-log內(nèi)容重寫到自己的binlog中。當(dāng)server-id為100的從庫2 io線程獲取binlog時,發(fā)現(xiàn)所有內(nèi)容都是源自于自己,就會丟棄這些event。因此從庫2無法正確同步主庫的數(shù)據(jù)。只有直接寫relay server的event能正確同步到從庫2。
上面兩種情況可以看到,在同一個replication set中,保持server-id的唯一性非常重要。
server_id的動態(tài)修改
無意中發(fā)現(xiàn)server-id竟然是可以動態(tài)修改的,可別高興的太早。好處是,上面圖1的情況下,直接修改其中一個從庫的server-id就可以解決server-id沖突的問題。壞處很隱蔽,如下圖的結(jié)構(gòu):
現(xiàn)在假設(shè)active-master因?yàn)槟撤N原因與passive-master的同步斷開后,passive-master上進(jìn)行了一些ddl變更。然后某dba突發(fā)奇想把passive-master的server-id修改為400。當(dāng)雙master的復(fù)制啟動后,那些之前在passive-master上執(zhí)行的server-id為200的ddl變更,會從此陷入死循環(huán)。如果是alter table t engine=innodb,它會一直不停,可能你會發(fā)現(xiàn)。但是像update a=a+1;這樣的sql,你很難發(fā)現(xiàn)。當(dāng)然這種場景只是我的杜撰,這兒有個更真實(shí)的例子主備備的兩個備機(jī)轉(zhuǎn)為雙master時出現(xiàn)的詭異slave lag問題:http://hatemysql.com/2010/10/15/主備備的兩個備機(jī)轉(zhuǎn)為雙master時出現(xiàn)的詭異slave-lag問題/。
舉這兩個例子只是想說明修改server-id有點(diǎn)危險(xiǎn),最好不要去修改,那么能一步到位生成它嗎?
生成唯一的server_id
常用的方法有如下幾種:
1. 采用隨機(jī)數(shù)
mysql的server-id是4字節(jié)整數(shù),范圍從0-4294967295,因此采用該范圍內(nèi)的隨機(jī)數(shù)來作為server-id產(chǎn)生沖突的可能性是非常小的。
2. 采用時間戳
直接用date +%s來生成server-id。一天86400秒來計(jì)算,往后計(jì)算50年,最大的server-id也才使用到86400*365*50,完全在server-id范圍內(nèi)。
3. 采用ip地址+端口
這是我們經(jīng)常采用的方法。例如ip為192.168.122.23,端口為3309,那么server-id可以寫為122233309。產(chǎn)生沖突的可能性比較小:遇到*.*.122.23 或者*.*.12.223,而且搭建了同一個replication set的3309才會出現(xiàn)。
4. 采用集中的發(fā)號器
在管理服務(wù)器上采用自增的id來統(tǒng)一分配server-id。這可以保證不沖突,但是需要維護(hù)中心節(jié)點(diǎn)。
5. 分開管理每個replication set
在每個replication set中為mysql庫增加一個管理表,保證每個從庫的server-id不沖突。
上面的幾種方法都不賴,但是:
建議的方法
其實(shí)很簡單。ipv4是4字節(jié)的整數(shù),與server-id的范圍完全一樣。我們認(rèn)為只有ip地址+端口才能唯一的確定一個mysql實(shí)例,所以總是希望把ip信息和端口信息都集成到server-id中。但是別忘了,一個ip上不能同時啟動兩個一樣的端口。所以,server-id只需采用ip地址的整數(shù)形式:select INET_ATON('192.168.12.45'),3232238637!所有新上線的實(shí)例,mysql啟動腳本強(qiáng)制對server-id進(jìn)行檢查,發(fā)現(xiàn)server-id不對就進(jìn)行糾正,然后啟動。這種方法有個前提條件:同一機(jī)器上的多個instance不要有主從關(guān)系,否則server-id一樣就會導(dǎo)致問題。這種情況一般只會在測試環(huán)境出現(xiàn),在線上基本是沒有的。滿足了這個前提,所有問題迎刃而解。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,謝謝大家對腳本之家的支持。
標(biāo)簽:臨汾 湖南 白銀 烏海 湖北 云浮 聊城 武威
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MySQL如何生成唯一的server-id》,本文關(guān)鍵詞 MySQL,如何,生成,唯一,的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。