關於Redis、ZooKeeper等分佈式鎖原理的一些思考

cnblogs.com/JJJ1990/p/10496850.html

首先分佈式鎖和我們平常講到的鎖原理基本一樣，目的就是確保，在多個線程併發時，只有一個線程在同一刻操作這個業務或者説方法、變量。

在一個進程中，也就是一個jvm 或者説應用中，我們很容易去處理控制，在jdk java.util 併發包中已經為我們提供了這些方法去加鎖，比如synchronized 關鍵字或者Lock 鎖，都可以處理。

但是我們現在的應用程序如果只部署一台服務器，那併發量是很差的，如果同時有上萬的請求那麼很有可能造成服務器壓力過大，而癱瘓。

想想雙十一和三十晚上十點分支付寶紅包等業務場景，自然需要用到多台服務器去同時處理這些業務，那麼這些服務可能會有上百台同時處理，

但是請我們大家想一想，如果有100台服務器要處理分紅包的業務，現在假設有1億的紅包，1千萬個人分，金額隨機，那麼這個業務場景下是不是必須確保這1千萬個人最後分的紅包金額總和等於1億。

如果處理不好每人分到100萬，那馬雲爸爸估計大年初一，就得宣佈破產了

1，常規鎖會造成什麼情況？

首先説一下我們為什麼要搞集羣，簡單理解就是，需求量（請求併發量）變大了，一個工人處理能力有限，那就多招一些工人來一起處理。

假設1千萬個請求平均分配到100台服務器上，每個服務器接收10w的請求（這10w個請求並不是在同一秒中來的，可能是在1,2個小時內，可以聯想下我們三十晚上開紅包，等到10.20開始，有的人立馬開了，有的人是不是等到12點了才想起來~）

那這樣的話，平均到每一秒上的請求也就不到1千個，這種壓力一般的服務器還是可以承受的。

第一個請求到來後，是不是需要在1億裏面給他分一部分錢，金額隨機，假設第一個人分到了100，那是不是要在這1億中減去100塊，剩下99999900 塊~

第二個用户再來分，金額隨機，這次分200塊，那是不是就需要在剩下的99999900塊中再減去200塊，剩下99999700 塊。

等到第10w個用户來，一看還有1000w，那這1000w全成他的了。

等於是在每個服務器中去分1億，也就是10w個用户分了一個億，最後總計有100個服務器，要分100億。

如果真這樣了，雖説馬雲爸爸不會破產（據最新統計馬雲有2300億人民幣），那分紅包的開發項目組，以及產品經理，可以GG了~

簡化結構圖如下：

2，分佈式鎖怎麼去處理？

那麼為了解決這個問題，讓1000萬用户只分1億，而不是100億，這個時候分佈式鎖就派上用處了。

分佈式鎖可以把整個集羣就當作是一個應用一樣去處理，那麼也就需要這個鎖，要獨立於每一個服務之外，而不是在服務裏面。

假設第一個服務器接收到用户1的請求後，那麼這個時候，他就不能只在自己的應用中去判斷還有多少錢可以分了，而需要去外部請求專門負責管理這1億紅包的人（服務），問他：哎，我這裏要分100塊，給我100。

管理紅包的妹子（服務）一看，還有1個億，那好，給你100塊，然後剩下99999900塊。

第二個請求到來後，被服務器2獲取，繼續去詢問，管理紅包的妹子，我這邊要分10塊，管理紅包的妹子先查了下還有99999900，那就説：好，給你10塊。那就剩下99999890塊

等到第1000w個請求到來後，服務器100拿到請求，繼續去詢問，管理紅包的妹子，你要100，妹子翻了翻白眼，對你説，就剩1塊了，愛要不要，那這個時候就只能給你1塊了（1塊也是錢啊，買根辣條還是可以的）。

這些請求編號1,2不代表執行的先後順序，正式的場景下，應該是 100台服務器每個服務器持有一個請求去訪問負責管理紅包的妹子（服務），那在管紅包的妹子那裏同時會接收到100個請求，這個時候就需要在負責紅包的妹子那裏加個鎖就可以了（拋繡球），你們100個服務器誰拿到鎖（搶到繡球），誰就進來和我談，我給你分，其他人就等着去吧

經過上面的分佈式鎖的處理後，馬雲爸爸終於放心了，決定給紅包團隊每人加一個雞腿。

簡化的結構圖如下：

3，分佈式鎖的實現有哪些？

説到分佈式鎖的實現，還是有很多的，有數據庫方式的，有redis分佈式鎖，有zookeeper分佈式鎖等等

我們如果採用redis作為分佈式鎖，那麼上圖中負“責紅包的妹子（服務）”，就可以替換成redis，請自行腦補。

3.1，為什麼redis可以實現分佈式鎖？

首先redis是單線程的，這裏的單線程指的是網絡請求模塊使用了一個線程（所以不需考慮併發安全性），即一個線程處理所有網絡請求，其他模塊仍用了多個線程。

在實際的操作中過程大致是這樣子的：

服務器1要去訪問發紅包的妹子，也就是redis，那麼他會在redis中通過"setnx key value" 操作設置一個key 進去，value是啥不重要，重要的是要有一個key，也就是一個標記，而且這個key你愛叫啥叫啥，只要所有的服務器設置的key相同就可以。

假設我們設置一個，如下圖

那麼我們可以看到會返回一個1，那就代表了成功。

如果再來一個請求去設置同樣的key，如下圖：

這個時候會返回0，那就代表失敗了。

那麼我們就可以通過這個操作去判斷是不是當前可以拿到鎖，或者説可以去訪問“負責發紅包的妹子”，如果返回1，那我就開始去執行後面的邏輯，如果返回0，那就説明已經被人佔用了，我就要繼續等待。

當服務器1拿到鎖之後，進行了業務處理，完成後，還需要釋放鎖，如下圖所示：

刪除成功返回1，那麼其他的服務器就可以繼續重複上面的步驟去設置這個key，以達到獲取鎖的目的。

當然以上的操作是在redis客户端直接進行的，通過程序調用的話，肯定就不能這麼寫，比如java 就需要通過jedis 去調用，但是整個處理邏輯基本都是一樣的

通過上面的方式，我們好像是解決了分佈式鎖的問題，但是想想還有沒有什麼問題呢？？

對，問題還是有的，可能會有死鎖的問題發生，比如服務器1設置完之後，獲取了鎖之後，忽然發生了宕機。

那後續的刪除key操作就沒法執行，這個key會一直在redis中存在，其他服務器每次去檢查，都會返回0，他們都會認為有人在使用鎖，我需要等。

為了解決這個死鎖的問題，我們就就需要給key 設置有效期了。

設置的方式有2種

1，第一種就是在set完key之後，直接設置key的有效期 "expire key timeout" ，為key設置一個超時時間，單位為second，超過這個時間鎖會自動釋放，避免死鎖。

這種方式相當於，把鎖持有的有效期，交給了redis去控制。如果時間到了，你還沒有給我刪除key，那redis就直接給你刪了，其他服務器就可以繼續去setnx獲取鎖。

2，第二種方式，就是把刪除key權利交給其他的服務器，那這個時候就需要用到value值了，

比如服務器1，設置了value 也就是 timeout 為當前時間 1 秒，這個時候服務器2 通過get 發現時間已經超過系統當前時間了，那就説明服務器1沒有釋放鎖，服務器1可能出問題了，

服務器2就開始執行刪除key操作，並且繼續執行setnx 操作。

但是這塊有一個問題，也就是，不光你服務器2可能會發現服務器1超時了，服務器3也可能會發現，如果剛好，服務器2，setnx操作完成，服務器3就接着刪除，是不是服務器3也可以setnx成功了？

那就等於是服務器2和服務器3都拿到鎖了，那就問題大了。這個時候怎麼辦呢？

這個時候需要用到 “GETSET key value” 命令了。這個命令的意思就是獲取當前key的值，並且設置新的值。

假設服務器2發現key過期了，開始調用 getset 命令，然後用獲取的時間判斷是否過期，如果獲取的時間仍然是過期的，那就説明拿到鎖了。

如果沒有，則説明在服務2執行getset之前，服務器3可能也發現鎖過期了，並且在服務器2之前執行了getset操作，重新設置了過期時間。

那麼服務器2就需要放棄後續的操作，繼續等待服務器3釋放鎖或者去監測key的有效期是否過期。

這塊其實有一個小問題是，服務器3已經修改了有效期，拿到鎖之後，服務器2，也修改了有效期，但是沒能拿到鎖，但是這個有效期的時間已經被在服務器3的基礎上有增加一些，但是這種影響其實還是很小的，幾乎可以忽略不計。

3.2，為什麼zookeeper可以實現分佈式鎖？

百度百科是這麼介紹的：ZooKeeper是一個分佈式的，開放源碼的分佈式應用程序協調服務，是Google的Chubby一個開源的實現，是Hadoop和Hbase的重要組件。

那對於我們初次認識的人，可以理解成ZooKeeper就像是我們的電腦文件系統，我們可以在d盤中創建文件夾a，並且可以繼續在文件夾a中創建文件夾a1，a2。

那我們的文件系統有什麼特點？？那就是同一個目錄下文件名稱不能重複，同樣ZooKeeper也是這樣的。

在ZooKeeper所有的節點，也就是文件夾稱作 Znode，而且這個Znode節點是可以存儲數據的。

我們可以通過“ create /zkjjj nice” 來創建一個節點，這個命令就表示，在跟目錄下創建一個zkjjj的節點，值是nice。同樣這裏的值，和我在前面説的redis中的一樣，沒什麼意義，你隨便給。

另外ZooKeeper可以創建4種類型的節點，分別是：

持久性節點
持久性順序節點
臨時性節點
臨時性順序節點

首先説下持久性節點和臨時性節點的區別，持久性節點表示只要你創建了這個節點，那不管你ZooKeeper的客户端是否斷開連接，ZooKeeper的服務端都會記錄這個節點。

臨時性節點剛好相反，一旦你ZooKeeper客户端斷開了連接，那ZooKeeper服務端就不再保存這個節點。

再説下順序性節點，順序性節點是指，在創建節點的時候，ZooKeeper會自動給節點編號比如0000001 ，0000002 這種的。

最後説下，zookeeper有一個監聽機制，客户端註冊監聽它關心的目錄節點，當目錄節點發生變化（數據改變、被刪除、子目錄節點增加刪除）等，zookeeper會通知客户端。

下面我們繼續結合我們上面的分紅包場景，描述下在zookeeper中如何加鎖。

假設服務器1，創建了一個節點 /zkjjj ,成功了，那服務器1就獲取了鎖，服務器2再去創建相同的鎖，那麼他就會失敗，這個時候他就就只能監聽這個節點的變化。

等到服務器1，處理完業務，刪除了節點後，他就會得到通知，然後去創建同樣的節點，獲取鎖處理業務，再刪除節點，後續的100台服務器與之類似

注意這裏的100台服務器並不是挨個去執行上面的創建節點的操作，而是併發的，當服務器1創建成功，那麼剩下的99個就都會註冊監聽這個節點，等通知，以此類推。

但是大家有沒有注意到，這裏還是有問題的，還是會有死鎖的情況存在，對不對？

當服務器1創建了節點後掛了，沒能刪除，那其他99台服務器就會一直等通知，那就完蛋了。。。

這個時候呢，就需要用到臨時性節點了，我們前面説過了，臨時性節點的特點是客户端一旦斷開，就會丟失，也就是當服務器1創建了節點後，如果掛了。

那這個節點會自動被刪除，這樣後續的其他服務器，就可以繼續去創建節點，獲取鎖了。

但是我們可能還需要注意到一點，就是驚羣效應：舉一個很簡單的例子,當你往一羣鴿子中間扔一塊食物,雖然最終只有一個鴿子搶到食物,但所有鴿子都會被驚動來爭奪,沒有搶到..

就是當服務器1節點有變化，會通知其餘的99個服務器，但是最終只有1個服務器會創建成功，這樣98還是需要等待監聽，那麼為了處理這種情況，就需要用到臨時順序性節點

大致意思就是，之前是所有99個服務器都監聽一個節點，現在就是每一個服務器監聽自己前面的一個節點。

假設100個服務器同時發來請求，這個時候會在 /zkjjj 節點下創建 100 個臨時順序性節點 /zkjjj/000000001, /zkjjj/000000002,一直到 /zkjjj/000000100,這個編號就等於是已經給他們設置了獲取鎖的先後順序了。

當001節點處理完畢，刪除節點後，002收到通知，去獲取鎖，開始執行，執行完畢，刪除節點，通知003~以此類推。