一、前情回顧
上篇文章給大家聊了一下volatile的原理,具體參見:入坑兩個月自研非外包創業公司,居然讓我搞懂了volatile
這篇文章給大家聊一下java並發包下的CAS相關的原子操作,以及Java 8如何改進和優化CAS操作的性能。
因為Atomic系列的原子類,無論在並發編程、JDK源碼、還是各種開源項目中,都經常用到。而且在Java並發麵試中,這一塊也屬於比較高頻的考點,所以還是值得給大家聊一聊。
二、場景引入,問題凸現
好,我們正式開始!假設多個線程需要對一個變量不停的累加1,比如說下面這段代碼:
實際上,上面那段代碼是不ok的,因為多個線程直接這樣並發的對一個data變量進行修改,是線程不安全性的行為,會導致data值的變化不遵照預期的值來改變。
舉個例子,比如說20個線程分別對data執行一次data++操作,我們以為最後data的值會變成20,其實不是。
最後可能data的值是18,或者是19,都有可能,因為多線程並發操作下,就是會有這種安全問題,導致數據結果不準確。
至於為什麼會不準確?那不在本文討論的範圍里,因為這個一般只要是學過java的同學,肯定都了解過多線程並發問題。
三、初步的解決方案:synchronized
所以,對於上面的代碼,一般我們會改造一下,讓他通過加鎖的方式變成線程安全的:
這個時候,代碼就是線程安全的了,因為我們加了synchronized,也就是讓每個線程要進入increment()方法之前先得嘗試加鎖,同一時間只有一個線程能加鎖,其他線程需要等待鎖。
通過這樣處理,就可以保證換個data每次都會累加1,不會出現數據錯亂的問題。
老規矩!我們來看看下面的圖,感受一下synchronized加鎖下的效果和氛圍,相當於N個線程一個一個的排隊在更新那個數值。
但是,如此簡單的data++操作,都要加一個重磅的synchronized鎖來解決多線程並發問題,就有點殺雞用牛刀,大材小用了。
雖然隨著Java版本更新,也對synchronized做了很多優化,但是處理這種簡單的累加操作,仍然顯得「太重了」。人家synchronized是可以解決更加複雜的並發編程場景和問題的。
而且,在這個場景下,你要是用synchronized,不就相當於讓各個線程串行化了麼?一個接一個的排隊,加鎖,處理數據,釋放鎖,下一個再進來。
四、更高效的方案:Atomic原子類及其底層原理
對於這種簡單的data++類的操作,其實我們完全可以換一種做法,java並發包下面提供了一系列的Atomic原子類,比如說AtomicInteger。
他可以保證多線程並發安全的情況下,高性能的並發更新一個數值。我們來看下面的代碼:
大家看上面的代碼,是不是很簡單!多個線程可以並發的執行AtomicInteger的incrementAndGet()方法,意思就是給我把data的值累加1,接著返回累加後最新的值。
這個代碼里,就沒有看到加鎖和釋放鎖這一說了吧!
實際上,Atomic原子類底層用的不是傳統意義的鎖機制,而是無鎖化的CAS機制,通過CAS機制保證多線程修改一個數值的安全性
那什麼是CAS呢?他的全稱是:Compare and Set,也就是先比較再設置的意思。
話不多說,先上圖!
我們來看上面的圖,假如說有3個線程並發的要修改一個AtomicInteger的值,他們底層的機制如下:
首先,每個線程都會先獲取當前的值,接著走一個原子的CAS操作,原子的意思就是這個CAS操作一定是自己完整執行完的,不會被別人打斷。
然後CAS操作里,會比較一下說,唉!大兄弟!現在你的值是不是剛才我獲取到的那個值啊?
如果是的話,bingo!說明沒人改過這個值,那你給我設置成累加1之後的一個值好了!
同理,如果有人在執行CAS的時候,發現自己之前獲取的值跟當前的值不一樣,會導致CAS失敗,失敗之後,進入一個無限循環,再次獲取值,接著執行CAS操作!
好!現在我們對照著上面的圖,來看一下這整個過程:
- 首先第一步,我們假設線程一咔嚓一下過來了,然後對AtomicInteger執行incrementAndGet()操作,他底層就會先獲取AtomicInteger當前的值,這個值就是0。
- 此時沒有別的線程跟他搶!他也不管那麼多,直接執行原子的CAS操作,問問人家說:兄弟,你現在值還是0嗎?
- 如果是,說明沒人修改過啊!太好了,給我累加1,設置為1。於是AtomicInteger的值變為1!
- 接著線程2和線程3同時跑了過來,因為底層不是基於鎖機制,都是無鎖化的CAS機制,所以他們倆可能會並發的同時執行incrementAndGet()操作。
- 然後倆人都獲取到了當前AtomicInteger的值,就是1
- 接著線程2搶先一步發起了原子的CAS操作!注意,CAS是原子的,此時就他一個線程在執行!
- 然後線程2問:兄弟,你現在值還是1嗎?如果是,太好了,說明沒人改過,我來改成2
- 好了,此時AtomicInteger的值變為了2。關鍵點來了:現在線程3接著發起了CAS操作,但是他手上還是拿著之前獲取到的那個1啊!
- 線程3此時會問問說:兄弟,你現在值還是1嗎?
- 噩耗傳來!!!這個時候的值是2啊!線程3哭泣了,他說,居然有人在這個期間改過值。算了,那我還是重新再獲取一次值吧,於是獲取到了最新的值,值為2。
- 然後再次發起CAS操作,問問,現在值是2嗎?是的!太好了,沒人改,我抓緊改,此時AtomicInteger值變為3!
上述整個過程,就是所謂Atomic原子類的原理,沒有基於加鎖機制串行化,而是基於CAS機制:先獲取一個值,然後發起CAS,比較這個值被人改過沒?如果沒有,就更改值!這個CAS是原子的,別人不會打斷你!
通過這個機制,不需要加鎖這麼重量級的機制,也可以用輕量級的方式實現多個線程安全的並發的修改某個數值。
五、Java 8對CAS機制的優化
但是這個CAS有沒有問題呢?肯定是有的。比如說大量的線程同時並發修改一個AtomicInteger,可能有很多線程會不停的自旋,進入一個無限重複的循環中。
這些線程不停地獲取值,然後發起CAS操作,但是發現這個值被別人改過了,於是再次進入下一個循環,獲取值,發起CAS操作又失敗了,再次進入下一個循環。
在大量線程高並發更新AtomicInteger的時候,這種問題可能會比較明顯,導致大量線程空循環,自旋轉,性能和效率都不是特別好。
於是,噹噹噹噹,Java 8推出了一個新的類,LongAdder,他就是嘗試使用分段CAS以及自動分段遷移的方式來大幅度提升多線程高並發執行CAS操作的性能!
在LongAdder的底層實現中,首先有一個base值,剛開始多線程來不停的累加數值,都是對base進行累加的,比如剛開始累加成了base = 5。
接著如果發現並發更新的線程數量過多,就會開始施行分段CAS的機制,也就是內部會搞一個Cell數組,每個數組是一個數值分段。
這時,讓大量的線程分別去對不同Cell內部的value值進行CAS累加操作,這樣就把CAS計算壓力分散到了不同的Cell分段數值中了!
這樣就可以大幅度的降低多線程並發更新同一個數值時出現的無限循環的問題,大幅度提升了多線程並發更新數值的性能和效率!
而且他內部實現了自動分段遷移的機制,也就是如果某個Cell的value執行CAS失敗了,那麼就會自動去找另外一個Cell分段內的value值進行CAS操作。
這樣也解決了線程空旋轉、自旋不停等待執行CAS操作的問題,讓一個線程過來執行CAS時可以儘快的完成這個操作。
最後,如果你要從LongAdder中獲取當前累加的總值,就會把base值和所有Cell分段數值加起來返回給你。
六、總結 & 思考
不知道大家有沒有發現這種高並發訪問下的分段處理機制,在很多地方都有類似的思想體現!因為高並發中的分段處理機制實際上是一個很常見和常用的並發優化手段。
在我們之前的一篇講分布式鎖的文章:為什麼公司規定所有接口都必須加上分布式鎖,你知道嗎?,也是用到了分段加鎖以及自動分段遷移/合併加鎖的一套機制,來大幅度幾十倍的提升分布式鎖的並發性能。
所以其實很多技術,思想都是有異曲同工之妙的。