1. 什麼是垃圾

在提到什麼是垃圾之前，我們先看下面一張圖

從上圖我們可以很明確的知道，java 和 C++語言的區別，就在於垃圾收集技術和內存動態分配上，C語言沒有垃圾收集技術，需要我們手動的收集。垃圾收集，不是Java語言的伴生產物。早在1960年，第一門開始使用內存動態分配和垃圾收集技術的Lisp語言誕生。關於垃圾收集有三個經典問題：

哪些內存需要回收？
什麼時候回收？
如何回收？

垃圾收集機制是Java的招牌能力，極大地提高了開發效率。如今，垃圾收集幾乎成為現代語言的標配，即使經過如此長時間的發展，Java的垃圾收集機制仍然在不斷的演進中，不同大小的設備、不同特徵的應用場景，對垃圾收集提出了新的挑戰。

1.1 什麼是垃圾？

垃圾是指在運行程序中沒有任何指針指向的對象，這個對象就是需要被回收的垃圾。如果不及時對內存中的垃圾進行清理，那麼，這些垃圾對象所占的內存空間會一直保留到應用程式的結束，被保留的空間無法被其它對象使用，甚至可能導致內存溢出。

2. 為什麼需要GC

對於高級語言來說，一個基本認知是如果不進行垃圾回收，內存遲早都會被消耗完，因為不斷地分配內存空間而不進行回收，就好像不停地生產生活垃圾而從來不打掃一樣。
除了釋放沒用的對象，垃圾回收也可以清除內存里的記錄碎片。碎片整理將所占用的堆內存移到堆的一端，以便jvm將整理出的內存分配給新的對象。
隨著應用程式所應付的業務越來越龐大、複雜，用戶越來越多，沒有GC就不能保證應用程式的正常進行。而經常造成STW的GC又跟不上實際的需求，所以才會不斷地嘗試對GC進行優化。

3. 早期垃圾回收

在早期的C/C++時代，垃圾回收基本上是手工進行的。開發人員可以使用new關鍵字進行內存申請，並使用delete關鍵字進行內存釋放。這種方式可以靈活控制內存釋放的時間，但是會給開發人員帶來頻繁申請和釋放內存的管理負擔。倘若有一處內存區間由於程式設計師編碼的問題忘記被回收，那麼就會產生內存泄漏，垃圾對象永遠無法被清除，隨著系統運行時間的不斷增長，垃圾對象所耗內存可能持續上升，直到出現內存溢出並造成應用程式崩潰。

4. Java垃圾回收機制

4.1 優點

自動內存管理，無需開發人員手動參與內存的分配與回收，這樣降低內存泄漏和內存溢出的風險。如果沒有自動垃圾回收機制，java也會和c語音一樣，各種懸垂指針，野指針，泄露問題讓你頭疼不已。自動內存管理機制，將程式設計師從繁重的內存管理中釋放出來，可以更專心地專注於業務開發

4.2 缺點

對於Java開發人員而言，自動內存管理就像是一個黑匣子，如果過度依賴於「自動」，那麼這將會是一場災難，最嚴重的就會弱化Java開發人員在程序出現內存溢出時定位問題和解決問題的能力。
此時，了解JVM的自動內存分配和內存回收原理就顯得非常重要，只有在真正了解JVM是如何管理內存後，我們才能夠在遇見outofMemoryError時，快速地根據錯誤異常日誌定位問題和解決問題。
當需要排查各種內存溢出、內存泄漏問題時，當垃圾收集成為系統達到更高並發量的瓶頸時，我們就必須對這些「自動化」的技術實施必要的監控和調節。

4.3 GC主要關注的區域

GC主要關注於方法區和堆中的垃圾收集

垃圾收集器可以對年輕代回收，也可以對老年代回收，甚至是全棧和方法區的回收

其中，Java堆是垃圾收集器的工作重點

從次數上講：

頻繁收集Young區
較少收集Old區
基本不收集Perm區（元空間）

5. System.gc()的理解

在默認情況下，通過system.gc（）者Runtime.getRuntime().gc() 的調用，會顯式觸發FullGC，同時對老年代和新生代進行回收，嘗試釋放被丟棄對象占用的內存。
然而system.gc() )調用附帶一個免責聲明，無法保證對垃圾收集器的調用。(不能確保立即生效)

6. 內存溢出

內存溢出相對於內存泄漏來說，儘管更容易被理解，但是同樣的，內存溢出也是引發程序崩潰的罪魁禍首之一。
由於GC一直在發展，所有一般情況下，除非應用程式占用的內存增長速度非常快，造成垃圾回收已經跟不上內存消耗的速度，否則不太容易出現OOM的情況。
大多數情況下，GC會進行各種年齡段的垃圾回收，實在不行了就放大招，來一次獨占式的FullGC操作，這時候會回收大量的內存，供應用程式繼續使用。

首先說沒有空閒內存的情況：說明Java虛擬機的堆內存不夠。原因有二：

Java虛擬機的堆內存設置不夠。

比如：可能存在內存泄漏問題；也很有可能就是堆的大小不合理，比如我們要處理比較可觀的數據量，但是沒有顯式指定JVM堆大小或者指定數值偏小。我們可以通過參數-Xms 、-Xmx來調整。

代碼中創建了大量大對象，並且長時間不能被垃圾收集器收集（存在被引用）

在拋出OutofMemoryError之前，通常垃圾收集器會被觸發，盡其所能去清理出空間。當然，也不是在任何情況下垃圾收集器都會被觸發的。比如，我們去分配一個超大對象，類似一個超大數組超過堆的最大值，JVM可以判斷出垃圾收集並不能解決這個問題，所以直接拋出OutofMemoryError。

7. 內存泄漏

也稱作「存儲滲漏」。嚴格來說，只有對象不會再被程序用到了，但是GC又不能回收他們的情況，才叫內存泄漏。
但實際情況很多時候一些不太好的實踐（或疏忽）會導致對象的生命周期變得很長甚至導致00M，也可以叫做寬泛意義上的「內存泄漏」。
儘管內存泄漏並不會立刻引起程序崩潰，但是一旦發生內存泄漏，程序中的可用內存就會被逐步蠶食，直至耗盡所有內存，最終出現outofMemory異常，導致程序崩潰。

7.1 舉例

單例模式

單例的生命周期和應用程式是一樣長的，所以單例程序中，如果持有對外部對象的引用的話，那麼這個外部對象是不能被回收的，則會導致內存泄漏的產生。

一些提供close的資源未關閉導致內存泄漏

資料庫連接（dataSourse.getConnection() ），網絡連接（socket）和io連接必須手動close，否則是不能被回收的。

8. 對象已死？

堆里幾乎存放著java中所有的實例對象，在對堆進行回收前，第一件事情就是要確定這些對象有哪些還 "存活" 著？哪些已經 "死去" （不可能再被任何途徑使用的對象）。

8.1 引用計數算法

給對象中增加一個引用計數器，每當一個地方引用它時，計數器值就加1；當引用失效，計數器值就建1；計算器為0的對象就是不可能再被使用的。
引用計數算法的實現簡單，判斷效率也很高，但是它很難解決對象之間的相互循環引用的問題。所以Java沒有選用引用計數算法來管理內存。

8.2 根搜索算法

通過一系列的稱為「GC Roots」的對象作為起始點，從這些節點開始向下搜索，搜索的路徑稱為引用鏈，當一個對象到「GC Roots」沒有任何引用鏈相連的話，也就是GC Roots到這個對象不可達時，證明此對象已經不可用，可以被回收了。
可作為GC roots的對象的包括下面幾種：

棧中的對象引用、
方法區中常量的引用、
方法區中靜態對象的引用、
本地方法區中native對象的引用

9. Stop The World

stop-the-world，簡稱STW，指的是GC事件發生過程中，會產生應用程式的停頓。停頓產生時整個應用程式線程都會被暫停，沒有任何響應，有點像卡死的感覺，這個停頓稱為STW。
可達性分析算法中枚舉根節點（GC Roots）會導致所有Java執行線程停頓。

被STW中斷的應用程式線程會在完成GC之後恢復，頻繁中斷會讓用戶感覺像是網速不快造成電影卡帶一樣，所以我們需要減少STW的發生。
STW事件和採用哪款GC垃圾回收器無關所有的GC都有這個事件。哪怕是G1也不能完全避免Stop-the-world情況發生，只能說垃圾回收器越來越優秀，回收效率越來越高，儘可能地縮短了暫停時間。
STW是JVM在後台自動發起和自動完成的。在用戶不可見的情況下，把用戶正常的工作線程全部停掉。開發中不要用system.gc() 會導致stop-the-world的發生。

10. 安全點與安全區域

通過上文我們知道 HotSpot 虛擬機採取的是可達性分析算法。即通過 GC Roots 枚舉判定待回收的對象。那麼，首先要找到哪些是 GC Roots。有兩種查找 GC Roots 的方法：

一種是遍歷方法區和棧區查找（保守式 GC）。
一種是通過 OopMap 數據結構來記錄 GC Roots 的位置（準確式 GC）。

保守式 GC 的成本太高。準確式 GC 的優點就是能夠讓虛擬機快速定位到 GC Roots。對應 OopMap 的位置即可作為一個安全點（Safe Point）。在執行 GC 操作時，所有的工作線程必須停頓，這就是所謂的」Stop-The-World」。
為什麼呢？
因為可達性分析算法必須是在一個確保一致性的內存快照中進行。如果在分析的過程中對象引用關係還在不斷變化，分析結果的準確性就不能保證。安全點意味著在這個點時，所有工作線程的狀態是確定的，JVM 就可以安全地執行 GC 。

10.1 安全點

程序執行時並非在所有地方都能停頓下來開始GC，只有在特定的位置才能停頓下來開始GC，這些位置稱為「安全點（Safepoint）」。
Safe Point的選擇很重要，如果太少可能導致GC等待的時間太長，如果太頻繁可能導致運行時的性能問題。大部分指令的執行時間都非常短暫，通常會根據「是否具有讓程序長時間執行的特徵」為標準。

比如：選擇一些執行時間較長的指令作為Safe Point，如方法調用、循環跳轉和異常跳轉等。
如何在gc發生時，檢查所有線程都跑到最近的安全點停頓下來呢？

搶先式中斷：（目前沒有虛擬機採用）首先中斷所有線程。如果還有線程不在安全點，就恢復線程，讓線程跑到安全點。
主動式中斷：設置一個中斷標誌，各個線程運行到Safe Point的時候主動輪詢這個標誌，如果中斷標誌為真，則將自己進行中斷掛起。（有輪詢的機制）

注意：程序運行到安全點，不是一定要進行垃圾回收。而是在這些點上進行垃圾回收，較為安全。所以叫做安全點。

10.2 安全區域

Safepoint 機制保證了程序執行時，在不太長的時間內就會遇到可進入GC的Safepoint。但是，程序「不執行」的時候呢？例如線程處於sleep-狀態或Blocked 狀態，這時候線程無法響應JVM的中斷請求，「走」到安全點去中斷掛起，JVM也不太可能等待線程被喚醒。對於這種情況，就需要安全區域（Safe Region）來解決。
安全區域是指在一段代碼片段中，對象的引用關係不會發生變化，在這個區域中的任何位置開始Gc都是安全的。我們也可以把Safe Region看做是被擴展了的Safepoint。
執行流程：

當線程運行到Safe Region的代碼時，首先標識已經進入了Safe Relgion，如果這段時間內發生GC，JVM會忽略標識為Safe Region狀態的線程
當線程即將離開Safe Region時，會檢查JVM是否已經完成GC，如果完成了，則繼續運行，否則線程必須等待直到收到可以安全離開Safe Region的信號為止。

11. 強引用、軟引用、虛引用、弱引用

11.1 強引用

當內存不足，jvm開始垃圾回收，對於強引用的對象，就算是出現了OOM也不會對該對象進行回收。這也是Java中最常見的普通對象的引用，只要還有強引用指向這個對象，就不會被垃圾回收。
當這個對象沒有了其他的引用關係，只要是超過了引用的作用域，或者顯示的將強引用賦值為null,一般就可以進行垃圾回收了。

11.2 軟引用

軟引用是相對強引用弱化了一些的引用，對於軟引用的對象來說：

當內存充足時，它不會被回收。
當內存不足時。會被回收。

通常用在對內存敏感的程序中，就像高速緩存。

11.3 弱引用

發現即回收

弱引用也是用來描述那些非必需對象，被弱引用關聯的對象只能生存到下一次垃圾收集發生為止。在系統GC時，只要發現弱引用，不管系統堆空間使用是否充足，都會回收掉只被弱引用關聯的對象。但是，由於垃圾回收器的線程通常優先級很低，因此，並不一定能很快地發現持有弱引用的對象。在這種情況下，弱引用對象可以存在較長的時間。

弱引用和軟引用一樣，在構造弱引用時，也可以指定一個引用隊列，當弱引用對象被回收時，就會加入指定的引用隊列，通過這個隊列可以跟蹤對象的回收情況。

軟引用、弱引用都非常適合來保存那些可有可無的緩存數據。如果這麼做，當系統內存不足時，這些緩存數據會被回收，不會導致內存溢出。而當內存資源充足時，這些緩存數據又可以存在相當長的時間，從而起到加速系統的作用。
在JDK1.2版之後提供了WeakReference類來實現弱引用

// 聲明強引用
Object obj = new Object();
// 創建一個弱引用
WeakReference<Object> sf = new WeakReference<>(obj);
obj = null; //銷毀強引用，這是必須的，不然會存在強引用和弱引用

弱引用對象與軟引用對象的最大不同就在於，當GC在進行回收時，需要通過算法檢查是否回收軟引用對象，而對於弱引用對象，GC總是進行回收。弱引用對象更容易、更快被GC回收。

開發中使用過WeakHashMap的場景？

WeakHashMap用來存儲圖片信息，可以在內存不足的時候，及時回收，避免了OOM

11.4 虛引用

也稱為「幽靈引用」或者「幻影引用」，是所有引用類型中最弱的一個一個對象是否有虛引用的存在，完全不會決定對象的生命周期。如果一個對象僅持有虛引用，那麼它和沒有引用幾乎是一樣的，隨時都可能被垃圾回收器回收。它不能單獨使用，也無法通過虛引用來獲取被引用的對象。當試圖通過虛引用的get（）方法取得對象時，總是null。為一個對象設置虛引用關聯的唯一目的在於跟蹤垃圾回收過程。比如：能在這個對象被收集器回收時收到一個系統通知。

虛引用必須和引用隊列一起使用。虛引用在創建時必須提供一個引用隊列作為參數。當垃圾回收器準備回收一個對象時，如果發現它還有虛引用，就會在回收對象後，將這個虛引用加入引用隊列，以通知應用程式對象的回收情況。由於虛引用可以跟蹤對象的回收時間，因此，也可以將一些資源釋放操作放置在虛引用中執行和記錄。
在JDK1.2版之後提供了PhantomReference類來實現虛引用。

// 聲明強引用
Object obj = new Object();
// 聲明引用隊列
ReferenceQueue phantomQueue = new ReferenceQueue();
// 聲明虛引用（還需要傳入引用隊列）
PhantomReference<Object> sf = new PhantomReference<>(obj, phantomQueue);
obj = null;

Java-垃圾回收概述