JVM中的對象內存布局？

知識 05-31

在 Java 程序中，我們擁有多種新建對象的方式。除了最為常見的 new 語句之外，我們還可以通過反射機制、Object.clone 方法、反序列化以及 Unsafe.allocateInstance 方法來新建對象。

其中，Object.clone 方法和反序列化通過直接複製已有的數據，來初始化新建對象的實例欄位。

Unsafe.allocateInstance 方法則沒有初始化實例欄位，而 new 語句和反射機制，則是通過調用構造器來初始化實例欄位。

我們先來考察new語句，準備一個類，如下圖所示

讓我們編譯他的位元組碼：

可以看到，new語句編譯而成的位元組碼將包含用來請求內存的 new 指令，以及用來調用構造器的 invokespecial 指令。

本文不是專門介紹invoke系列指令的，我會在後面的文章中介紹invoke系列指令。

不過在這裡我多說一嘴，位元組碼中的invokespecial指令通常用於調用私有實例方法、構造器，以及使用super關鍵字調用父類的實例方法或構造器，和所實現介面的默認方法。

提到構造器，就不得不提到 Java 對構造器的諸多約束。首先，如果一個類沒有定義任何構造器的話， Java 編譯器會自動添加一個無參數的構造器。

我們剛才的TestNew類，他的位元組碼編譯出來後，有下面的片段。

在JAVA源碼中，我們沒有定義構造器，但是生成出來的位元組碼，已經自動幫我們添加了一個無參數的構造器。他使用的invokespecial方法最終調用的是其父類Object類的構造器方法。

我將講述JVM的構造器調用原則，那就是，如果子類的構造器需要調用父類的構造器。如果父類存在無參數構造器的話，該調用可以是隱式的。也就是說， Java 編譯器會自動添加對父類構造器的調用。

但是，如果父類沒有無參數構造器，那麼子類的構造器則需要顯式地調用父類帶參數的構造器。

顯式調用有兩種，一是直接使用「super」關鍵字調用父類構造器，二是使用「this」關鍵字調用同一個類中的其他構造器。

無論是直接的顯式調用，還是間接的顯式調用，都需要作為構造器的第一條語句，以便優先初始化繼承而來的父類欄位。

可以不優先初始化繼承來的父類欄位嗎?可以，如果你能使用位元組碼注入工具的話。

當我們調用一個構造器時，它將優先調用父類的構造器，直至 Object 類。這些構造器的調用者皆為同一對象，也就是通過 new 指令新建而來的對象。

事實上，我上面的陳述意味著：通過 new 指令新建出來的對象，它的內存其實涵蓋了所有父類中的實例欄位。

也就是說，雖然子類無法訪問父類的私有實例欄位，或者子類的實例欄位隱藏了父類的同名實例欄位，但是子類的實例還是會為這些父類實例欄位分配內存的。

下面我將介紹壓縮指針技術。在 Java 虛擬機中，每個 Java 對象都有一個對象頭，它由標記欄位和類型指針所構成。

標記欄位用以存儲 Java 虛擬機有關該對象的運行數據，如哈希碼、GC 信息以及鎖信息，而類型指針則指向該對象的類。

在64位的JVM中，對象頭的標記欄位占 64 位，而類型指針又佔了 64 位。也就是說，每一個 Java 對象在內存中的額外開銷就是 16 個位元組。

為了盡量較少對象的內存使用量，64位JVM引入了壓縮指針的概念，將堆中原本64位的Java對象指針壓縮成32位的。

這樣一來，對象頭中的類型指針也會被壓縮成32位，使得對象頭的大小從16位元組降至12位元組。

當然，壓縮指針不僅可以作用於對象頭的類型指針，還可以作用於引用類型的欄位，以及引用類型數組。

它的原理是什麼?答案是內存對齊。

我們規定，默認情況下，JVM堆中對象的起始地址需要對齊至8的倍數，如果一個對象用不到8N 個位元組，那麼空白的那部分空間就浪費掉了，這些浪費掉的空間我們稱之為對象間的填充。

大家知道，指針裡面存放的是地址，由於堆中對象的起始地址是對齊至8的倍數，所以指針存放一個引用(或者對象的類)的內存地址時，根本就不用存放最後的三位二進位數。

因為所有對象或類的內存地址都對齊了8，所以他們的內存地址的最低三位總是0，32位的指針就可以定址到 2 的 35 次方個位元組，也就是 32GB 的地址空間(超過 32GB 則會關閉壓縮指針)。

我們可以通過配置虛擬機的內存對齊選項來進一步提升定址範圍。但是，這同時也可能增加對象間填充，導致壓縮指針沒有達到原本節省空間的效果。

就算是關閉了壓縮指針，Java 虛擬機還是會進行內存對齊。此外，內存對齊不僅存在於對象與對象之間，也存在於對象中的欄位之間。

比如說，Java 虛擬機要求long欄位、double欄位，以及非壓縮指針狀態下的引用欄位地址為8的倍數。

這是為什麼呢?

CPU的緩存行機制大家應該有所耳聞，如果欄位不是對齊的，那麼就有可能出現跨緩存行的欄位。

該欄位的讀取可能需要替換兩個緩存行，而該欄位的存儲也會同時污染兩個緩存行。

我們將在後期文章關於volatile關鍵詞的本質分析的過程中，再次考察到CPU緩存行的相關機制。

最後我要提一句的是，欄位重排列技術，就是我剛才提到的，對象的欄位之間存在的內存對齊。這指的是重新分配欄位的先後順序，以達到內存對齊的目的

它有以下兩個規則：

其一，如果一個欄位佔據C個位元組，那麼該欄位的偏移量需要對齊至NC。這裡的偏移量指的是欄位地址與對象的起始地址差值。

以Long類為例，它僅有一個long類型的實例欄位。在使用了壓縮指針的 64 位虛擬機中，儘管對象頭的大小為12個位元組，該 long 類型欄位的偏移量也只能是16，而中間空著的4個位元組便會被浪費掉

其二，子類所繼承欄位的偏移量，需要與父類對應欄位的偏移量保持一致。

說白了，比如B繼承了A，A是B的父類，A中所有的欄位，在B中都有，而且是先放A的欄位，再放B的欄位。而且B類對象放A類欄位時，需要與父類對應欄位的偏移量保持一致。

接下來我說一個拓展內容吧，什麼是虛共享?

假設兩個線程分別訪問同一對象中不同的 volatile 欄位，邏輯上它們並沒有共享內容，因此不需要同步。

如果這兩個欄位恰好在同一個緩存行中，那麼對這些欄位的寫操作會導致緩存行的寫回，也就造成了實質上的共享。

Java8還引入了一個新的注釋@Contended，用來解決對象欄位之間的虛共享。

Java 虛擬機會讓不同的@Contended欄位處於獨立的緩存行中，因此你會看到大量的空間被浪費掉，避免無謂的緩存行同步操作。

具體的演算法屬於實現細節了，大家有興趣可以去用：

-XX:-RestrictContended

這個虛擬機選項，查看Contended欄位的內存布局。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 千鋒JAVA開發學院 的精彩文章:

※深入淺析一致性模型之Linearizability

TAG:千鋒JAVA開發學院 |