深入理解Java虛擬機(二)
- 作者:新網
- 來源:新網
- 瀏覽:100
- 2018-04-26 15:50:53
這篇文章主要集中對于Java虛擬機的討論,首先對于Java虛擬機的內部機制做一個概述。要理解Java虛擬機,首先必須意識到,每當提到“Java虛擬機”時,可能指的的如下三種不同的東西:

<
div> 這篇文章主要集中對于Java
虛擬機的討論,首先對于Java虛擬機的內部機制做一個概述。要理解Java虛擬機,首先必須意識到,每當提到“Java虛擬機”時,可能指的的如下三種不同的東西:
抽象規范;
一個具體的實現;
一個運行中的虛擬機實例。
Java虛擬機抽象規范僅僅是個概念,而該規范的具體實現,可能來自多個提供商,并存在于多個平臺上,它或者是完全用軟件實現,或者以硬件和軟件相結合的方式來實現,當運行一個Java程序時,也就是運行了一個Java虛擬機實例。
虛擬機的生命周期:Java程序初始類中的main()方法,將作為改程序初始線程的起點,任何其他的線程都是由這個初始線程啟動的。一般有兩種線程:守護線程和非守護線程。只要還有任何非守護線程在運行,那么這個Java程序也在續集運行(虛擬機仍然存活)。也可以調用Runtime類或者System類的exit()方法來退出。
2. Java虛擬機的體系結構
每個Java虛擬機都有一個類裝載器子系統,它根據給定的全限定類名來裝入類型(類或接口)。同樣,每個Java虛擬機都有一個執行引擎,它負責執行那些包含在被裝載類的方法中的指令。
當虛擬機運行一個程序時,它需要內存來存儲許多東西,例如,字節碼,從已經裝載的class文件中得到得其他信息,程序創建的對象,傳遞給方法的參數,返回值,局部變量,以及運算的中間結果等等,Java虛擬機把這些東西都組織到幾個“運行時的數據區”中,以便于管理。
某些運行時數據區是程序中所有線程共享的,還有一些則是只能有一個線程擁有,每個Java虛擬機實例都有一個方法區及一個堆,他們就是所有線程共享的,當虛擬機裝載一個class文件時,他會從這個class文件包含的二進制數據中解析類型信息,然后,他把類型信息放到方法區中,當程序運行時,虛擬機會把所有該程序運行創建的對象都放到堆中。
當每一個先的線程被創建時,它都將得到它自己的PC寄存器(程序計數器),以及一個Java棧,如果線程正在執行的是一個Java方法(非本地方法),那么PC寄存器的值將總是指示下一條將被執行的指令,而它的Java棧則總是存儲該線程中Java方法調用的狀態——包含它的局部變量,被調用傳進來的參數,它的返回值,以及運算的中間結果等等。而本地方法調用的狀態,則是以某種依賴于具體實現的方法存儲在本地方法棧中,也可能實在寄存器或者其他某些與特定實現相關的內存中。
Java棧是由許多棧幀或者說幀組成的,一個棧幀包含一個Java方法的調用狀態,當線程調用一個Java方法時,虛擬機壓入一個新的棧幀到該線程的Java棧中,當該方法返回時,這個棧幀被從Java棧中彈出并拋棄。
2.1 數據類型
數據類可以分為兩種:基本數據類型和引用數據類型。有八大基本數據類型,還有一種returnAddress,只在Java虛擬機內部使用,用來實現Java程序中的finally子句。
引用類型有三種:類類型,接口類型以及數組類型。
2.2 運行時數據區域
Java虛擬機在執行Java程序的過程中會把它所管理的內存劃分為若干個不同的數據區域。 這些區域都有各自的用途,以及創建和銷毀的時間,有的區域隨著虛擬機進程的啟動而存在,有些區域則依賴用戶線程的啟動和結束而建立和銷毀。
2.2.1 程序計數器
程序計數器(Program Counter Register)是一塊較小的內存
空間,它可以看作是當前線程所執行的字節碼的行號指示器。 在虛擬機的概念模型里(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、 循環、 跳轉、 異常處理、 線程恢復等基礎功能都需要依賴這個計數器來完成。
由于Java虛擬機的多線程是通過線程輪流切換并分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內核)都只會執行一條線程中的指令。 因此,為了線程切換后能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間計數器互不影響,獨立存儲,我們稱這類內存區域為“線程私有”的內存。
如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Native方法,這個計數器值則為空(Undefined)。 此內存區域是唯一一個在Java虛擬機規范中沒有規定任何OutOfMemoryError情況的區域。
2.2.2 Java虛擬機棧
與程序計數器一樣,Java虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,它的生命周期與線程相同。 虛擬機棧描述的是Java方法執行的內存模型:每個方法在執行的同時都會創建一個棧幀(Stack Frame[1])用于存儲局部變量表、 操作數棧、 動態鏈接、 方法出口等信息。 每一個方法從調用直至執行完成的過程,就對應著一個棧幀在虛擬機棧中入棧到出棧的過程。
經常有人把Java內存區分為堆內存(Heap)和棧內存(Stack),這種分法比較粗糙,Java內存區域的劃分實際上遠比這復雜。 這種劃分方式的流行只能說明大多數程序員最關注的、 與對象內存分配關系最密切的內存區域是這兩塊。 其中所指的“堆”筆者在后面會專門講述,而所指的“棧”就是現在講的虛擬機棧,或者說是虛擬機棧中局部變量表部分。
局部變量表存放了編譯期可知的各種基本數據類(boolean、 byte、 char、 short、 int、float、 long,double)、 對象引用(reference類型,它不等同于對象本身,可能是一個指向對象起始地址的引用指針,也可能是指向一個代表對象的句柄或其他與此對象相關的位置)和returnAddress類型(指向了一條字節碼指令的地址)。
2.2.3 本地方法棧
本地方法棧(Native Method Stack)與虛擬機棧所發揮的作用是非常相似的,它們之間的區別不過是虛擬機棧為虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則為虛擬機使用到的Native方法服務。 在虛擬機規范中對本地方法棧中方法使用的語言、 使用方式與數據結構并沒有強制規定,因此具體的虛擬機可以自由實現它。 甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二為一。 與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。
2.2.4 Java堆
對于大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。 此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這里分配內存。 這一點在Java虛擬機規范中的描述是:所有的對象實例以及數組都要在堆上分配,但是隨著JIT編譯器的發展與逃逸分析技術逐漸成熟,棧上分配、 標量替換優化技術將會導致一些微妙的變化發生,所有的對象都分配在堆上也漸漸變得不是那么“絕對”了。
Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC堆”(GarbageCollected Heap,幸好國內沒翻譯成“垃圾堆”)。 從內存回收的角度來看,由于現在收集器基本都采用分代收集算法,所以Java堆中還可以細分為:新生代和老代;再細致一點的有Eden空間、 From Survivor空間、 To Survivor空間等。 從內存分配的角度來看,線程共享的Java堆中可能劃分出多個線程私有的分配緩沖區(Thread Local Allocation Buffer,TLAB)。 不過無論如何劃分,都與存放內容無關,無論哪個區域,存儲的都仍然是對象實例,進一步劃分的目的是為了更好地回收內存,或者更快地分配內存。
根據Java虛擬機規范的規定,Java堆可以處于物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。 在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。 如果在堆中沒有內存完成實例分配,并且堆也無法再擴展時,將會拋出OutOfMemoryError異常。