重慶分公司,新征程啟航
為企業提供網站建設、域名注冊、服務器等服務
為企業提供網站建設、域名注冊、服務器等服務
今天就跟大家聊聊有關Java中OOM試驗造成的電腦雪崩引發的示例分析,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
網站建設公司,為您提供網站建設,網站制作,網頁設計及定制網站建設服務,專注于成都定制網站,高端網頁制作,對社區文化墻等多個行業擁有豐富的網站建設經驗的網站建設公司。專業網站設計,網站優化推廣哪家好,專業seo優化排名優化,H5建站,響應式網站。
實驗是這樣的:想測試在指定的棧大小(160k)下通過不斷創建多線程觀察其造成的 OOM 類型
實驗的代碼如下:
publicclass Test {
private void dontStop() {
while(true) {
}
}
public void stackLeakByThread() {
while (true) {
Thread thread = new Thread(new Runnable() {
@Override public void run() {
dontStop();
}
});
thread.start();
}
}
public static void main(String[] args) {
Test oom = new Test();
oom.stackLeakByThread();
}
}
過了一會兒風扇狂轉,不久就發生了 OOM,然后程序沒有終止,用 Ctrl + C 也無法終止,會提示「the VM may need to be forcibly terminated」,這是什么鬼,如圖示
電腦卡死了,鼠標鍵盤完全沒法響應!只好重啟了電腦,然后我先在終端輸入 top 命令,再執行以上的程序, 發現 CPU 的負載達到了 800%!
在以上對問題的描述中至少有三個問題值得我們去思考
一個個來看
首先我們要明白 %CPU代表的含義,它指的是進程占用一個核的百分比,如果進程啟動了多個線程,多線程就會占用多個核,是可能超過 100% 的,但最多不超過 CPU核數 * 100%, 怎么查看邏輯 CPU 的個數
cat /proc/cpuinfo| grep "processor"| wc -l
sysctl hw.logicalcpu
我的電腦是 Mac 的,用以上命令查了一下邏輯核心發現是 8 個, 而實驗看到的 CPU 占有率是 800%,也就是說我們的實驗程序打滿了 8 個邏輯 CPU!有人說那是因為你在源源不斷地創建線程啊,當然就打滿了所有 CPU 了,那我們再來試驗一下,只創建 7 個線程,加個主線程共 8 個,這 8 個主線程內部都只執行一個 while(true) ,如下
publicclass Test {
privateint threadCount = 0;
private void dontStop() {
while(true) {
}
}
public void stackLeakByThread() {
while (true) {
// 只創建 7 個線程, 加上主線程共 8 個線程if (threadCount > 7) {
continue;
}
Thread thread = new Thread(new Runnable() {
@Override public void run() {
dontStop();
}
});
thread.start();threadCount++;
}
}
public static void main(String[] args) {
Test oom = new Test();
oom.stackLeakByThread();
}
}
執行之后 %CPU還是接近 800%(大家可以試驗一下,這里不貼圖了), 也就是說 8 個 while(true)把 8 個核全部打滿了,平均一個 while(true)打滿一個核 ,那么問題來了, 單個線程執行 while(true) 為啥會打滿一個核呢,CPU 不是按時間片來分配各個進程的嗎
如圖示:操作系統按時間片的調度算法來給不同的進程分配 CPU 時間,如果某個進程時間片用完了,會讓出 CPU 的控制權給其他的進程執行
首先,需要指明的是:CPU 確實是按時間片來給不同的進程分配它的控制權的
但 CPU 對時間片的分配策略是動態的, 具有偏向性的,簡單理解如下:
Java 中的線程執行完系統分配的時間片后確實是會讓出 CPU 的執行權,但別的進程會告訴系統自己沒什么事情要做,不需要那么多的時間,這個時候系統就會切換到下一個進程,直到回到這個死循環的進程上,而 Java 進程無論什么時候都再循環,都會一直會報告有事情要做,系統就會把盡可能多的時間分給它(正所謂會哭的小孩有奶吃),系統會不斷調高 while(true) 線程的優先級,提升它的 CPU 占用時間片,也就是說 while(true) 這個死循環用光了別的進程省下的時間,不讓 CPU 有片刻休息的時間,導致 CPU 負載過高,這就像馬太效應,勤奮的線程執行的越努力,其他懶惰的線程就越會被縮短時間片,越得不到機會!
畫外音: Windows 系統中就存在一個稱為「優先級推進器」(Priority Boosting,可以關閉)的功能,大致作用就是當系統發現一個線程執行得特別勤奮努力的話,可能會越過線程優先級優先為此線程分配執行時間
上文提到,發生 OOM 后, 由于已經觀察到 OOM 的現象,所以想把 Java 進程通過 Ctrl+C 殺死,但發現不起作用,如圖示
為啥 Ctrl + C 這種通用的 kill 掉進程的方式不起作用呢,我在 Oracle 的論壇(見文末參考鏈接)找到了 Oracle 工程師的回答
The message "Java HotSpot(TM) 64-Bit Server VM warning: Exception java.lang.OutOfMemoryError occurred dispatching signal UNKNOWN to handler- the VM may need to be forcibly terminated" is getting printed by the JVM's native signal handling code. The signal handler itself encountered OOM while making a Java up-call and that's why the JVM didn't get terminated with ctrl+c.
簡單地說就是 JVM 中的信號處理器確實收到了終端發出的 Ctrl + C 的終止信號,但當它調用 Java 進程想中止時發生了 OOM 導致中斷失敗, 那為啥調用會發生 OOM 呢,我猜是因為信號處理器要啟動一個線程來做這種終止通知的操作,而我們知道,當前已經無法再創建線程了(已經發生 unable to create new native thread 的錯誤了)
最后一個問題,主線程發生 OOM 后 Java 進程居然沒終止,這個該怎么解釋
Main 主線程與其他的子線程并不是父子關系,而是平等的關系,所以主線程雖然因為 OOM 掛了,但其他子線程并不會停止運行,由于子線程們執行的 while(true),所以子線程會一直存在,既然它們一直存在,那對應的 Java 進程就會一直運行著。
那怎么讓主線程終止運行后,其他線程也可立即結束呢,可以把這些子線程設置為守護線程,創建好 Thread thread 后,可以用 thread.setDaemon(true) 將其設置成守護線程,這樣當主線程掛了,守護線程也會立即停止運行,原因嘛,也很簡單,既然是守護線程,那被守護的線程都掛了,那守護線程也沒存在的意義了
通過一個 OOM 試驗引出了三個值得思考的問題,相信大家應該學了不少知識點,這里還是要提醒一下大家,看到書中的 demo 時,最好能親自去嘗試一下,說不定你能有新的發現!紙上得來終覺淺,絕知此事要躬行!看完上述內容,你們對Java中OOM試驗造成的電腦雪崩引發的示例分析有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創新互聯行業資訊頻道,感謝大家的支持。