久久99国产精品成人,一区二区日韩免费看,在线播放国产一区二区三区

主頁 > 知識庫 > Linux系統診斷之內存基礎深入詳解

Linux系統診斷之內存基礎深入詳解

1.背景

談及linux內存，很多時候，我們會關注free，top等基礎命令。當系統遇到異常情況時，內存問題的根因追溯，現場診斷時，缺乏深層次的debug能力。本篇幅不做深層討論，能把當前系統的問題描述清楚，是每個SRE應該具備的最基礎能力。

2. free

2.1 free命令原理

free是通過查看 /proc/meminfo 來獲取內存的使用情況。但是 /proc/meminfo 這個文件又是怎么來的？我們先了解下 /proc 目錄：

/proc 是一個虛擬文件系統，該目錄下的所有文件都是偽文件，該類文件只存在于內存中，并不占用空間——使用 du -sh 即可驗證，該模具路下的磁盤占用都是0。
/proc 下的所有文件都是內核調用proc_create() 接口來創建的虛擬條目。
/proc 中的文件，大多反饋系統信息的實時情況（進程、內存、cpu、設備信息等）。

結論： /proc/meminfo 是 /proc 文件系統下保存你內存相關信息的"偽文件"。

2.2 命令輸出簡介

每個發行版輸出都有一定差異，我們以debian8 4.19.x發行版為例。

root@4f996feeb851:~# free -m
  total used free shared buffers cached
Mem:  1991 1909  81  4 155 836
-/+ buffers/cache: 917 1073
Swap:  1023  1 1022

大部分的命令輸出意思，大家可以在man文檔中找到解析，這里不做贅述。

used: 已使用的內存 used = total - free -buffers -cached
free: 未使用的內存 memFree swapFree in /proc/meminfo
shared: tmpfs使用的內存 shmem in /proc/meminfo
buffers：被內核緩沖去使用的內存
cached: 被頁緩存和slabs使用的內存
buffers/cache：表示buffers和cache的總和
swap：交換分區的使用量

2.3 buffer和cache會使用內存嗎？

答案是肯定的，先來了解下buffer和cache。

cache（緩存）官方定義是用來彌補高速設備和低速設備之間的訪問速度不匹配而預留的一段空間，用來加快資源的訪問。簡單講就是讀的更快。
buffer（緩沖）是為了做資源寫入整形，計算機遇到大量的“小規模IO”時，會將其整形為少量的“大規模IO”，降低寫入次數。從而達到“寫資源”合理利用的效果。

然而，free命令所展示的buffer和cache 有點狹義的意思——free展示的buffer表示塊設備所占用的緩存、free展示的cache表示普通文件占用的the page cache(緩存頁) 。

總之，buffer和cache使用的內存都是用來加速Linux讀寫性能，如果有新的進程需要內存，系統會將buffer和cache占用的內存回收，并重新分配給進程使用。

2.4 其他內存概念

RSS VSZ PSS USS

RSS(Resident Set Size)：進程實際使用的物理內存大小，包括sharedMem。
VSZ(Virtual Memory Size)：進程所有能夠訪問到的內存大小，包括因為缺頁中斷，被swap出去的內存大小，以及sharedMem。
PSS(Proportional Set Size)：按照比例將內存的大小加到RSS中。
USS(Unique Set Size)：進程獨占的物理內存大小。

usedMem分為 active inactive

active：表示這部分的內存正在被某個特定的進程使用，不太可能被收回。
inactive：表示這部分內存是被分配到某個不在running狀態的進程，有可能會被回收。

Linux會維護一個LRU List用來管理活動頁和非活動頁的回收。簡單講，越接近該List的末尾，該頁面被回收的概率就越大，反之，越接近列首，則更不易被回收。 linux內核會維護兩類LRUList——active list和inactive list，剛訪問過的頁面放入active list，長時間未訪問的頁面放入inactive list，內核線程kswapd會定期將active list中的頁面移至 inactive list中。

如果系統的inactive的內存過大，可以通過如下操作對其做回收。
sync; echo 3 > /proc/sys/vm/drop_caches

3. 虛擬內存

現代x86系統，計算機能夠使用的內存會大于其物理內存的上限，依靠的就是虛擬內存機制。Linux支持虛擬內存機制和實模式機制。

實模式下，計算機會直接申請物理內存，虛擬內存機制下，系統會把磁盤當成內存的擴展，已增加可使用的內存大小。并通過映射map的機制，來保存和物理內存的真實對應關系。

在磁盤和內存之間傳送Page的活動叫做swapping或者頁面調度(paging)，被用作虛擬內存的磁盤分區稱為swap。

可以通過在線添加swap的方式臨時緩解內存不足的問題，但一般不能直接作在線減少swap的操作，很有可能導致進程的crash。具體swap配置方式見5.1swap相關配置。

4. OOM

1.What is OOM?

Out Of Memory Killer 是 Linux 的一種系統保護機制，在系統內存緊張時，kill掉某些進程防止系統卡死。系統通過打分機制，來實施對進程的殺死操作。默認機制是通過掃描所有進程的內存占用，cpu占用等因素，然后打分 (badness)，分數越高，進程被kill的優先級就越高。

2.哪些行為會讓系統對進程進行打分？

進程使用fork(2)調用，創建眾多子進程時，會加分(+)
進程已經運行了很長時間，或者和使用了大量的CPU時間，會減分(-)
進程的nice值如果比較低，會加分(+)
進程如果是特權進程（privileged）,會減分(-)
進程如果對硬件設備進行直接訪問，會減分(-)

3.在哪兒可以看到進程的打分？

/proc/pid>/oom_score

4.手動調整分數

/proc//oom_adj 該文件可以用于調整在oom發生時，哪些進程應該被kill，范圍-16 -- +15 ，默認值為0，

特殊值-17：表示進程永遠不會被kill。

5.我怎么知道系統有沒有觸發過OOM?

/var/log/messages 、 /var/log/syslog 系統日志或者 dmesg 系統日志診斷工具等都能夠找到

5. 內存相關配置

5.1 swap相關配置

通過調節系統參數，來告訴計算機使用swap分區的權重

1. 簡介
swappiness范圍0-100，默認60
0: 表示禁止使用swap
60: 默認
100: 瘋狂使用swap
 
2. 操作方法
# sysctl vm.swappiness=VALUE
# sysctl vm.swappiness=20
或者
# echo VALUE > /proc/sys/vm/swappiness
# echo 30 > /proc/sys/vm/swappiness

通過在線增加swap分區大小，臨時控制內存泄露，內存不夠用等異常。

1. 需要root用戶
2. 創建存儲文件
# dd if=/dev/zero of=/home/swap2G bs=1024 count=2M
3. 安全設置
# chown root:root /home/swap2G
# chmod 0600 /home/swap2G
4. 創建liunx交換分區
# mkswap /home/swap2G
5. enable 交換分區
# swapon /home/swap2G
6. 更新fstab文件【注意: 部分操作系統不需要】
# vim /etc/fstab
/home/swap2G none swap sw 0 0
7. 檢查是否生效
#free -m
8. 卸載swap分區
# swapoff /home/swap2G

5.2 緩存相關

sync; echo 3 > /proc/sys/vm/drop_caches
 
0:不釋放
1:釋放頁緩存
2:釋放 dentries 和 inodes
3:釋放所有緩存

5.3 OOM相關

vm.panic_on_oom
是否在觸發 oom 機制時觸發 kernel panic。0表示關閉（推薦），1表示打開。 kernel panic是指計算機遇到了致命的錯誤，并且他不知道該怎么處理時的一種動作——可以類比windows的藍屏。我們當然不希望每次計算機在oom時就直接藍屏。推薦設置為0
vm.overcommit_kbytes:
用于限制進程能夠申請的最大內存，0表示不設置，如果設置其他數值，比如400，則進程能夠申請到的最大內存為 swap+400kBytes
vm.overcommit_ratio:
定義了進程可以使用的最大內存（百分比模式），默認為50。表示配置50之后，進程不允許申請超過 swap + 50% * 物理內存總量以上的內存
vm.oom_kill_allocating_task (Linux 2.6.24+支持)
這在內存不足的情況下啟用或禁用殺死OOM觸發任務。0表示禁用（默認），1表示啟用。可以理解為oom機制的開關，默認為禁用——表示要讓oom觸發器正常執行。
其他有興趣的話，可以自行man proc

到此這篇關于Linux系統診斷之內存基礎深入詳解的文章就介紹到這了,更多相關Linux系統診斷之內存基礎內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: