亚洲熟女综合色一区二区三区,亚洲精品中文字幕无码蜜桃,亚洲va欧美va日韩va成人网,亚洲av无码国产一区二区三区,亚洲精品无码久久久久久久

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧

1.介紹
1.什么是進(jìn)程
比如: 開發(fā)寫的代碼我們稱為程序,那么將開發(fā)的代碼運(yùn)行起來。我們稱為進(jìn)程。
總結(jié)一句話就是: 當(dāng)我們運(yùn)行一個(gè)程序,那么我們將運(yùn)行的程序叫進(jìn)程。
PS1: 當(dāng)程序運(yùn)行為進(jìn)程后,系統(tǒng)會(huì)為該進(jìn)程分配內(nèi)存,以及進(jìn)程運(yùn)行的身份和權(quán)限。
PS2: 在進(jìn)程運(yùn)行的過程中,系統(tǒng)會(huì)有各種指標(biāo)來表示當(dāng)前運(yùn)行的狀態(tài)。
2.程序和進(jìn)程的區(qū)別
1.程序是數(shù)據(jù)和指令的集合,是一個(gè)靜態(tài)的概念。比如/bin/ls、/bin/cp等二進(jìn)制文件。同時(shí)程序可以長(zhǎng)期存在系統(tǒng)中。
2.進(jìn)程是程序運(yùn)行的過程,是一個(gè)動(dòng)態(tài)的概念。進(jìn)程是存在生命周期的概念的,也就是說進(jìn)程會(huì)隨著程序的終止而銷毀,不會(huì)永久存在系統(tǒng)中。
3.進(jìn)程的生命周期
生命周期就是指一個(gè)對(duì)象的生老病死。用處很廣。

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖

當(dāng)父進(jìn)程接收到任務(wù)調(diào)度時(shí),會(huì)通過fock派生子進(jìn)程來處理,那么子進(jìn)程會(huì)繼承父進(jìn)程屬性。
1.子進(jìn)程在處理任務(wù)代碼時(shí),父進(jìn)程會(huì)進(jìn)入等待狀態(tài)中…
2.子進(jìn)程在處理任務(wù)代碼后,會(huì)執(zhí)行退出,然后喚醒父進(jìn)程來回收子進(jìn)程的資源。
3.如果子進(jìn)程在處理任務(wù)過程中,父進(jìn)程退出了,子進(jìn)程沒有退出,那么這些子進(jìn)程就沒有父進(jìn)程來管理了,就變成僵尸進(jìn)程。
PS: 每個(gè)進(jìn)程都父進(jìn)程的PPID,子進(jìn)程則叫PID。
例: 假設(shè)現(xiàn)在我是蔣先生(system進(jìn)程)….故事持續(xù)中…..
2.監(jiān)控進(jìn)程狀態(tài)
程序在運(yùn)行后,我們需要了解進(jìn)程的運(yùn)行狀態(tài)。查看進(jìn)程的狀態(tài)分為: 靜態(tài)和動(dòng)態(tài)兩種方式
1.使用ps命令查看當(dāng)前的進(jìn)程狀態(tài)(靜態(tài))
1)示例、ps -aux常用組合,查看進(jìn)程 用戶、PID、占用cpu百分比、占用內(nèi)存百分比、狀態(tài)、執(zhí)行的命令等

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖1
狀態(tài) 描述
USER 啟動(dòng)進(jìn)程的用戶
PID 進(jìn)程運(yùn)行的ID號(hào)
%CPU 進(jìn)程占用CPU百分比
%MEM 進(jìn)程占用內(nèi)存百分比
VSZ 進(jìn)程占用虛擬內(nèi)存大小 (單位KB)
RSS 進(jìn)程占用物理內(nèi)存實(shí)際大小 (單位KB)
TTY 進(jìn)程是由哪個(gè)終端運(yùn)行啟動(dòng)的tty1、pts/0等 ?表示內(nèi)核程序與終端無關(guān)(遠(yuǎn)程連接會(huì)通過tty打開一個(gè)bash:tty)
STAT 進(jìn)程運(yùn)行過程中的狀態(tài) man ps (/STATE)
START 進(jìn)程的啟動(dòng)時(shí)間
TIME 進(jìn)程占用 CPU 的總時(shí)間(為0表示還沒超過秒)
COMMAND 程序的運(yùn)行指令,[ 方括號(hào) ] 屬于內(nèi)核態(tài)的進(jìn)程。 沒有 [ ] 的是用戶態(tài)進(jìn)程。systemctl status 指令

2.STAT狀態(tài)的S、Ss、S+、R、R、S+等等,都是什么意思?

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖2
STAT基本狀態(tài) 描述 STAT狀態(tài)+符號(hào) 描述
R 進(jìn)程運(yùn)行 s 進(jìn)程是控制進(jìn)程, Ss進(jìn)程的領(lǐng)導(dǎo)者,父進(jìn)程
S 可中斷睡眠 < 進(jìn)程運(yùn)行在高優(yōu)先級(jí)上,S<優(yōu)先級(jí)較高的進(jìn)程
T 進(jìn)程被暫停 N 進(jìn)程運(yùn)行在低優(yōu)先級(jí)上,SN優(yōu)先級(jí)較低的進(jìn)程
D 不可中斷睡眠 + 當(dāng)前進(jìn)程運(yùn)行在前臺(tái),R+該表示進(jìn)程在前臺(tái)運(yùn)行(正在io操作,一旦停止,數(shù)據(jù)丟失)
Z 僵尸進(jìn)程 l 進(jìn)程是多線程的,Sl表示進(jìn)程是以線程方式運(yùn)行

案例一、PS命令查看進(jìn)程狀態(tài)切換

#1.在終端1上運(yùn)行vim案例二、PS命令查看不可中斷狀態(tài)進(jìn)程

#1.使用tar打包文件時(shí),可以通過終端不斷查看狀態(tài),由S+,R+變?yōu)镈+查看進(jìn)程 ps
ps [options]
支持的命令格式

  • unix格式:-h -e
  • BSD格式:a,x,u
  • GNU長(zhǎng)格式:–help

選項(xiàng)

[root@s22 ~]#psps輸出屬性
VSZ 虛擬內(nèi)存(程序認(rèn)為可以獲取到的)
RSS 實(shí)際內(nèi)存
psr cpu編號(hào)
STAT 狀態(tài)
%cpu cpu的占用率
%mem 內(nèi)存的占用率
根據(jù)名稱來查詢進(jìn)程
pidof name
[root@s22 ~]#pidof python
1169 825
2.使用top命令查看當(dāng)前的進(jìn)程狀態(tài)(動(dòng)態(tài))

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖3
任務(wù) 含義
Tasks: 129 total 當(dāng)然進(jìn)程的總數(shù)
1 running 正在運(yùn)行的進(jìn)程數(shù)
128 sleeping 睡眠的進(jìn)程數(shù)
0 stopped 停止的進(jìn)程數(shù)
0 zombie 僵尸進(jìn)程數(shù)
%Cpu(s) 平均cpu使用率,按1 查看每個(gè)cup具體狀態(tài)
0.7 us 用戶進(jìn)程占用cpu百分比
0.7 sys 內(nèi)核進(jìn)程占用百分比
0.0 ni 優(yōu)先級(jí)進(jìn)程占用cpu的百分比
98.7 id 空閑cup
0.0 wa CPU等待IO完成的時(shí)間,大量的io等待,會(huì)變高
0.0 hi 硬中斷,占的CPU百分比
0.0 si 軟中斷,占的CPU百分比
0.0 st 虛擬機(jī)占用物理CPU的時(shí)間

# w load average:平均負(fù)載 一分鐘,5分鐘,15分鐘PS: 如何理解中斷這個(gè)東西
top 常見指令

字母 含義
h 查看幫出
1 數(shù)字1,顯示所有CPU核心的負(fù)載
z 以高亮顯示數(shù)據(jù)
b 高亮顯示處于R(進(jìn)行中)狀態(tài)的進(jìn)程
M 按內(nèi)存使用百分比排序輸出
P 按CPU使用百分比排序輸出
q 退出top

# 第三方top
htop,top高級(jí):yum install htop -y
iftop網(wǎng)卡流量:yum install iftop -y
glances,直觀的顯示:yum install glances -y
-rz上傳文件,可以動(dòng)態(tài)看到,網(wǎng)卡情況
下載新repo 到/etc/yum.repos.d/

wget -O /etc/yum.repos.d/epel.repo?https://mirrors.aliyun.com/repo/epel-7.repoEpel?鏡像,第三方軟件庫
# 第三方top
htop,top高級(jí):yum install htop -y
iftop網(wǎng)卡流量:yum install iftop -y
glances,直觀的顯示:yum install glances -y
-rz上傳文件,可以動(dòng)態(tài)看到,網(wǎng)卡情況
uptime

[root@s22 ~]#uptime
top
首部信息

  • uptime信息 l 顯示與隱藏
  • tasks :進(jìn)程總數(shù),運(yùn)行,睡眠數(shù),停止數(shù),僵尸進(jìn)程 t
  • cpu信息: %Cpu(s): 0.3 us, 4.6 sy, 0.0 ni, 95.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
    用戶空間 系統(tǒng)空間 nice值 空閑 等待 硬中斷 軟中斷 虛擬機(jī)偷走時(shí)間
  • 內(nèi)存信息 m
  • cpu分別顯示 1(數(shù)字)

排序:
模式是cpu的占用率 P
M:內(nèi)存占用率
T: cpu的占用時(shí)間
退出:q
修改刷新頻率:s,默認(rèn)是3秒
殺死進(jìn)程:k,默認(rèn)是第一個(gè)
W 保存文件
選項(xiàng):
-d 刷新時(shí)間
-b 顯示所有的信息
-n # 指定刷新#次后退出
htop

  • epel源

3. 系統(tǒng)工具(epel三方庫下載),性能分析
free
顯示內(nèi)存

-b 字節(jié)vmstat

vmstat [options] [delay [count]]

iostat
查看磁盤讀寫速度
iostat 1 10
dstat 查看所有

-c cpuiftop 顯示網(wǎng)卡的流量
4.管理進(jìn)程狀態(tài),進(jìn)程的管理工具
當(dāng)程序運(yùn)行為進(jìn)程后,如果希望停止進(jìn)程,怎么辦呢? 那么此時(shí)我們可以使用linux的kill命令對(duì)進(jìn)程發(fā)送關(guān)閉信號(hào)。當(dāng)然除了kill、還有killall,pkill
1.使用kill -l列出當(dāng)前系統(tǒng)所支持的信號(hào)

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖4

雖然linux支持信號(hào)很多,但是我們僅列出我們最為常用的3個(gè)信號(hào)

數(shù)字編號(hào) 信號(hào)含義 信號(hào)翻譯
1 SIGHUP 通常用來重新加載配置文件,重新讀取一次參數(shù)的配置文件 (類似 reload)
9 SIGKILL 強(qiáng)制殺死進(jìn)程(有狀態(tài)的服務(wù)(存磁盤的,如mysql)強(qiáng)制停止可能會(huì)導(dǎo)致下次起不來)
15 SIGTERM 終止進(jìn)程,默認(rèn)kill使用該信號(hào)

1.我們使用kill命令殺死指定PID的進(jìn)程。

#1.給 vsftpd 進(jìn)程發(fā)送信號(hào) 1,15

2.Linux系統(tǒng)中的killall、pkill命令用于殺死指定名字的進(jìn)程。
我們可以使用kill命令殺死指定進(jìn)程PID的進(jìn)程,如果要找到我們需要?dú)⑺赖倪M(jìn)程,我們還需要在之前使用ps等命令再配合grep來查找進(jìn)程,而killall、pkill把這兩個(gè)過程合二為一,是一個(gè)很好用的命令。

#例0、通過服務(wù)名稱殺掉進(jìn)程kill
向進(jìn)程發(fā)送信號(hào),實(shí)現(xiàn)對(duì)進(jìn)程的管理,每個(gè)信號(hào),對(duì)應(yīng)不同的值,對(duì)應(yīng)不同的含義,不區(qū)分大小寫
查詢可用信號(hào):kill -l
常用信號(hào):
1) sighub 不需要關(guān)閉程序,重新加載配置文件
2)sigint 終止進(jìn)程,相當(dāng)于ctrl+c
9) sigkill 強(qiáng)制殺死進(jìn)程
15)sigterm 終止正在運(yùn)行的進(jìn)程
18)sigcont 繼續(xù)運(yùn)行
19)sigstop 后臺(tái)休眠
按照pid: kill-n pid
按照名稱:killall -n name
按照名稱:pkill -n name

5.管理后臺(tái)進(jìn)程,作業(yè)管理
1.什么是后臺(tái)進(jìn)程
通常進(jìn)程都會(huì)在終端前臺(tái)運(yùn)行,一旦關(guān)閉終端,進(jìn)程也會(huì)隨著結(jié)束,那么此時(shí)我們就希望進(jìn)程能在后臺(tái)運(yùn)行,就是將在前臺(tái)運(yùn)行的進(jìn)程放入后臺(tái)運(yùn)行,這樣及時(shí)我們關(guān)閉了終端也不影響進(jìn)程的正常運(yùn)行。
2.我們?yōu)槭裁匆獙⑦M(jìn)程放入后臺(tái)運(yùn)行
比如:我們此前在國(guó)內(nèi)服務(wù)器往國(guó)外服務(wù)器傳輸大文件時(shí),由于網(wǎng)絡(luò)的問題需要傳輸很久,如果在傳輸?shù)倪^程中出現(xiàn)網(wǎng)絡(luò)抖動(dòng)或者不小心關(guān)閉了終端則會(huì)導(dǎo)致傳輸失敗,如果能將傳輸?shù)倪M(jìn)程放入后臺(tái),是不是就能解決此類問題了。
3.使用什么工具將進(jìn)程放入后臺(tái)
早期的時(shí)候大家都選擇使用&符號(hào)將進(jìn)程放入后臺(tái),然后在使用jobs、bg、fg等方式查看進(jìn)程狀態(tài),但太麻煩了。也不直觀,所以我們推薦使用screen。
http://1.jobs、bg、fg的使用(強(qiáng)烈不推薦,了解即可)

[root@lqz ~]# sleep 3000 &?//運(yùn)行程序(時(shí)),讓其在后臺(tái)執(zhí)行

2.screen的使用(強(qiáng)烈推薦,生產(chǎn)必用)

#1.安裝

  • 前臺(tái)作業(yè):一直占用終端的作業(yè)
  • 后臺(tái)作業(yè):不占用當(dāng)前的終端

讓作業(yè)運(yùn)行于后臺(tái):

  • ctrl+z 對(duì)于啟動(dòng)中
  • command & 也會(huì)輸出到終端,還是會(huì)終端顯示

nohup ping?http://www.baidu.com?&
脫離終端:

  • nohup command &>/dev/null &(黑洞)

nohup ping?http://www.baidu.com?&>/dev/null &

  • screen

-list 查看所有的screen窗口
-r 進(jìn)入
6.進(jìn)程的優(yōu)先級(jí)[進(jìn)階]
1.什么優(yōu)先級(jí)
優(yōu)先級(jí)指的是優(yōu)先享受資源,比如排隊(duì)買票時(shí),軍人優(yōu)先、老人優(yōu)先。等等
2.為什么要有系統(tǒng)優(yōu)先級(jí)
舉個(gè)例子: 海底撈火鍋正常情況下響應(yīng)就特別快,那么當(dāng)節(jié)假日來臨時(shí)人員突增則會(huì)導(dǎo)致處理請(qǐng)求特別慢,那么假設(shè)我是海底撈VIP客戶(最高優(yōu)先級(jí)),無論門店多么繁忙,我都不用排隊(duì),海底撈人員會(huì)直接服務(wù)于我,滿足我的需求。至于沒有VIP的人員(較低優(yōu)先級(jí))則進(jìn)入排隊(duì)等待狀態(tài)。(PS: 至于等多久,那…..)
3.系統(tǒng)中如何給進(jìn)程配置優(yōu)先級(jí)?
在啟動(dòng)進(jìn)程時(shí),為不同的進(jìn)程使用不同的調(diào)度策略。 nice 值越高: 表示優(yōu)先級(jí)越低,例如+19,該進(jìn)程容易將CPU 使用量讓給其他進(jìn)程。 nice 值越低: 表示優(yōu)先級(jí)越高,例如-20,該進(jìn)程更不傾向于讓出CPU。

  1. 使用top或ps命令查看進(jìn)程的優(yōu)先級(jí)

#1.使用top可以查看nice優(yōu)先級(jí)。

  1. nice指定程序的優(yōu)先級(jí)。語法格式 nice -n 優(yōu)先級(jí)數(shù)字 進(jìn)程名稱

#1.開啟vim并且指定程序優(yōu)先級(jí)為-5 -5

  1. renice命令修改一個(gè)正在運(yùn)行的進(jìn)程優(yōu)先級(jí)。語法格式 renice -n 優(yōu)先級(jí)數(shù)字 進(jìn)程pid

#1.查看sshd進(jìn)程當(dāng)前的優(yōu)先級(jí)狀態(tài)生產(chǎn)案例、Linux出現(xiàn)假死,怎么辦,又如何通過nice解決?
7.系統(tǒng)平均負(fù)載[進(jìn)階]
每次發(fā)現(xiàn)系統(tǒng)變慢時(shí),我們通常做的第一件事,就是執(zhí)行 top 或者 uptime 命令,來了解系統(tǒng)的負(fù)載情況。比如像下面這樣,我在命令行里輸入了 uptime 命令,系統(tǒng)也隨即給出了結(jié)果。

[root@m01 ~]# uptime
1.什么是平均負(fù)載
平均負(fù)載不就是單位時(shí)間內(nèi)的 CPU 使用率嗎?上面的 0.70,就代表 CPU 使用率是 70%。其實(shí)上并….. 那到底如何理解平均負(fù)載: 平均負(fù)載是指單位時(shí)間內(nèi),系統(tǒng)處于可運(yùn)行狀態(tài)和不可中斷狀態(tài)的平均進(jìn)程數(shù),也就是平均活躍進(jìn)程數(shù), PS: 平均負(fù)載與 CPU 使用率并沒有直接關(guān)系。
2.可運(yùn)行狀態(tài)和不可中斷狀態(tài)是什么
1.可運(yùn)行狀態(tài)進(jìn)程,是指正在使用 CPU 或者正在等待 CPU 的進(jìn)程,也就是我們ps 命令看到處于 R 狀態(tài)的進(jìn)程。
2.不可中斷進(jìn)程,(你做什么事情的時(shí)候是不能打斷的?) 系統(tǒng)中最常見的是等待硬件設(shè)備的 I/O 響應(yīng),也就是我們ps 命令中看到的 D 狀態(tài)(也稱為 Disk Sleep)的進(jìn)程。
例如: 當(dāng)一個(gè)進(jìn)程向磁盤讀寫數(shù)據(jù)時(shí),為了保證數(shù)據(jù)的一致性,在得到磁盤回復(fù)前,它是不能被其他進(jìn)程或者中斷打斷的,這個(gè)時(shí)候的進(jìn)程就處于不可中斷狀態(tài)。如果此時(shí)的進(jìn)程被打斷了,就容易出現(xiàn)磁盤數(shù)據(jù)與進(jìn)程數(shù)據(jù)不一致的問題。所以,不可中斷狀態(tài)實(shí)際上是系統(tǒng)對(duì)進(jìn)程和硬件設(shè)備的一種保護(hù)機(jī)制。
劃重點(diǎn),因此你可以簡(jiǎn)單理解為,平均負(fù)載其實(shí)就是單位時(shí)間內(nèi)的活躍進(jìn)程數(shù)。
3.那平均負(fù)載為多少時(shí)合理
最理想的狀態(tài)是每個(gè) CPU 上都剛好運(yùn)行著一個(gè)進(jìn)程,這樣每個(gè) CPU 都得到了充分利用。所以在評(píng)判平均負(fù)載時(shí),首先你要知道系統(tǒng)有幾個(gè) CPU,這可以通過 top 命令獲取,或grep 'model name' /proc/cpuinfo
例1、假設(shè)現(xiàn)在在 4、2、1核的CPU上,如果平均負(fù)載為 2 時(shí),意味著什么呢?
Q1.在4 個(gè) CPU 的系統(tǒng)上,意味著 CPU 有 50% 的空閑。
Q2.在2 個(gè) CPU 的系統(tǒng)上,意味著所有的 CPU 都剛好被完全占用。
Q3.而1 個(gè) CPU 的系統(tǒng)上,則意味著有一半的進(jìn)程競(jìng)爭(zhēng)不到 CPU。
PS: 平均負(fù)載有三個(gè)數(shù)值,我們應(yīng)該關(guān)注哪個(gè)呢?
實(shí)際上,我們都需要關(guān)注。就好比上海4月的天氣,如果只看晚上天氣,感覺在過冬天呢。但如果你結(jié)合了早上、中午、晚上三個(gè)時(shí)間點(diǎn)的溫度來看,基本就可以全方位了解這一天的天氣情況了。
1.如果 1 分鐘、5 分鐘、15 分鐘的三個(gè)值基本相同,或者相差不大,那就說明系統(tǒng)負(fù)載很平穩(wěn)。
2.但如果 1 分鐘的值遠(yuǎn)小于 15 分鐘的值,就說明系統(tǒng)最近 1 分鐘的負(fù)載在減少,而過去 15 分鐘內(nèi)卻有很大的負(fù)載。
3.反過來,如果 1 分鐘的值遠(yuǎn)大于 15 分鐘的值,就說明最近 1 分鐘的負(fù)載在增加,這種增加有可能只是臨時(shí)性的,也有可能還會(huì)持續(xù)上升,所以就需要持續(xù)觀察。
PS: 一旦 1 分鐘的平均負(fù)載接近或超過了 CPU 的個(gè)數(shù),就意味著系統(tǒng)正在發(fā)生過載的問題,這時(shí)就得分析問題,并要想辦法優(yōu)化了
在來看個(gè)例子3、假設(shè)我們?cè)谟?個(gè) CPU 系統(tǒng)上看到平均負(fù)載為 2.73,6.90,12.98
那么說明在過去1 分鐘內(nèi),系統(tǒng)有 136% 的超載 (2.73/2=136%)
而在過去 5 分鐘內(nèi),有 345% 的超載 (6.90/2=345%)
而在過去15 分鐘內(nèi),有 649% 的超載,(12.98/2=649%)
但從整體趨勢(shì)來看,系統(tǒng)的負(fù)載是在逐步的降低。
4.那么在實(shí)際生產(chǎn)環(huán)境中,平均負(fù)載多高時(shí),需要我們重點(diǎn)關(guān)注呢?
當(dāng)平均負(fù)載高于 CPU 數(shù)量 70% 的時(shí)候,你就應(yīng)該分析排查負(fù)載高的問題了。一旦負(fù)載過高,就可能導(dǎo)致進(jìn)程響應(yīng)變慢,進(jìn)而影響服務(wù)的正常功能。
但 70% 這個(gè)數(shù)字并不是絕對(duì)的,最推薦的方法,還是把系統(tǒng)的平均負(fù)載監(jiān)控起來,然后根據(jù)更多的歷史數(shù)據(jù),判斷負(fù)載的變化趨勢(shì)。當(dāng)發(fā)現(xiàn)負(fù)載有明顯升高趨勢(shì)時(shí),比如說負(fù)載翻倍了,你再去做分析和調(diào)查。
5.平均負(fù)載與 CPU 使用率有什么關(guān)系
在實(shí)際工作中,我們經(jīng)常容易把平均負(fù)載和 CPU 使用率混淆,所以在這里,我也做一個(gè)區(qū)分??赡苣銜?huì)疑惑,既然平均負(fù)載代表的是活躍進(jìn)程數(shù),那平均負(fù)載高了,不就意味著 CPU 使用率高嗎?
我們還是要回到平均負(fù)載的含義上來,平均負(fù)載是指單位時(shí)間內(nèi),處于可運(yùn)行狀態(tài)和不可中斷狀態(tài)的進(jìn)程數(shù)。所以,它不僅包括了正在使用 CPU 的進(jìn)程,還包括等待 CPU 和等待 I/O 的進(jìn)程。
而 CPU 使用率,是單位時(shí)間內(nèi) CPU 繁忙情況的統(tǒng)計(jì),跟平均負(fù)載并不一定完全對(duì)應(yīng)。比如:
CPU 密集型進(jìn)程,使用大量 CPU 會(huì)導(dǎo)致平均負(fù)載升高,此時(shí)這兩者是一致的;
I/O 密集型進(jìn)程,等待 I/O 也會(huì)導(dǎo)致平均負(fù)載升高,但 CPU 使用率不一定很高;
大量等待 CPU 的進(jìn)程調(diào)度也會(huì)導(dǎo)致平均負(fù)載升高,此時(shí)的 CPU 使用率也會(huì)比較高。
6.平均負(fù)載案例分析實(shí)戰(zhàn)
下面,我們以三個(gè)示例分別來看這三種情況,并用 stress、mpstat、pidstat 等工具,找出平均負(fù)載升高的根源。
stress 是 Linux 系統(tǒng)壓力測(cè)試工具,這里我們用作異常進(jìn)程模擬平均負(fù)載升高的場(chǎng)景。
mpstat 是多核 CPU 性能分析工具,用來實(shí)時(shí)查看每個(gè) CPU 的性能指標(biāo),以及所有 CPU 的平均指標(biāo)。
pidstat 是一個(gè)常用的進(jìn)程性能分析工具,用來實(shí)時(shí)查看進(jìn)程的 CPU、內(nèi)存、I/O 以及上下文切換等性能指標(biāo)。

#如果出現(xiàn)無法使用mpstat、pidstat命令查看%wait指標(biāo)建議更新下軟件包場(chǎng)景一:CPU 密集型進(jìn)程
1.首先,我們?cè)诘谝粋€(gè)終端運(yùn)行 stress 命令,模擬一個(gè) CPU 使用率 100% 的場(chǎng)景:
[root@m01 ~]# stress –cpu 1 –timeout 600
2.接著,在第二個(gè)終端運(yùn)行 uptime 查看平均負(fù)載的變化情況

# 使用watch -d 參數(shù)表示高亮顯示變化的區(qū)域(注意負(fù)載會(huì)持續(xù)升高)3.最后,在第三個(gè)終端運(yùn)行 mpstat 查看 CPU 使用率的變化情況

# -P ALL 表示監(jiān)控所有 CPU,后面數(shù)字 5 表示間隔 5 秒后輸出一組數(shù)據(jù)

4.從終端二中可以看到,1 分鐘的平均負(fù)載會(huì)慢慢增加到 1.00,而從終端三中還可以看到,正好有一個(gè) CPU 的使用率為 100%,但它的 iowait 只有 0。這說明,平均負(fù)載的升高正是由于 CPU 使用率為 100% 。那么,到底是哪個(gè)進(jìn)程導(dǎo)致了 CPU 使用率為 100% 呢?可以使用 pidstat 來查詢

# 間隔 5 秒后輸出一組數(shù)據(jù)

場(chǎng)景二:I/O 密集型進(jìn)程
1.首先還是運(yùn)行 stress 命令,但這次模擬 I/O 壓力,即不停地執(zhí)行 sync

[root@m01 ~]# stress –io 1 –timeout 600s
2.然后在第二個(gè)終端運(yùn)行 uptime 查看平均負(fù)載的變化情況:

[root@m01 ~]# watch -d uptime3.最后第三個(gè)終端運(yùn)行 mpstat 查看 CPU 使用率的變化情況:

# 顯示所有 CPU 的指標(biāo),并在間隔 5 秒輸出一組數(shù)據(jù)

4.那么到底是哪個(gè)進(jìn)程,導(dǎo)致 iowait 這么高呢?我們還是用 pidstat 來查詢

# 間隔 5 秒后輸出一組數(shù)據(jù),-u 表示 CPU 指標(biāo)

場(chǎng)景三:大量進(jìn)程的場(chǎng)景
當(dāng)系統(tǒng)中運(yùn)行進(jìn)程超出 CPU 運(yùn)行能力時(shí),就會(huì)出現(xiàn)等待 CPU 的進(jìn)程。
1.首先,我們還是使用 stress,但這次模擬的是 4 個(gè)進(jìn)程

[root@m01 ~]# stress -c 4 –timeout 600
2.由于系統(tǒng)只有 1 個(gè) CPU,明顯比 4 個(gè)進(jìn)程要少得多,因而,系統(tǒng)的 CPU 處于嚴(yán)重過載狀態(tài)

[root@m01 ~]# watch -d uptime3.然后,再運(yùn)行 pidstat 來看一下進(jìn)程的情況:

# 間隔 5 秒后輸出一組數(shù)據(jù)可以看出,4 個(gè)進(jìn)程在爭(zhēng)搶 1 個(gè) CPU,每個(gè)進(jìn)程等待 CPU 的時(shí)間(也就是代碼塊中的 %wait 列)高達(dá) 75%。這些超出 CPU 計(jì)算能力的進(jìn)程,最終導(dǎo)致 CPU 過載。
分析完這三個(gè)案例,我再來歸納一下平均負(fù)載與CPU
平均負(fù)載提供了一個(gè)快速查看系統(tǒng)整體性能的手段,反映了整體的負(fù)載情況。但只看平均負(fù)載本身,我們并不能直接發(fā)現(xiàn),到底是哪里出現(xiàn)了瓶頸。所以,在理解平均負(fù)載時(shí),也要注意:
平均負(fù)載高有可能是 CPU 密集型進(jìn)程導(dǎo)致的;
平均負(fù)載高并不一定代表 CPU 使用率高,還有可能是 I/O 更繁忙了;
當(dāng)發(fā)現(xiàn)負(fù)載高的時(shí)候,你可以使用 mpstat、pidstat 等工具,輔助分析負(fù)載的來源

安全
防火墻

  • 綠盟
  • 深信服
  • 啟明星辰
  • 飛塔
  • 思科
  • 華為
  • 華三

(網(wǎng)關(guān)處的硬件防火墻)

4表5鏈
selinux
美國(guó)國(guó)家安全局

  • 配置文件 /etc/selinux/config
  • SELINUX=disabled # 關(guān)掉防火墻
  • setenforce 0 臨時(shí)生效
  • getenforce 查看selinux的狀態(tài)

紅帽認(rèn)證:
rhcea
rhce
rhca
思考認(rèn)證:
ccnp
ccie
ccia
orcal認(rèn)證:
ocp

鏈接:https://www.cnblogs.com/coderxueshan/p/17950646
(版權(quán)歸原作者所有,侵刪)

全面掌控Linux進(jìn)程與安全:從基礎(chǔ)管理到高級(jí)防護(hù)技巧插圖5

相關(guān)新聞

歷經(jīng)多年發(fā)展,已成為國(guó)內(nèi)好評(píng)如潮的Linux云計(jì)算運(yùn)維、SRE、Devops、網(wǎng)絡(luò)安全、云原生、Go、Python開發(fā)專業(yè)人才培訓(xùn)機(jī)構(gòu)!