Development/Nvidia GPU

[Linux] GPU 모니터링

jstar0525 2022. 12. 12. 21:19
반응형

GPU의 상황을 보기 위해서는

아래와 같은 명령을 실행한다.

$ nvidia-smi
Mon Dec 12 20:18:25 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.86.01    Driver Version: 515.86.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A |
| N/A   42C    P8     8W /  N/A |     19MiB /  6144MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       935      G   /usr/lib/xorg/Xorg                 12MiB |
|    0   N/A  N/A      1135      G   /usr/bin/gnome-shell                4MiB |
+-----------------------------------------------------------------------------+

 

만약 지속적으로 모니터링을 하기 위해서

아래의 명령을 실행한다.

$ watch -n 1 nvidia-smi
Every 1.0s: nvidia-smi                                    xxxxxxxxxx: Mon Dec 12 20:17:50 2022

Mon Dec 12 20:17:50 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.86.01    Driver Version: 515.86.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A |
| N/A   42C    P8     7W /  N/A |     19MiB /  6144MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       935      G   /usr/lib/xorg/Xorg                 12MiB |
|    0   N/A  N/A      1135      G   /usr/bin/gnome-shell                4MiB |
+-----------------------------------------------------------------------------+

여기서, 1은 1초를 의미하여 1초 간격으로 값을 받는다는 의미이다.

따라서 상황에 맞게 해당 명령어를 수정하면 된다.

 

그리고 위 명령에서 빠져나오기 위해서는

Ctrl + C를 누르면 된다.

 

반응형