본문 바로가기

기타/시스템 설정

딥러닝 서버 환경 구축(1) : CUDA

728x90

지난 글에서는 웹서버로 사용하기 위한 우분투 서버 20.04 LTS를 설치하였습니다.

이번에는 딥러닝 서버를 설치해 보겠습니다.

 

 

 

가장 먼저... 사용 중인 웹서버와 동일하게 Ubuntu 20.04 데스크탑 버전을 설치합니다.
딥러닝 서버와 웹서버는 동일한 OS를 설치할 필요는 없지만 그냥 통일했습니다.
두 OS간의 차이가 있어서 발생하는 문제에 대해서는(웹을 통하기때문에 그런 경우는 거의 없겠지만) 걱정하지 않아도 되겠죠.

 

일단 필요한 것을 생각해봅시다.

당연히 기본적으로 파이썬이 필요합니다.
그리고 matplotlib, pandas, numpy 등 데이터 분석에 많이 사용되는 범용 라이브러리들을 설치해야겠죠.
또 Tensorflow나 PyToach 같은 딥러닝 용 라이브러리도 설치해야합니다.
그리고 GPU를 활용하기 위해서는 NVIDIA 드라이브와 CUDA, cuDNN 등도 필요합니다.

 

그럼 이번 글에서는 먼저 NVIDIA 드라이버와 CUDA를 설치하고 다음 글에서 파이썬 및 관련 라이브러리들을 설치해 보겠습니다.

 

먼저 시스템을 최신상태로 만듭니다.

$ sudo apt update
$ sudo apt upgrade

 

NVIDIA 그래픽 카드를 장착하고 있는 시스템이라면 GPU를 활용하기 위하여 NVIDIA 드라이버를 설치해야 합니다.
연구실의 시스템에 우분투 20.04를 설치했더니 이미 NVIDIA 드라이버가 설치되어 있군요.
nvidia-smi로 확인해보아도 잘 동작합니다.

 

nvidia-smi로 드라이버 동작 확인

그런데 집에 있는 메인 시스템은 NVIDIA 그래픽카드를 장착하고 있는데 기본적으로 설치되어 있지 않네요.
동일한 우분투 20.04 설치이미지로 설치했는데 뭐가 다른건지..

아무튼 드라이버가 설치되어 있지 않다면 다음과 같이 설치하도록 합니다.

 

여러 명령어들이 있지만... 그냥 쉽게.. 우분투가 지원해 주는 기능을 사용하죠.

작업표시줄에서 "프로그램 표시" 버튼을 눌러서 "추가 드라이버"프로그램을 실행합니다.

그럼 알아서 추가 드라이버를 검색해줍니다.

여기서 가장 적절한 버전의 NVIDIA 드라이버를 선택해서 적용하면 됩니다. 

위와 같은 드라이버를 찾지 못한다면 NVIDIA 그래픽 카드(모듈)이 설치되어 있지 않거나 다른 문제가 있어서 정상적으로 동작하지 않는 경우입니다.

 

( 참고로... 위의 이미지는 우분투 설치 시 자동으로 NVIDIA 드라이버가 설치되지 않은 집의 시스템에서 드라이버를 설치하며 캡처한 이미지라서 이 후에 나오는 NVIDIA 드라이버의 버전과는 다릅니다. 이 후의 NVIDIA는 연구실의 시스템을 기준으로 합니다. )

 

설치가 완료되면 안전하게 재부팅을 한 번 해 줍시다.

 

 

 

 

NVIDIA 드라이버 설치가 끝났다면 이제 CUDA를 설치해 보겠습니다.
가장 확실한 안내서는 NVIDIA 공식사이트겠죠.

아래의 링크를 통해서 NVIDIA CUDA 공식사이트에서 우분투 20.04 버전용 설치 안내를 보실 수 있습니다.
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=2004&target_type=deblocal

 

CUDA Toolkit 11.0 Update 1 Downloads

Select Target Platform Click on the green buttons that describe your target platform. Only supported platforms will be shown. By downloading and using the software, you agree to fully comply with the terms and conditions of the CUDA EULA. Operating System

developer.nvidia.com

$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
$ sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
$ sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get -y install cuda

˙ ˙ ˙

이것으로 CUDA의 설치가 끝났습니다.
NVIDIA 드라이버 로드를 위해서 재부팅을 해 주세요.
저의 경우에는 이미 드라이버가 설치, 로딩되어 있는 상태여서 바로 다음작업으로 진행했습니다.
재부팅이 완료되고 나면 설치된 CUDA를 사용하기 위한 환경, 즉 PATH(경로)와 환경변수를 설정해 줍니다.

$ export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64\
                         ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

CUDA를 사용하기 위한 환경 설정도 완료되었습니다.
이제 제대로 설치되었는지 확인해 보아야겠죠.

$ nvcc --version

그럼 마지막으로 제대로 동작하는지 확인해 보기 위해서 CUDA가 제공하는 샘플을 빌드해서 실행시켜 보겠습니다.

$ cuda-install-samples-11.0.sh ~
$ cd ~/NVIDIA_CUDA-11.0_Samples/5_Simulations/nbody
$ make

자.. 이제 CUDA 샘플의 빌드가 완료되었으니 실행을 해 보겠습니다.

$ ./nbody

여기까지해서 NVIDIA 드라이버, CUDA 툴킷의 설치, 설정을 완료하여 GPU를 활용할 기본 준비가 되었습니다.

사실 예전에는 CUDA까지 설치하는 것이 꽤 어려웠는데 요즘은 상당히 편해졌네요.
다음 글에서는 Python의 설치와 Tensorflow, PyTorch 등의 설치를 진행해 보겠습니다.

 

 

※ CUDA 설치가 완료된 후 제대로 설치되었는지 테스트 할 때, 위에서 사용한 것처럼 실제 앱을 동작시켜보는 방법 외에 설치된 CUDA-Toolkit의 버전을 확인하는 방법을 사용하기도 합니다. 그런데 정상적으로 설치되고 앱도 동작하고 있는데 버전확인이 되지 않는 경우도 있습니다. 이런 경우는 대체로 경로 설정이 제대로 되어 있지 않은 경우이므로 경로설정을 수정해 주면 해결됩니다. 위에서 한 번 다루고 있지만 제대로 설정하고 정상동작을 했었는데 다시 안되는 경우가 가끔 있더군요.

$ nvcc --version

$ ls /usr/local/cuda/bin

$ export PATH="/usr/local/cuda/bin:$PATH"
$ export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
$ source ~/.bashrc

$ nvcc --version

 

 

 

 

728x90
반응형