ubuntu

Ubuntu 20.04 LTS Setting (CUDA, cuDNN)

블로그이전>> 2024. 5. 21. 12:27

#2024-05-20

 

pytorch, tesorflow 등 사용 계획이 있다면

설치 전, 호환 버전을 모두 확인한 후에 cuda, cudnn, pytorch, tensorflow의 버전을 결정 후에 설치하는 것이 유용

Ubuntu install

  • Ubuntu 20.04 LTS
  • CPU : 12th Gen Intel(R) Core(TM) i7-12700K
  • GPU : Nvidia GeForce RTX 4070 Ti
  • nvidia-driver-535
  • CUDA 11.8
  • cuDNN 8.9.7

nouveau chipset Error

grub 창에서 e → Edit 창

quiet splash --- → quiet splash nomodeset 입력

nomodeset : 인텔 그래픽 기능 비활성화

ctrl+x or F10 : 저장하고 재부팅

 

재부팅 후 nomodeset 유지 위해 Recovery mode에서

sudo vi /etc/modprobe.d/blacklist.conf

 

가장 끝 글자에서 a : 입력모드

blacklist nouveau 추가

Esc :wq : 저장 후 나가기

 

참조

 

Nvidia driver autoinstall 이후 부팅 시 블랙스크린 (clean, files, blocks)

논문 리뷰는 안하고 맨날 혼자 삽질하고 혼자 해결하는 듯 하지만 닐스 보어가 하는 말이 나에게 위로를 준다 그러므로 오늘도 나의 실수를 남긴다... 환경) ubuntu 18.04 Geforce rtx 3070 ti gpu RTX 3070 ti

sdpcs.tistory.com

 

Ubuntu 설치 시 nouveau 오류, 빈화면 문제

Ubuntu 설치 시 nouveau 오류를 볼 수 있는데,이는 nvidia와 충돌되어 나타나는 오류라고한다. 그리고 우분투 설치 후, 부팅 시 보라색 화면만 뜨고,아무것도 뜨지 않는 현상이 발생하는데이는 내가 생

gldmg.tistory.com

 


nvidia driver, cuda, cudnn Install

기존 nvidia-driver와의 충돌이 있을 수 있으므로 nvidia 패키지를 찾아보고 있다면 제거

dpkg -l | grep nvidia

sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
sudo apt-get autoremove
sudo apt-get autoclean

 

1. NVIDIA-driver

sudo ubuntu-drivers devices

 

recommended된 버전 찾아서 설치 (다만, 뒤에 server, open 등의 단어는 무시하고 nvidia-driver-[version])

sudo apt install nvidia-driver-535
sudo apt update
sudo apt upgrade
sudo reboot

 

재부팅 후에 nvidia-smi 에서 error 없이 Driver version이 잘 나오면 됨

(여기 적혀있는 cuda version은 설치된 version이 아님)

nvidia-smi

Nvidia Driver 설치 후, 확인

 

2. CUDA

cuda는 호환되는 버전 찾아서 설치 여기서는 11.8

인터넷에 cuda 11.8 검색 후 나오는 Toolkit 설치

앞서 원하는 version의 driver를 설치한 상태이므로, driver를 제외하고 설치하기 위해 runfile (local)로 진행

 

https://developer.nvidia.com/cuda-11-8-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local

 

CUDA Toolkit 11.8 Downloads

 

developer.nvidia.com

 

CUDA Toolkit 11.8 Downloads
Cuda runfile 설치 방법

 

sh 명령어로 runfile 실행하기 전에, 권한 주기

(chmod a+r : 모든 사용자에게 읽기 권한 부여)

chmod a+r cuda_11.8.0_520.61.05_linux.run

 

Continue 선택

Driver 체크 해제하고, Install 선택

Summary 받으면 설치 완료

설치 완료 후, bashrc 파일에서 export로 환경변수 설정

sudo gedit ~/.bashrc
export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64$:$LD_LIBRARY_PATH

 

저장 후, 터미널에 변경사항 적용

source ~/.bashrc

 

nvcc -V 했을 때, 아래와 같이 나오면 정상적으로 설치 완료

Cuda 설치 완료 후, 확인

 

 

3. cuDNN

설치한 Cuda version과 호환되는 cuDNN 찾아 Local installer for Linux x86_64(Tar) 설치

여기서는 CUDA 11.x와 호환되는 8.9.7 version의 cuDNN을 설치

cuDNN v8.9.7
cuDNN Install

다운로드한 폴더에서 압축 풀기

압축 푼 후에 아래와 같이 필요한 파일들 복사해 주고 권한 부여

cd Downloads/
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda11-archive/

sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/include/cudnn* /usr/local/cuda/lib64
sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/lib/libcudnn* /usr/local/cuda/lib64

sudp chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

 

cuda 설치한 경로로 이동한 후에 symbolic link 생성

cd /usr/local/cuda-11.8/lib64

sudo ln -sf libcudnn.so.8.9.7 libcudnn.so.8
sudo ln -sf libcudnn.so.8 libcudnn.so

sudo ln -sf libcudnn_adv_infer.so.8.9.7 libcudnn_adv_infer.so.8
sudo ln -sf libcudnn_adv_infer.so.8 libcudnn_adv_infer.so
sudo ln -sf libcudnn_adv_train.so.8.9.7 libcudnn_adv_train.so.8
sudo ln -sf libcudnn_adv_train.so.8 libcudnn_adv_train.so
sudo ln -sf libcudnn_cnn_infer.so.8.9.7 libcudnn_cnn_infer.so.8
sudo ln -sf libcudnn_cnn_infer.so.8 libcudnn_cnn_infer.so
sudo ln -sf libcudnn_cnn_train.so.8.9.7 libcudnn_cnn_train.so.8
sudo ln -sf libcudnn_cnn_train.so.8 libcudnn_cnn_train.so
sudo ln -sf libcudnn_ops_infer.so.8.9.7 libcudnn_ops_infer.so.8
sudo ln -sf libcudnn_ops_infer.so.8 libcudnn_ops_infer.so
sudo ln -sf libcudnn_ops_train.so.8.9.7 libcudnn_ops_train.so.8
sudo ln -sf libcudnn_ops_train.so.8 libcudnn_ops_train.so

sudo ldconfig

Symbolic link 생성 후

생성이 잘 됐는지 확인

ldconfig -N -v $(sed 's/:/ /' <<< $LD_LIBRARY_PATH) 2</dev/null | grep libcudnn

 

cuDNN이 잘 설치되면 아래 명령어 입력 시, 사진과 같이 뜸

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

cuDNN 설치 확인

 

 

참조

 

GPU 사용 환경 설정 with CUDA, cuDNN

Deep learning 학습을 위한 CUDA, cuDNN 설치 과정

velog.io

 

cuda driver install

꾸다 와 도라이바 재설치 과정 먼저 gui로 사용되는 것을 중지하기 위해 systemctl stop gdm GDM은 Linux에서 그래픽 사용자 인터페이스(GUI) 관리하는 역할을 하는데, 위의 명령어로 GNOME Display Manager(GDM)

velog.io

 

Ubuntu 20.04에서 nvidia driver, cuda, cudnn, pytorch 설치의 모든 것

ubuntu 20.04, nvidia driver 495, cuda 11.3, cudnn 8.2.1, pytorch 버전을 설치하는 방법입니다.

ingu627.github.io

 

Install CUDA 11.8 & CUDNN 8.9.1 on Ubuntu 20.04

CUDA NOTE: 이미 호환되는 driver 확인 후 설치하였으니 여기서 driver는 해제하고 설치한다 설치가 완료되면 아래처럼 뜬다 여기서 뜨는 WARNING은 graphic driver를 같이 설치하지 않아서 뜨는 것 때문에

velog.io