古いGPUでCUDAのインストールに失敗する場合の対応

目次

Einglish page is here.

何が起きたか

Kepler世代のGPUのグラボの刺さった計算機にCUDA 10.0をrunfileでインストールしようとしたらエラーが出た.
Install時のエラーログはこんな感じ.

[mutsuki@kaya-01 ~]$ cat /var/log/cuda-installer.log
[INFO]: Setting silent=true
[INFO]: Silent install of all components
[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /bin/gcc

[INFO]: gcc version: gcc バージョン 4.8.5 20150623 (Red Hat 4.8.5-39) (GCC)

[INFO]: Initializing menu
[INFO]: Components to install:
[INFO]: Driver
[INFO]: 418.87.00
[INFO]: Executing NVIDIA-Linux-x86_64-418.87.00.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd  2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 418.87.00 failed, quitting
単純にCUDAが古いGPUをサポートしていない問題のよう.
この場合古いCUDA(NVIDIA)ドライバをインストールすれば一応使える.

解決法

CUDA 9.0などをインストールすればいいと思ったが,runfileでインストールしようとすると同様のエラーが出る.
そこでCUDAのToolkitとドライバを別々にインストールする.

ドライバのインストール

ここから古いドライバ単体のrun fileをダウンロードしインストール.
Kepler世代であれば300番台のドライバにすればいい.
sudo sh NVIDIA-Linux-x86_64-390.129.run -s
-sは--silentモード.
CentOSの場合はkernel-devel,kernel-headerなどをインストールしておかないとエラーがでる.

Toolkitのインストール

CUDA 9.0など古いCUDAのrunfileを使ってToolkitだけインストールする.

sudo sh CUDA......run -s -toolkit

カテゴリー:サーバ
記事作成日:2019-09-29