Nsight Computeの簡単な使い方

目次

CUDA Advent Calendar 2019 19日目の記事です.

Nsight Computeって何?

CUDAで提供されているプロファイリングツールの一つです.
nvprof/nvvpの廃止に伴い移行が推奨されています.
GUI版とCUI版があるのですが,今回はGUI版でローカルのGPUを用いる場合の方法を紹介します.
CUI版のNsight Computeの使い方はこちら

使い方

  1. CUDA_TOOLKIT_PATH/NsightCompute-2019.3/nv-nsight-cu (CUDA_TOOLKIT_PATHはCUDA Toolkitをインストールした場所.which nvccとかするとわかるかも)を実行します.
    CUDA11あたりからCUDA_TOOLKIT_PATH/NsightCompute-2019.3ではなくnvccと同じディレクトリにあるかもしれないです.
    初回起動時はワークスペースをどこに作るか聞かれるかもしれませんが,適当に選択して次に進みましょう.
  2. 実行するとメニューウィンドウが出てくるのでQuick LaunchのContinueを選択します.
  3. 次のウィンドウで実行ファイルのパスや実行時引数,どのディレクトリで実行するか,設定する環境変数などを選択します.
  4. ここまで来ると実行ファイルの実行に入ります.
    この画面では実行ファイルが一時停止状態となっており,赤枠に示したボタンを何回か押してプロファイルを取りたいカーネル関数まで実行します.
  5. プロファイルを取りたいカーネルまで移動したら赤枠で示したカーネルのプロファイリングボタンを押します.
  6. これにてカーネル関数のプロファイリングが行われ,そのカーネル関数のリソースの使用率等が右側に表示されます.

おわり&エラーが起きる場合

体感nvvpより高速な気がします.
もし「ERR_NVGPUCTRPERM: Permission issue with Performance Counters」みたいに怒られる場合はこちらを参考にカーネルモジュールのロード設定をしてみてください.

カテゴリー:CUDA
記事作成日:2019-12-19