CUDA Advent Calendar 2019 19日目の記事です.
Nsight Computeって何?
CUDAで提供されているプロファイリングツールの一つです.
nvprof/nvvpの廃止に伴い移行が推奨されています.
GUI版とCUI版があるのですが,今回はGUI版でローカルのGPUを用いる場合の方法を紹介します.
CUI版のNsight Computeの使い方はこちら.
使い方
- CUDA_TOOLKIT_PATH/NsightCompute-2019.3/nv-nsight-cu (CUDA_TOOLKIT_PATHはCUDA Toolkitをインストールした場所.which nvccとかするとわかるかも)を実行します.
CUDA11あたりからCUDA_TOOLKIT_PATH/NsightCompute-2019.3ではなくnvccと同じディレクトリにあるかもしれないです.
初回起動時はワークスペースをどこに作るか聞かれるかもしれませんが,適当に選択して次に進みましょう. - 実行するとメニューウィンドウが出てくるのでQuick LaunchのContinueを選択します.
- 次のウィンドウで実行ファイルのパスや実行時引数,どのディレクトリで実行するか,設定する環境変数などを選択します.
- ここまで来ると実行ファイルの実行に入ります.
この画面では実行ファイルが一時停止状態となっており,赤枠に示したボタンを何回か押してプロファイルを取りたいカーネル関数まで実行します.
- プロファイルを取りたいカーネルまで移動したら赤枠で示したカーネルのプロファイリングボタンを押します.
- これにてカーネル関数のプロファイリングが行われ,そのカーネル関数のリソースの使用率等が右側に表示されます.
おわり&エラーが起きる場合
体感nvvpより高速な気がします.
もし「ERR_NVGPUCTRPERM: Permission issue with Performance Counters」みたいに怒られる場合はこちらを参考にカーネルモジュールのロード設定をしてみてください.
カテゴリー:CUDA
記事作成日:2019-12-19