Irayレンダリングのためのビデオカード選び その1

Category : Iray Renderer
DAZ Studio 4.8 Proから搭載されたNVIDIA Irayレンダリングエンジンは、フォトリアルなレンダリングを可能にする高性能なレンダラーですが、その分レンダリング時間が長くなる傾向にあります。
それを補助しレンダリング速度のアップを実現するために、Irayレンダラーはビデオカードを利用したレンダリングをすることができます。

じゃあGPUレンダリングはどのくらいレンダリング時間が短縮されるのか、これからビデオカードを買うとしてどれを選べばいいのかは、当然疑問に思うところです。
今回は私の環境でのGPUレンダリング時間調査の結果と、ビデオカードを選ぶ基準について記事にしました。

※この記事ではCPUのみを使ったレンダリングをCPUレンダリング、GPUのみを使ったレンダリングをGPUレンダリングと呼んでいます。
※ビデオカードを選ぶ基準のベンチマーク結果の表を一部訂正しました。(2015.9.10)

IrayCard1 SS


■テスト環境とテスト用シーン

GPUレンダリングについての検証をするにあたって、テストに使用したPC環境は次の通りです。
CPUIntel Core i5-2500K 3.30GHz
メインメモリDDR3 16GB
GPUNVIDIA GeForce GTX 660
ビデオメモリGDDR5 2GB

メモリ使用量の計測には次のアプリケーションを使用しています。
<メインメモリ(PCメモリ)>
 Windowsの「リソース モニター」を使ってプロセス:DAZStudio.exeのプライベートRAMを測定。
<ビデオメモリ>
 Windowsデスクトップガジェットの「GPU Observer」を使ってMemory Loadを測定。

テストに使用するシーンは、オブジェクトやテクスチャの量が異なるものを複数作成しました。

(A)IRAYサンプルシーン・MaterialBall
   ポリゴン数:中 テクスチャ量:小
(B)裸体の「Genesis 2 Female」(髪もなし)
   ポリゴン数:小 テクスチャ量:中
(C)着衣の「Genesis 2 Female」(髪、ブラウス、スカート、靴)
   ポリゴン数:中 テクスチャ量:中
(D)街オブジェクト「The Streets Of Old London」
   ポリゴン数:大 テクスチャ量:大
(E)(C)+(D)
   ポリゴン数:大 テクスチャ量:大

(C)(D)(E)から要素を削っていったシーンですが、(B)は独自に作成したシーンです。
基本的にポリゴン数やテクスチャ量が大きいものほど、メモリ使用量が大きくなります。

スカートとストリート
Character:Ember
Hair:Toulouse Genesis 2 Female (Genesis 2 Female Starter Essentials)
Costume:Ladybug Outfit for Genesis 2 Female(s) , Pumps 3 for Genesis 2 Female(s)
Skin:Fusion Skin Textures for Callie 6
Emvironment:The Streets Of Old London


■メモリ使用量とレンダリング時間

Irayレンダリングの設定は次の項目以外はデフォルトです。
 Render Mode:Photoreal
 Max Samples:(A)が5000でそれ以外が1000

まずはメモリ使用量から。
レンダリング直前のメモリ使用量からレンダリング中に増えた分を、使用デバイス(Advanced>Hardware>PhotorealDevice)で分けて表にしてあります。
 CPUレンダGPUレンダCPU+GPUレンダ
 メインメモリビデオメモリメインメモリビデオメモリメインメモリビデオメモリ
(A)153MB-151MB938MB157MB960MB
(B)705MB-703MB1028MB715MB1029MB
(C)1460MB-1404MB412MB1470MB411MB
(D)1472MB-1459MB470MB1523MB470MB
(E)2840MB-2814MB761MB2858MB768MB

まず目に付くのは、メインメモリの使用量はCPUレンダGPUレンダどちらでもほぼ変わらないという点です。そして結構消費が激しい点で、(E)の場合プロセスの総使用量は4GB程度になります。32bit版のDAZ StudioではIrayが使えない理由の一つでしょうね。

また、GPUレンダ時のビデオメモリの使用量は効率的にコントロールされていると思われる点も見えてきます。シーンデータの全てがビデオメモリに納まっていると思われるのは(A)(B)の2つですが、そうでない(C)(D)(E)はまだビデオメモリが余っているにもかかわらず、あまりビデオメモリを使っていません。

今度はそれぞれのレンダリング時間を見てみましょう。
OptiX Prime Accelerationはチェックを入れていません。
 CPUレンダGPUレンダCPU+GPUレンダ
(A)12分15秒1分40秒1分38秒
(B)18分37秒3分33秒3分41秒
(C)7分54秒7分8秒4分29秒
(D)37分30秒10分57秒9分52秒
(E)38分13秒16分37秒14分53秒

GPUレンダの場合、シーンデータの全てがビデオメモリに納まっていると思われる(A)では7.35倍、(B)では5.24倍のレンダリング速度が出ています。そうでない(C)(D)(E)でも1.1倍~3.4倍程度は速度アップの効果がありますね。

そしてCPU+GPUレンダだとシーンデータがビデオメモリに納まらない(C)(D)(E)で、見逃せないくらいは速度アップの効果があることがわかります。


■ビデオカードを選ぶ基準

さて、これまでの結果からビデオカードを載せてGPUレンダリングをすればレンダリング速度の向上が望めることはわかりましたが、どんなビデオカードを選べば良いのでしょうか。

大前提としては次の条件を満たしていなければいけません。
 ・NVIDIA社のGPU(GeForce)を使っている
 ・CUDAが使える


CUDAとはGPUを数値演算に使用するための統合開発環境で、相当古いビデオカードでなければ問題なく使えますので、そこは気にしなくても良いかと思います。
※GPUレンダリングができない場合は、ビデオカードのドライバを更新してみて下さい。

また、DAZ Studioの推奨環境のページにこんな文が追加されていました。

Iray Render Engine: 64 bit only. NVIDIA video card with 4+GB vram and 4 CUDA cores recommended.


つまり、Irayレンダリングができるのは64bit版のみで、ビデオメモリ4GB以上及びCUDAコア数4以上のNVIDIA製ビデオカードがあることが推奨されるということです。

ここでCUDAを使用するアプリケーションで気にすべき、GPUのスペックを表にしました。
GPUCUDAコア数メモリ容量実売価格
GeForce GTX 660960基2GB-
GeForce GT 730384基4GB11,000円
GeForce GTX 9601024基4GB35,000円
GeForce GTX 9701664基4GB45,000円
GeForce GTX 980Ti2816基6GB100,000円
GeForce GTX TITAN X3072基12GB150,000円

CUDAコア数(シェーダユニット数)が4以上という制限は見ての通り考慮する必要はないですが、コアクロックがほぼ同じ1000MHz程度なのでCUDAコア数におおむね比例してCUDA性能が向上するということになります。
(ビデオ)メモリ容量は4GB以上が推奨されますが、今回のレンダリング検証結果でわかる通り2GBでもレンダリング速度のアップが望めます。



それぞれのGPUを使用した時のレンダリング速度比較ができれば良いのですが、個人ではなかなか難しいためDAZストアのフォーラムのスレッド「Iray Starter Scene: Post Your Benchmarks!」からGPU別のベンチマーク結果(GPUレンダリング)を引用させていただきました。
GPUOptiX onOptiX offOptiX不明
GeForce GTX 66015分44秒17分7秒
GeForce GT 74052分55秒
GeForce GTX 9606分48秒9分54秒6分12秒
GeForce GTX 9703分41秒5分48秒6分54秒
GeForce GTX 980Ti3分8秒
GeForce GTX TITAN X3分42秒4分12秒2分56秒

サンプル数が少ないのと、レンダリング設定にあいまいな部分はあるのですが、これらの結果からGPUのおおよそのCUDA性能差を見て取ることができます。
※レンダリング時間を短縮する効果のある「OptiX Prime Acceleration」の使用の有無が明示されているものについては、わかるように列を分けました。私が試した結果も含めてあります。

ビデオメモリが4GBあっても、GeForce GT 740(730)ではCUDA性能が低すぎてレンダリング速度のアップは望めないことは留意すべき点です。
また、GeForce GTX 970にはビデオメモリの使用量が3.5GBを超えると大幅に速度低下を起こすという問題があるのですが、これがIrayレンダリングにもたらす影響は不明です。

あとはお財布と相談の上、CUDAコア数とメモリ容量の大きなものを選ぶということになります。

ビデオカードはPCによっては複数装着できる場合があり、同じスペックのものであればほぼ倍の性能向上が望めます。ただし、ビデオメモリはそれぞれ独立して使用されるので、2GB+2GB=4GBのシーンデータが納まるということにはならず、2GBのシーンデータまでしか納まりません。
TITAN Xの2枚差しとかしてみたいですねえ。


■まとめ

今回の検証結果をざっくりとまとめると次のようになります。

 ・GPUレンダリングをするためにはNVIDIAのGPU(GeForce)を使ったビデオカードが必要。
 ・GPUレンダリングをすると数倍以上のレンダリング速度の向上がある。
 ・安定してレンダリング速度をアップするためには、4GB以上のビデオメモリが必要。
 ・ビデオメモリ2GBでも、それなりにレンダリング速度の向上がある。その場合はCPU+GPUレンダリングが良い結果になることが多い。
 ・CUDAコア数(シェーダユニット数)の多いGPUほど、GPUレンダリング速度が向上する。



今回の素材はこちら

Ember

Ladybug Outfit for Genesis 2 Female(s)

Pumps 3 for Genesis 2 Female(s)

Fusion Skin Textures for Callie 6

The Streets Of Old London


テーマ : 3DCG
ジャンル : コンピュータ

Comment

SLIは、OFFのほうがいいのでしょうか?

相変わらずステキタイミングです^^

ちょうど4年ぶりに買い替え 注文したところで、私もカードとCPU(マザー)の組み合わせで
ものすごく悩みました、、、。DAZさんはirayには、ビデオカードメモリ4GB推奨してるし。
(でも、それだと敷居が高くなりすぎですよね!?)

今でもSLIモードは、OFFにしたほうがいいのかどうか、情報集めてても
どうもわかってなくて。ここらへんはソフトやレンダラーで全然違うので、ショップで相談しても要領えないんです。
DAZ STUDIOの irayとか言っても伝わらないし。cyclesでも同じ。

現時点ならkotozoneさんが おっしゃられてるように、理想は財布が許すなら
 TITAN X 2枚 買っとけってなるんですけど。
結局980Tiに私は落ち着きました。 
それでも、案外シーンによっちゃ、容量6Gってすぐに超えそうな気も。

Re: SLIは、OFFのほうがいいのでしょうか?

3D好きさんコメントありがとうございます。
なんとすごいタイミングですね。980Tiですか、いいですねー^^
SLIについては、安いのを2枚買うより、その1グレード上のものを1枚買った方が、性能的にも価格的にも良いのではないかと思います。メモリで結構金額上がりますし。TITAN Xのような最高性能のを2枚載せるのはまた別次元の話でしょうね。

実は私もGTX960の4GBのものを購入して実験しているところなのですが、あまりビデオメモリを使ってくれないんですよね。GTX660と比べるとレンダリング時間は確実に短縮されましたけど。
まとまったら記事にする予定です。

No title

どこかから飛び降りるとか言いますが、4年間PC買い換えてなかったので、一生の趣味(老後もw)に使うんだからと奮発しました。 iray移行したかったのにGPUレンダリングがほとんどできなかったんですが、グラボだけ入れ替えようにも電源の問題があったし。
 おかげでDAZのコンテンツの購入枠はかなり減るはず?!
 (とかいってiray関係、今までの反動で買いあさってそうで自分がイヤですっ)
TitanX一枚かすごく悩んだんですけど、、。 メモリ容量以外はほとんど差がなさそうだったのと
レンダリングが早くなるならいいやと、買っちゃいました。

SLIは、DSのフォーラムとか見てると以前からiray にSLIはダメって書かれてて 
blenderのcylcesでも、SLIはコンフリクトを招くとかで、心配してるんですよね。
2枚刺しは効果あるけどSLIで使うとダメ。つまり、レンダリングの時など
グラボのコンパネでSLIを切れってことだと安易に今は解釈してるんですけど。

ニューPC注文したらワクワクするはずなんですが、実は
データ移動とかセッティングとか考えると、気が重くなってますよー。

No title

http://area.autodesk.jp/column/tutorial/3ds_max_kitchen_stadium/11_so-blog_iray1/
こちらに(3dsMAXですが) SLIについて具体的に書かれてたので、貼っておきます。

たぶん1GBのグラボと4GBのグラボを2枚さしても、シーンが2GBだと
4GBのGPUとCPUで計算するってことなんでしょうかね。 

GPUでレンダリング繰り返すと、geforceならそんなに壊れるのっ?! って心配になってきましたが、、ホビーユースでquadro買う気になれないっ。

No title

予算最小化だとGTX960 4GB(120W)をまず買う。これで性能不足と思ったら、GTX970(145W)を買い増し。GTX970だとサイズの小さいものがある。ビデオカードは消費電力が導入のネックになるので、予算があるなら消費電力当たりのCUDAコア数比較で有利なGTX980(165W)  GTX980Ti(250W) は電源やパソコンの筐体(ケース)を見直す必要があり導入は難しい。背景なしで人物だけレンダリングするなら、2GBのメモリーで十分なので、GTX960 2GB
レンダリングイメージサイズが使用メモリー量に影響があるのかは知りたいところです。4Kモニターを意識してビデオカードは企画されている気はする。
コンピューターの中で、写真がつくれるレイトレースが実用になる感じのある Iray はNVIDIAの粘り強い思いを感じます。その技術を取り込めるDAZ3Dのブレないかんじもすごい。DAZ Studioは新興国の安い人件費のプログラマーを使わないでつくられたものなのか? アメリカンなベタさは、、新興国の国民が未来を信じて開発するものだと思うが、、、

> 3D好きさん
2枚以上のビデオカードを載せているPCでIrayレンダリングする場合はNVIDIAコントロールパネルのSLI設定をオフにする(オフのままで全て動作する)、ということだったんですね。
情報提供ありがとうございます。

いくら安定していて耐久性が高いといっても、20万オーバーになるとQuadroは考慮外になってしまいますよねえ。
CPUでのレンダリングで一晩中回していても気にしたことないですが、GPUだとダメージあるんでしょうか。高負荷でうなりだしたりすると心配になってしまいます。

980Tiの使いごこちのお話お待ちしています!

> kim99さん
お久しぶりです。やはり個人だとそのチョイスになってきますよね。
GTX960はメモリバス帯域幅が狭いのがネックかなと思います。

CPU+GPUレンダ

はじめまして。
いつも興味深い記事、ありがとうございます。

当方では、GPUレンダよりCPU+GPUレンダの方が遅いのが謎です。
以下はうちの環境です。
Daz Studio : 4.8.0.59 (64 bit)
OS : Windows 10 Pro (64 bit)
CPU : Core i7 6700K(メモリ:32GB)
GPU : GTX980 (メモリ:4GB、ドライバ:355.82)
GPU-Zで見るとGTX980がアイドル時間の長い間欠動作になっていました。
記事では妥当な結果なので、当方の環境に何か問題がありそうですね。orz

今後の記事にも期待しております。

Re: CPU+GPUレンダ

Makuraeさんはじめまして。
私のブログを読んでいただいてありがとうございます。

CPU+GPUレンダをする場合ですが、GPUのみレンダに比べて速くなるか遅くなるかは、そのPC環境によって違ってきます。
私の場合はビデオメモリが2GBしかなかったためにGPUの性能が十分に発揮できなかったものについては、CPU+GPUレンダの方が速くなっていると推測します。
貴方の場合はCPU・GPU共に十分な性能がありますし、特にGPUのCUDA性能が高いことから、ほとんどの場合でGPUレンダの方が速くなると考えられます。

複数のデバイスでのレンダリングの場合は各デバイスを同期させるためのロス時間ができるようで、おっしゃっているようにGPUの使用率は常にフルパワーになるわけではありません。それが結果的にレンダリング時間を遅くする原因になっていると思われます。

Re: CPU+GPUレンダ

返信ありがとうございます。

なるほど、同期ですか…
LuxMarkの値はCPU+GPUレンダが順当に大きいので、Irayも同じようなものかと思ってました。
今後のバージョンアップに期待です。
非公開コメント

著書
カレンダー
10 | 2017/11 | 12
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 - -
検索フォーム
プロフィール

Kotozone

Author:Kotozone
製品の取扱説明書を読むのが大好きです

FC2ブックマーク
最新記事
カテゴリ
タグリスト

DSプラグイン V4 ライト マテリアル DSシェーダ DS基本 セール Genesis IBL アニメーション タブ解説 iray LuxRender ダイナミッククロス スクリプト Genesis2 セットアップ ShaderMixer バージョンアップ レタッチ Download カスタマイズ トゥーン SSS Photoshop ウェイトマップ ファー NGM ERC D-Form Miki2 物理シミュレーション IDL 大気 M4 カラーコレクション ボリューム Terrain Genesis3 パーティクル モーフセット V5 Genesis8 カメラ インスタンス アナグリフ ロボット 3Dプリント GIMP RAMDisk SLG V8 ダイナミックヘア K4 Python Linux 日本語訳 モーションキャプチャ Hexagon 

最新コメント
リンク
月別アーカイブ
ご意見ご感想はこちらに

名前:
メール: 
件名:
本文: 

ブロとも申請フォーム

この人とブロともになる

最新トラックバック
FC2カウンター