RTX 3060はレイトレーシング時代のニュースタンダードGPU
GTX1060はほぼ全てのFullHDゲームに対して、高画質で十分滑らかな基準である60FPSを実現できる優れたGPUであった。
ところが毎フレームごとに光の反射経路を計算してより現実に近い描画を行うリアルタイムレイトレーシング(RTX)の技術がゲームで使われるようになった事により、これを有効にしたゲームでは60FPSの実現が困難となった。
2021年に発売されたGeforce RTX 3060はFullHDのゲームをリアルタイムレイトレーシングをオンにした状態で遊ぶのに適した新スタンダードモデルといえる。
本記事で言いたいことはこれが全てであるが、GTX 1060、RTX 2060との違いが分からない、あるいはRTX 3070、3080のようなハイエンドな製品を検討している人へ、DLSSなどバックグラウンドの技術も含めてより詳細な情報を提供する。
最終的にはGPU性能比較表と合わせて最終的に決めていけば良いだろう。
- RTXでの描画は従来のものと次元が異なる
- AI技術DLSSによりRTXの計算量を下げる
- RTX 3060はRTX時代のニュースタンダードGPU
- RTX 3060の設計・スペック
- CUDAコア
- メモリタイプ
- Ampereアーキテクチャ
- RTX 3060の演算能力
- RTX 3060は幅広いユーザが対象
RTXでの描画は従来のものと次元が異なる
コンピュータグラフィックスの世界で従来のレンダリングは、光源と物体の単純な位置関係のみに着目して影や映り込みの描画を行ってきた。
しかし実際には光源から来た光が物体に反射して、新たな光源となり、その光がまた他の物体に反射して、というように光は反射を繰り返しており、この光の経路を辿らないことには現実世界に近づくことはできない。
これを実現する技術がレイトレーシング(Ray Tracing)である。光は英語でRay、辿るはTraceなので、文字通り光の軌跡を辿ることにより物体の情報を収集して描画に反映させる技術となる。
映像作品と違い、ゲームではリアルタイムで行わなければならないためリアルタイムレイトレーシング(RTX)と呼ばれている。そしてこの技術を搭載したGPUがNvidiaのRTXシリーズである。
リアルタイムレイトレーシングによるリアリティの差は非常に大きく、例えばMineCraftを例にとると次のようになる。まずはRTXがOFFの状態。
十分といえば十分かもしれないが、全体的にのっぺりとした印象であり、現実味がかけている感は否めない。次にRTXがONの状態。
水面に建物や雲がしっかりと映り込み、また太陽は恐らく建物の後ろから挿しているが、水面からの拡散光により建物が明るく映っている。より現実感が増したことが見て取れるだろう。
リアルタイムレイトレーシングはゲームグラフィックの世界では大きなブレイクスルーであり、没入感を格段に向上させることができる技術である。
ただし、膨大な光の反射を計算しなければならないため、計算量は桁が違い、RTX 3060であってもまだ難しいところがある。
AI技術DLSSによりRTXの計算量を下げる
RTXの計算量は、RTX専用のプロセッサーを持つ30xx系の処理能力をもってしても膨大である。この問題をNvidiaはDLSSというAI技術により解決している。
DLSSとは(Deep Learning Super Sampling)の略であり、一部のピクセルのみ取り出して(=samplingをおこなって)RTXの計算をおこない、残りのピクセルはAI技術により周りのピクセルの色から推測するという方法である。
やや専門的な話となるが、AI計算で行うニューラルネットワークの推論演算は、科学技術演算のような精密さを求められないこともあり、16bitなどbit数が少ない浮動小数点形式で数値表現がされている。
この計算を行う回路は単純で済むため、コア数を容易に増やせ、その数は100を超える。
要するに単純な計算を大量にこなすAI専用プロセッサーを用いて、残りのピクセルの色を計算するのである。
この技術により、オリジナル以上の画質をより少ない計算量で実現できることになった。推論が苦手なシーンもあり、その一点のみが捉えられて画質が落ちると論じられることもあるが、全体として考えればリアルに劣るということはない。
例はNvidiaのRTX3000シリーズの製品発表会で示されていたゲームのワンシーンであるが、DLSSをOffにした場合と比べてよりくっきりと文字が描画されており、フレームレートも108 -> 141へと上がっていることが示されている。
RTX 3060はRTX時代のニュースタンダードGPU
実際にGTX1060、RTX2060、RTX 3060でWATCH DOGS LEGIONやCYBERPUNK 2077といった重いゲームをリアルタイムレイトレーシングをオンにして起動させたときのフレームレートは下記のようになる。
RTX 3060では2020年後半に発売されたWatch DOGS LEGIONなどの重いゲームで60FPSを確保している一方で、GTX 1060では残念ながら10FPSを切り、まともにゲームができるレベルには達していない。
このことからRTX 3060はリアルタイムレイトレーシングとDLSSに対応することにより、次世代の映像を楽しむための標準GPUと結論付けることができる。
RTX 2060もリアルタイムレイトレーシングとDLSS対応はしているものの、最新のゲームをRTXオンで遊ぶにはパワー不足な感は否めないだろう。
RTX 3060の設計・スペック
RTXの基本スペックについても触れておこう。スペック表を公式サイトから抜粋すると次のようになる。
RTX 3070 | RTX 3060 | RTX 2060 | GTX 1060 | |
---|---|---|---|---|
NVIDIA CUDA コア | 5888 | 3584 | 1920 | 1280 |
クロック (GHz) | 1.73 | 1.78 | 1.68 | 1.71 |
メモリサイズ | 8GB | 12GB | 6GB | 6GB |
メモリタイプ | GDDR6 | GDDR6 | GDDR6 | GDDR5 |
アーキテクチャ | Ampere | Ampere | Turing | Pascal |
CUDAコア
単精度(32bit)浮動小数点の積和演算を行うユニット。RTX3060は3584個のCUDAコアを搭載しており、座標変換や陰影計算を行うシェーディング処理を並列で1クロックあたりに3584回こなす事ができる。
RTX 3060は3584コア1.78Ghzでかつ積と和の演算を1クロック内に終えることができるため、3584x1.78(Ghz)x2で1秒間に12.8兆回の計算をこなす事ができる。12.8TFLOPS(テラフロップス)と演算能力が書かれることもある。
ちなみにCPUは5GHz程度と一つのコア当たりの演算能力は高いが、コア数はせいぜい10程度であるため、せいぜいGPUの演算能力の100分の1程度である。
GPUは複雑な処理には向かないが、各ピクセルの色を決めるなどの独立した計算を高速にこなす事ができ、この核と言えるものがCUDAコアなのである。
メモリタイプ
映像を出力するためには、フレームバッファというメモリ領域から映像情報を読み出す必要がある。
GPUは計算した映像情報をリアルタイムで計算しフレームバッファに書き込む必要があり、メモリ領域の内容が高速で入れ替わる。
このため容量はそこまで必要ではないものの、高速なメモリが必要となってくる。そこで考え出されたメモリがGDDRである。
CPU用のメモリはDDRというタイプであり、GDDRも基本的な設計は変わらないが、ユーザによるメモリ増設やスロット拡張等の制約を取り除くことによりGPUに最適化されており、CPUの10倍以上の帯域幅を持つ。
GDDR6はGDDRの6番目の規格でありGDDR5と比べて1.5倍程度帯域幅が向上している。
Ampereアーキテクチャ
GTX 3000シリーズの基本設計の名前、GTX 2000シリーズではTuring(チューリング)という名前であった。
Turingで対応したレイトレーシングの能力をより引き上げた設計となっているが大幅な設計変更は行っていない。
Turing以降、レイトレーシングの膨大な計算量を如何に捌くかに焦点が置かれており、CUDAコアの他にRTコア、Tensorコアというプロセッサーを持っている。
RTコアはレイトレーシングの計算に文字通り特化したコアであり、TensorコアはAI計算に特化したコアである。TensorコアはDLSSで用いられている。
上はRTコアとTensorコアが1フレームの生成にどのように使われるかを示した図である。
RayTracing特有の計算をレンダリングパイプラインの途中で行い(緑色)、AI学習によりピクセルの色を推定すること(紫色)により、フレーム生成時間を短縮していることが見てとれる。
RTX 3060の演算能力
NVIDIAの発表から抜粋してきたが、RTX 3060の3つのプロセッサーの演算能力は次のように示されている。
Shaderの13TFLOPSは12.8TFLOPSを四捨五入しただけで上で述べたCUDAコアの演算能力である。一方で、RTコアの演算能力は25TFLOPS、Tensorコアは101TFLOPSとなっている。
Tensorコアの演算能力が非常に高く思えるが、FLOPSという単位は浮動小数点の演算回数を示した値で、その精度については関与しない。
AI推論には演算の精密さが不要ということ先に述べた通りであるが、精度を落として計算速度を向上させていることがFLOPSが高い理由である。
FLOPSが高いからといって、必ずしも精密で高速な演算が可能になるわけではないことには注意が必要である。
RTX 3060は幅広いユーザが対象
最後に、GPUの購入で迷っている人へ、下記の理由からRTX 3060は幅広いユーザが最初に検討すべきGPUである。
まず、DLSSの技術を使いRTXをONとした状態でも非常に滑らかな60FPSをキープしてゲームを遊ぶことができる。
次にコストパフォーマンスがRTX 3000シリーズの中では断トツで高く、半導体の調達状況にも左右されるが希望小売価格として329ドルから購入することができる。
もっとも日本だと割高な価格設定がされ安くても5万円ぐらいとなってしまうのであるが、GPUの中では手の届きやすい範囲だと言える。
最後に60FPSまでは全てのモニターが対応しているため、通常の作業用モニターでも能力をフル活用することができる。
RTX 3070以上はRTXをONにした状態でも60FPSを優に超えてくるためゲーミングモニターを購入しなければ能力を常に持て余す状態になってしまう。必ず購入しよう。