NVIDIAのGeForce RTX 4060 TiとRTX 4060が正式に発表され、VRAMは8GB~16GB、バス幅は128-bitとなっており性能上大きな制約になると見られていましたが、NVIDIAがVRAMが8GBやバス幅が128-bitで十分な理由を解説しています。
GeForce RTX 4060シリーズではL2キャッシュ増加でVRAMへのアクセス頻度は大きく減少。VRAM容量は保険で使われている例が多数。
NVIDIAのGeForce RTX 4060シリーズではRTX 4060 Tiの最上位モデルでは16GBの大容量VRAMを搭載する一方で、標準となるモデルでは8GBとなり、RTX 4060に関しては前世代モデルはのRTX 3060では12GBが標準でしたが、これが8GBへ減らされる事になりました。また、GPUとVRAMをつなぐバス幅についてもRTX 3060 Tiでは256-bit、RTX 3060では192-bitだったのですが、RTX 4060 TiとRTX 4060では128-bitと一昔前のエントリーモデル並のバス幅に減らされたことからユーザーや海外のテック系Youtuberから懸念と批判に晒されています。
NVIDIA Explains GeForce RTX 40 Series VRAM Functionality | TechPowerUp
このユーザーからのリアクションを予測してかNVIDIAでは2023年5月18日にRTX 4060シリーズ発表と同時に、RTX 4060シリーズがのVRAM容量がなぜ8GBで、バス幅が128-bitで十分なのか説明するプレスリリースを公開しています。
現代のゲームでは大容量のテクスチャーを使う
最近のゲームではUnreal Engine 5などを筆頭に高解像度で高精細なテクスチャーを非常に大きなマップで使うゲームが主流となってきており、ゲームのインストールに必要な容量も100GBを超えることが普通になってきています。そのため、グラフィックカードは多くのデータの読み取りを要求されることになりますが、NVIDIAではこの課題について認識しており、RTX 4060シリーズでは最大限のパフォーマンスを確保できるようにキャッシュ容量の増強というハード面の対策とVRAM使用量を減らすためゲーム開発者向けに新しいツールを提供するなど対策を講じているとのことです。
キャッシュが重要だとしてRTX 4060では容量をRTX 3060から16倍に
GPUには、処理を行うコアに近いエリアに高速なデータ通信が可能なキャッシュが搭載されており、ここには『おそらく』必要なデータを保存します。そうして、GPUがキャッシュからデータを呼び出し、遠くにあるVRAMやさらに遠くにあるシステムRAMからデータを要求する代わりに、データはより速くアクセスし、処理します。これにより、ゲームプレイのパフォーマンスが向上すると同時に無駄なアクセスが軽減されるため消費電力の低減にも繋がります。
GeForce GPUでは、処理を行う各ストリーミングマルチプロセッサ(SM)にL1キャッシュ(最も近くて最速のキャッシュ)が搭載され、これに続いて大容量で高速のL2キャッシュを搭載し、最小限の遅延で素早くアクセスすることが可能となる構造が用いられています。
GPUが実際に処理を行う際にはSM内に搭載されているL1キャッシュからデータを探し、あれば利用、『なければ』L2キャッシュを探しに行きます。この『なければ』と言う状況を『キャッシュミス』と言い、遅延が大きくなる次のレベルのキャッシュまたはメモリーへアクセスするためレイテンシーが増え、結果的にパフォーマンスの低下が伴います。
このキャッシュミスについてRTX 4000シリーズに搭載されているAda Lovelaceアーキテクチャーは着目しており、RTX 3000シリーズでは約2MBのL2キャッシュ容量をRTX 4000シリーズでは16倍の32MBに増やしておりキャッシュヒット率を大幅に向上させました。
結果として、32 MBのL2キャッシュを持つRTX 4060 Tiは、2 MBのL2キャッシュを持つRTX 4060 Tiは、2 MBのL2キャッシュしか持たないRTX 4060 Tiのテストバージョンと比較して、平均でメモリバスのトラフィックを50%以上削減できるという結果になっています。これにより、GPUはメモリ帯域幅を2倍以上効率的に使用することが可能になりました。結果として、GeForce RTX 4060は先代のRTX 3060 Tiに比べてバス幅が半分の128-bit、帯域幅は288 GB/sに大きく減っていますが、キャッシュヒット率の向上により帯域を使う頻度が50%減っておりパフォーマンスには大きな影響が出ないように設計されているとのことです。
NVIDIAによると、メモリーバス幅はGPUの性能を決める上での重要な指標として使用されていましたが、Ada Lovelaceでは新しいRTコアやTensorコア、より高い動作クロック、DLSS 3.0などを活用する事でバス幅が大きいRTX 3060 TiやRTX 2060 Superより高いパフォーマンスを発揮する事が可能になっているとのことです。
VRAM量は8GBで十分。パフォーマンス計測画面に表示されているVRAM量は保険?
VRAM量が8GBである事はRTX 4060 TiやRTX 4060で懸念されている一つの仕様になっていますが、NVIDIAによると多くのゲームはそもそも8GBも使っていないとのことです。ゲームエンジンによって異なるものの、動作クロックやFPSなどを表示するオンスクリーンディスプレイに出ているVRAM使用量については『必要になった時のためにとってある容量』も含めて表示されており、ゲームなどのためにVRAM容量が確保されているものの、実際に必要なわけではないとのことです。ゲームによってはVRAM容量がある限り、念のため多くの容量を確保する仕様のものも存在するとのことです。
このVRAMについてはVRAMの使用量ではなく、1% Lowなどを確認する事でVRAM容量が足りているか足りていないのか判断する参考になるとのことです。
なお、最近のゲームでは発売後にVRAM使用量を画質を損なう事なくより緻密に管理するパッチが何度もリリースされる他、NVIDIAのGeForce Experienceを通じて搭載されているGeForce GPUのVRAM構成に最適化された設定を提供し、パフォーマンスと画質を両立した設定が実現できるとのことです。
これ以外にも、NVIDIAではソフト面でゲーム開発者にVRAM使用を最適化できるように、レイトレーシング時のVRAM使用量を半分に削減できるNVIDIA RTX Memory Utilityや、複雑なジオメトリのメモリ使用量を減らし、パフォーマンスも向上させるNVIDIA Micro-Mesh SDK、圧縮率の高いテクスチャファイルを作成して、メモリ使用量とゲームのファイルサイズを削減するNVIDIA Texture Tools Exporterなどを無償で提供しており、今後も最適化が施されるとのことです。
NVIDIAの説明としては、L2キャッシュを増やした事でVRAMまでアクセスする事が減っているため128-bit化しても特にパフォーマンス的には問題が無いと説明していますが、この点はまだ実際のゲームでのベンチマークが出ていないため何とも言えませんが、恐らくRadeon RX 6600などのパフォーマンスを見ている限り、ある程度納得のいく説明と言えそうです。ただ、1440p以上の解像度では性能がどんどん下がる事がリークで登場している3DMarkベンチマークの結果でも出ているため、本当に1080pで最大限のパフォーマンスを出せる事に特化した作りになっていると言えそうです。
VRAM容量に関する説明はあまり納得のいく説明にはなっていません。簡単に言えば『バス幅は128-bitだから8GBか16GBしか選択肢がない』と『VRAMはそんなに使われていないから心配するな』と言うだけで128-bit化に対する説明に比べると技術的な内容が薄くなっています。もし問題が無いならなぜ16GB版なんて出すの?と言う話にもなるので正直、この点はNVIDIA自身も開き直っているように見えます。
NVIDIAのGeForce RTX 4060 Tiは5月24日に発売が開始され、その前日には詳細なベンチマークなどが登場すると見られています。ここでNVIDIAの説明したL2キャッシュと128-bit化の影響については明確になると言えそうです。
コメント
コメント一覧 (12件)
言い訳がひどい
こりゃ想像以上にゴミだな
やっぱりWQHD以上だと影響出るのね
フルHDならまあこれでいいのか……いいのか?
8GBで十分なら16GBを出す理由がないというツッコミにすべてが集約されてる
実際問題としてゲームメーカーもゴリゴリに最適化してくれるわけじゃないし
FHD解像度でもテクスチャ設定上げると既にVRAM8GBじゃ足りないゲームがあるんだから8GBで十分なわけない
FHDゲーマーには3060ti 8GBで十分ですわ。
なんなら消費電力を押さえるために60FPS固定でゲームしてますわ。
4070なら性能あがって消費電力下がるからほしいなー。
FHDの60フレーム固定ならそもそも3060tiはオーバースペックすぎる
ましてや4070なんて無駄にも程がある
フルHDでapex、4kでホグワーツ、原神やってるけど普通に使用中VRAM8G超える
8Gで十分ってそんなわけあるか
長いから読んでないけど、確かGTX1000系の時はバス幅がネックとか何とか言って性能上げてたはずで、PCIe4~5への流れを作って、メモリーも高速化したと思うけど。
実際には4090でさえPCIe3x16で動くし、バス幅も3000系から変わってない。
つまり無駄にスペック上げて値段吊り上げたかっただけとしか思えない。
で今回はその無駄をコストカットして収益化。価格下げず。
メモリ絞るとゲームによっては
ロード回数が増えて頻繁にラグったり(解る)
ロードの時間が伸びたりする(何でやねん)
多いに越した事は無いが、画質落とせば全く問題無いよね
でも、「画質落とすならもうゲーム機でやれば」
感は拭えないな
もの凄い地雷臭がするんですが…
4070も売れ無いみたいだし、4060も同じかな?
>バス幅は128-bitだから8GBか16GBしか選択肢がない
まず128bitをやめろって話だよな
従来の60Tiは256bit、60無印は192bitなんだから少なくても60Tiで128bitは有り得んでしょ
というかゲーマーとしては16GB128bitより12GB192bitの方が遥かに有難いと思うよ
大多数はFHDでゲームしてるだろうからそこ向けならまぁ納得する。
最近はより高解像度でプレイするユーザーも増えてきている中で、旧世代がやれた大画面での体験が出来ないあるいはしずらい性能な気もする。
GTX1080Tiは画質を押さえればUQWHDでも快適に遊べた経験があるから本当に快適に動作するのか疑問だ。
RTX30シリーズでGDDR6Xの性能をアピールしてただけにちぐはぐ感が否めない。