NVIDIAでは2022年9月頃にGeForce RTX 3000シリーズの後継モデル、RTX 4000シリーズの発売を予定しているようですが、これらモデルのコア数など一部仕様について情報が出現しました。
GeForce RTX 4000シリーズの詳細仕様が出現
NVIDIAでは2月末頃にサイバー攻撃を受け、1TBもの機密情報が盗んだとハッカー集団は表明していますが、その時に盗まれた機密情報の一つとしてGeForce RTX 4000シリーズの情報が入っていたようです。
その結果、各GPU毎のStreaming Multiprocessors≒CUDAコア数やバス幅、そしてL2キャッシュなど仕様に関する詳細情報が出現しています。
各Ada Lovelace GPUのSKU別詳細仕様
NVIDIAのGeForce RTX 4000シリーズでは合計5つのGPUが出現予定となっており、性能順にAD102、AD103、AD104、AD106、AD107が出現予定となっています。
ハイエンドモデル:AD102 GPU
AD102 GPUではGeForce RTX 4090やRTX 4080 Ti、RTX 4080などハイエンドモデルで採用が予定されているGPUと見られています。
Streaming Multiprocessors(SM)が144基搭載され、1SM辺り128基のCUDAコアが搭載されていると計算すると合計18432基のCUDAコアを搭載するとの事です。現行のGA102 GPUではSMが84基(CUDAコアが10,752基)搭載されている事から1.7倍になっています。
GeForce RTX 4000シリーズは現行の2倍の性能と消費電力になる模様
過去にGeForce RTX 4000シリーズでは現行の2倍の性能と消費電力になるという話がありましたが、IPCや動作クロックがGA102より向上するとすると2倍の性能と言うのは間違いではない可能性はありそうです。
なお、Turing世代(RTX 2000)のTU102からAmpere(RTX 3000)のGA102ではSMが72基から84基と1.17倍に留まっている事からGA102からAD102では性能が大幅向上するのは間違い無さそうです。
一方、大幅に増えたCUDAコアに対してバス幅に関しては384-bitに据え置かれる見込みでVRAMについてもGDDR6Xが引き続き採用される見込みです。ただし、L2キャッシュに関してはGA102の6MBから96MBに大容量化が行われる見込みでバス幅や帯域幅がボトルネックとなる事は無いように工夫されているようです。
アッパーミドルモデル:AD103 GPU
AD103 GPUについてはデスクトップ向けとして登場するとすればRTX 4070 Tiなどアッパーミドル、モバイル向けであればハイエンドモデルに搭載されるGPUとして登場すると見られています。
このGPUではSMが最大84基、CUDAコアは10752基搭載されると見られており現行のRTX 3090などで採用されているGA102と同じ仕様になるようです。
バス幅に関しては256-bitと据え置きですがL2キャッシュはGA103の4MBから64MBに増やされます。
ミドルレンジモデル:AD104 GPU
AD104 GPUはRTX 4060などミドルレンジ向けモデルに搭載されるGPUになると見られていますが、SMは現行のGA104 GPUの48基(CUDAコア:6144基)から60基(CUDAコア:7680基)と1.25倍に増やされています。このモデルではGA104に比べるとバス幅が256-bitから192-bitに減らされていますがL2キャッシュは4MBから48MBに増えています。そのため、バス幅減少によるパフォーマンスへの影響は無さそうです。
エントリー向けモデル:AD106、AD107 GPU
AD106およびAD107 GPUはRTX 4050やモバイル向けのミドルレンジGPUなどに採用される見込みとなっていますが、SMは前者が30基から36基、後者が20基から24基と1.2倍に増やされています。またL2キャッシュも他のGPUと同じく大容量化が行われており、2MBから32MBに増やされています。
注目はL2キャッシュの大容量化。Infinity Cacheをヒントに4K、VR時代に備える?
RTX 3000シリーズに対してRTX 4000シリーズではCUDAコアはハイエンドモデルでは最大1.7倍、エントリーでも1.2倍と大きく増やされています。そのため、性能面ではハイエンドモデルは比類ない性能となり、RTX 4000シリーズのエントリー向けモデルでも、RTX 3000シリーズのミドルレンジ並みの性能を発揮できそうな仕様になっています。
ただ、CUDAコア数の増加以外に注目すべき点としてはL2キャッシュの大容量化です。
Ada will have huge L2 @VideoCardz pic.twitter.com/sjMGXttX0Y
— XinoAssassin (@xinoassassin1) March 2, 2022
RTX 3000シリーズではバス幅32-bit辺りに512kbのL2キャッシュを搭載しており、ハイエンドのGA102 GPUでも6MB程度のL2キャッシュ容量でした。しかし、RTX 4000シリーズではバス幅64-bit辺り16MBのL2キャッシュを搭載するようになったようで、384-bitのバス幅となるAD102では96MB、128-bitのAD106やAD107でも32MBと大容量化が行われています。
AMDではInfinity Cacheと呼ばれるL3キャッシュをGPUに搭載する事でバス幅を大幅に上げる事無く高い性能が出せるようになっています。Infinity Cacheはハイエンドモデルでは128MB、エントリーモデルで32MB程度搭載していますが、NVIDIAの場合はL3キャッシュより高速なL2キャッシュに大容量キャッシュを搭載する事でAMDのInfinity Cacheのようにバス幅を上げる事無く性能を上げようとRTX 4000シリーズでは考えているようです。
今後、4KディスプレイやVRなどが普及すると見られているためGPUの帯域幅は重要な要素となります。一方でGDDR7などより高速なメモリーの搭載、バス幅を更に向上させるという方向ではコストが大きく嵩むためキャッシュを増やして帯域幅が起因となるボトルネックを極力抑えようという方向でNVIDIAも動いているようです。
RTX 4000シリーズではRTX 3000シリーズに比べて2倍の性能、2倍の消費電力と言う話がありましたがコア数が1.7倍に増えるという事を考えると性能が2倍と言うのは嘘ではなさそうです。ただ、消費電力については流石に2倍と言うのは盛りすぎですが、爆熱と言われているサムスン8nmからTSMC 5nmに大幅進化を遂げたとしても1.7倍のCUDAコア分を打ち消すだけの高効率化は不可能と言えるため450W~500W程度のTDPは覚悟する必要はありそうです。この辺は今後のリーク情報で出て来ると考えられます。
L2キャッシュの大容量化はInfinity Cacheのようにバス幅を上げずに性能を上げようという試みで導入されるようですが、NVIDIAの場合既に384-bitと言うバス幅となっており、ここに96MBのキャッシュが載ればRTX 4090では8K120Hzと言う環境でもAAAタイトルのゲームがプレイできるぐらいの性能となりそうです。
一方、ライバルのAMDではMCM化を行ってRTX 4090を迎え撃つようですがRTX 4090のCUDAコア数やキャッシュの大容量化を見ているとRadeon RX 7000シリーズも簡単にNVIDIAを超える事は出来なさそうな気がしますね。
コメント
コメント一覧 (3件)
Infinity Cacheの良いところはレンダリングバッファをVRAMに置かなくてもInfinity Cacheに置いておける大容量でメモリアクセスを低減できるところであり、今回のRTX4000のL2増量とはまた趣向が違うと思います。RTX4000では各種バッファを今まで通りVRAMに全て置く構成であり消費電力でRadeonより厳しくなるのは仕方ない事なのかもしれません。
エントリーモデルの部分はRTX4050じゃないですか?
間違ってたらすみません
RTX 4050です。
ご指摘ありがとうございます。