NVIDIAでは2022年下半期にGeForce RTX 4000シリーズを発売予定で、CUDAコア数などの情報が流出していましたが、今回著名なリーカーからGPUコアの構成に関する情報が出現しました。
NVIDIA GeForce RTX 4000シリーズ(Ada Lovelace)
NVIDIAのGeForce RTX 4000シリーズ(以下:Ada Lovelace)は現行のRTX 3000シリーズ(Ampere)の後継モデルとして2022年下半期、リークでは9月から10月頃発売されると見られています。
このAda Lovelaceについては、すでにCUDAコア数やバス幅、そしてL2キャッシュの仕様などは2022年2月頃にNVIDIAへのサイバー攻撃で明らかになっていました。
ただその当時はGPUコアがどのような構成になるかなどは不明でしたが、著名なリーカーであるkopite7kimi氏よりGeForce RTX 4000シリーズのGPUコアに関するブロックダイアグラムなど構成情報が出現しました。
Graphics Processing Clusters、FP32、L1キャッシュなど多くが大増量へ
OK, I did some corrections. Is it really that simple? pic.twitter.com/j7QUIY98lG
— kopite7kimi (@kopite7kimi) May 13, 2022
kopite7kimi氏がAda LovelaceのGPUコア構成をまとめた図を掲載しており、過去のNVIDIA製GPUとの比較も掲載されています。
GPUコアも根幹でもあるStreaming Processorsやレイトレーシングコアなどが内包されているGraphics Processing Clusters (GPC)についてはAda Lovelaceでは最大12基搭載される見込みで、Ampereに比べると70%増加となっています。
また、GPC1基の中には6つのTexture/Processor Cluster(TPC)とその中に2基のStreaming Multiprocessors(SM)が内包されています。GPC内に含まれるTPCやTPCの中に含まれるSMの数についてはAmpereとは変わりませんが、大きな変更が加えられているのがSMの中です。
Ada LovelaceのSMの中にはFP32の演算ユニットが128基、INT32の演算ユニットは64基で各SMの中にはFP32+INT32が192基内包されるようになります。AmpereではINT32が32基となっていたため1.5倍に強化されたこととなっています。なお、Wrapsについては1SM辺り64となっており、スレッド数もAmpereに比べると1.33倍に強化されているようです。
キャッシュ容量についてもL2キャッシュがAda LovelaceではAmpere比で最大16倍に増えることが既に明らかになっていますが、L1キャッシュについてもSM1基あたり192KBに容量が改められており、Ampereと比べると1.5倍に強化されています。GPUコア全体としてはL1キャッシュ容量は4.5MBとなり、Ampereが備えていたL2キャッシュ容量の6MBに匹敵する容量になっています。
TensorやRT Coreも次世代化で強化。
Ada LovelaceにおいてはDLSSなどに用いられている機械学習コアであるTensor Coreについては第4世代に進化し、レイトレーシングを担うRT Coreについても第3世代へ進化すると見られています。ただ、これらのコア数については明らかになっていませんが、RT CoreについてはSM1基につき1 RT Coreとなっているため、GPCの数が増えることでRT Coreについては最上位モデルとなるAD102 GPUでは144基に増えているため世代向上分も合わせるとレイトレーシング性能は大きく上がる見込みです。
Ada LovelaceについてはCUDAコア数やバス幅、L2キャッシュ関連の情報はハッキングで判明していましたが、今回のkopite7kimi氏の情報でAda Lovelaceアーキテクチャーのほとんどの情報が判明したこととなります。
RT CoreはGPCが増えたことでコア数自体が増えていますが、世代が上がったことでレイトレーシング性能についてはTuringからAmpereへ世代交代した時以上に性能が向上する可能性があるので期待ができそうです。