NVIDIA GeForce RTX 5000シリーズ搭載『Blackwell GPU』のコア構成などが出現。最大24,576コア、バス幅は512-bitと大幅な高性能化
NVIDIAでは現行のGeForce RTX 4000シリーズに搭載されているAda Lovelace GPUの後継として2025年にBlackwellアーキテクチャーを搭載したGeForce RTX 5000シリーズの投入を計画しています。このRTX 5000シリーズに搭載されているBlackwellアーキテクチャーは2024年末にサーバー・データセンター向けにGB100 GPUを投入されたのち、GPU構成などをゲーミング向けに改変したGB20Xを搭載すると見られています。
今回、このBlackwellに関してサーバー・データセンター向け製品のGB100とゲーミング向けの最上位GPUであるGB202のコア構成やバス幅などの情報が出現しました。
As I mentioned before, GA100 is 8*8, and GH100 is 8*9. GB100 will have a basic structure like 8*10. GB202 looks like 12*8.
— kopite7kimi (@kopite7kimi) September 28, 2023
Kopite7kimi氏からGB100のコア構成がツイートされており、RTX 3000で採用されていたGA100はGPC 8基で、1基のGPCの中に8基のTPCが含まれる構成となっていました。これが、Hopperでは8×9構成になっていますが、Blackwell世代のGB100では8×10に変更されるようです。また、ゲーミング向けの最上位GPUにあたるGB202では12×8構成とGB100に対しても大きく変更が加えられる計画になっています。
サーバー・データセンター向け製品のGB100についてはNVIDIA初のチップレットデザインが採用されると見られていますが、仮にTPC内に含まれるStreaming Multiprocessor(SM)の数が先代モデルと同じであるとすると合計160基、CUDAコア数は合計20,480基になると見られています。
一方で、GB202についてはGPC 12基とGPC内には8基のTPCが含まれる構成になるとの事ですので、TPC内に含まれるSM数が先代と同じであれば合計192基のSMとなりCUDAコア数は24,576基搭載となります。
このCUDAコア数はGeForce RTX 4090に搭載されているAD102 GPUにおいては合計18,432基とされており、GB202では33%増えます。ただ、RTX 5090などでは歩留りの問題からGB202に対して10%ほど使えるCUDAコアは減らされると見られていますが、それでも2.2万基を超えるCUDAコアが有効化されると見られているため、RTX 4090に対してコア数だけで見ても30%以上増える見込みです。
GB100 8192-bit, GB202 512-bit.
— kopite7kimi (@kopite7kimi) September 28, 2023
生成AIやテクスチャーストリーミングを多用するゲームではCUDAコア数に加えてメモリー帯域幅もパフォーマンスに大きな影響を与える要素になっているのですが、データセンター向けのGB100においては8192-bitのバス幅を持つようです。これは、現行のHopper H100の5120-bitの1.6倍にあたり、2TB/sを超える帯域幅になる事は確実と言えそうです。
ゲーミング向けのGB202についてもバス幅は512-bitに拡大されます。
このバス幅の拡大によって現行と同じGDDR6Xを採用しても1.34 TB/s、より高速な24Gbpsであれば1.54 TB/sと現行のRTX 4090を大きく超える帯域幅が実現できます。またコストはかかりますが仮に32Gbpsの速度を持つGDDR7を採用すれば2 TB/s超えは確実となりHopper H100を超える帯域幅も実現できます。
最近のグラフィックカードはゲーミング向けのGeForceに大量のVRAMを搭載したエンタープライズ向けのRTXシリーズと共通設計が行われています。そのため、NVIDIAとしては、ゲーミングのパフォーマンス向上に加えて小規模なAI開発者をターゲットにするためにハイエンドモデルにおいては帯域幅を大幅向上させると見られています。
なお、このBlackwellアーキテクチャーはTSMC 3nm系であるN3Eプロセスで製造が行われると見られていますが、N3Eについては現行のTSMC 5nm系のN4に比べても製造コストが1.25倍に上がると言われています。そのため、GB100やGB202の様にダイ面積が大きくなるGPUについてはコストも膨れ上がると考えられるため、Blackwell B100についてはHopper H100の300万円を超える事は確実で、ゲーミング向けのGeForce RTX 5090なども現行の25万円を超える価格に設定される可能性が高いと考えられます。
コメント
コメント一覧 (2件)
流石にサーバー用は高すぎて買えないから
VRAMはAIやVR、Modで滅茶苦茶食うから最低でも30gb以上は欲しいな
うーん、結構ネガティブな予想にはなるけど
個人的にはコア数はアップグレード版の余地と歩留り対策のために2万基に抑えてくる予感がする
理由はサーバー向け需要が旺盛な中でわざわざゲーム用途に高品質チップを高い基準で選別してコスパを下げる選択をするのかという疑問と
昨今の革ジャンのゲーマーを舐め腐った姿勢と対抗馬のAMDとintelの存在感がかなり空気化しているため
もちろんこの予想が外れて5000番の節目にふさわしい高品質の製品がリリースされることを願ってはいる