NVIDIAの次世代Blackwellなどを搭載するDGXサーバーは水冷式であることをJensen氏が明言。1枚1000W超えが現実に
NVIDIAでは2024年には現行Hopper H100の後継であるHopper H200と次世代アーキテクチャーを採用するBlackwell B100の2モデルをデータセンター向けGPUとして投入を予定していますが、NVIDIAのCEOのJensen Huang氏がスタンフォード大学主催のサミットSIEPRにてAIやディープラーニングに使用するDGXの次世代モデルについてインタビューで水冷式になることを明らかにしました。
Jensen氏はSIEPRにて次世代DGXがまもなく発表される事を明言したのですが、その中でNVIDIAが作る次のGPUやAIプロセッサーについては水冷式になるとも明らかにしました。
現行のDGX H100は1基あたり700Wの消費電力を誇るH100 GPUを8台搭載していますが、冷却自体は空冷式になっています。しかし、次世代モデルのBlackwellについては一部モデルはGPU1基だけで1000W消費するとDellのCEOが発言するなど非常に高い消費電力であることが確実視されています。
仮にBlackwell B100含めて1枚あたり1000Wも消費するGPUがDGXの中に8台搭載されるとなると、空冷式では冷却力が不足すると考えられるためNVIDIAは水冷式の冷却機構をDGXに組み込むことを計画しているようです。
水冷化を行うとより高い消費電力のデバイスにも対応することが可能になるため、DGXのさらなる高性能化が可能になりますが水冷は空冷に比べてポンプやラジエーター、ホースなど冷却機構の部品点数も高くなるため信頼性が落ちるほかコストも大きく跳ね上がります。そのため次世代DGXについてはGPUの高性能化に伴う価格高騰も予測されますが、冷却機構などその他コストも載るため非常に高価なデバイスになることは確実です。
ソース:Keynote by Jenseng Huang at 2024 SIEPR | Youtube (16:16)
コメント