Intel Sapphire Rapids Xeonの一部モデルがバグ発覚で出荷停止

本記事は広告およびアフィリエイトプログラムによる収益を得ています。
  • URLをコピーしました!
目次

Intel Sapphire Rapids Xeonの一部モデルが出荷停止。新たなバグが発見され対策中の模様

IntelのSapphire Rapids Xeonについては当初は2021年に発売しAMDのZen 3搭載のEPYC Milanに対抗する予定でしたが、設計や製造上の不具合などにより度々投入時期が遅延し、2023年になりようやく正式発表され、出荷もされるというCPUになっています。このSapphire Rapids Xeonについてはサーバー・データセンター向けセグメントでシェアをAMDに奪われている状況を止めるCPUとしても期待されていますが、どうやら6月中旬以降に一部8コアから32コアを搭載するSapphire Rapids Medium Core Count Processorsの一部でシステム動作を妨げる不具合が発覚し、出荷が停止されてしまっている事がIntelの広報より明らかになりました。

Bug Forces Intel to Halt Some Xeon Sapphire Rapids Shipments | Tom’s Hardware

4th Generation Intel Xeon Medium Core Count Processors (SPR-MCC)の一部でシステムの動作を妨げる可能性がある問題がわかり、現在調査を進めています。この問題は一般的に利用されているソフトウェアの動作では観察されておらず、他の第4世代Intel XeonプロセッサSKU(XCCおよびHBM)では問題が発生していません。

我々は予防措置として、Sapphire RapidsのMCCの一部モデルの出荷をファームウェア修正が行われるまで一時的に停止しますが、すぐに残りの出荷を再開する予定です。

インテル広報

不具合について具体的な内容などは明らかにされていませんが、一般的に利用されているソフトウェアでは問題が確認されていない事から恐らくサーバー・データセンター向けに納品した後に顧客から不具合の連絡が寄せられて発覚したものと見られています。

このようなCPUで発生する不具合(エラッタ)については比較的一般的で、Skylake世代のCPUでは53個のエラッタが判明した状態で出荷され、その後は40個のエラッタが発覚しています。また、最近ではAMDのEPYC Romeで1044日連続稼働するとCPUがクラッシュするというエラッタが発覚していますが、その多くはファームウェアやソフトウェアで修正や完全に無視されるケースもあります。ただ、これらで防げない場合はCPUのステッピング変更と言うハードウェア変更が必要になるケースがあります。

今回のSapphire Rapids Xeonについてはファームウェア修正を行うとIntel広報は明言している事からステッピング変更と言う最悪なケースは避けられているとは見られていますが、出荷が停止と言うのはエラッタにしては異例の対応となっています。そのため、もしかしたら今後の検証次第ではファームウェアでは修正できない他の不具合であると発覚する可能性もあり、注視が必要な状態と言えそうです。

ちなみに、Sapphire Rapidsについては冒頭で記載した通り当初は2021年に投入が予定されていましたが、2年近く遅れての投入となりました。この理由については採用するIntel 7プロセスに関する問題もありましたが、設計や検証方法などでも問題が発生した形跡が残されています。それが、CPUで発生した問題を修正するために軽微な再設計を行う『ステッピング』の数です。通常、このステッピングは1桁台で収まるのですが、Sapphire Rapidsでは12まで進むなど開発段階で数多くの問題を抱えていた事が示唆されています。

Intel自身もSapphire Rapidsの開発段階で起きていた事は失敗と認めており、後継となるEmerald Rapids Xeonでは設計や検証などが従来とは異なるプロセスで行われる事が明らかにされています。

Sapphire Rapids Xeonの一部モデルで出荷停止に繋がったエラッタについてもしステッピング変更が必要となるような不具合であった場合、Intelとしては納品したCPUについて交換対応を迫られるほか、信頼性が最重視されるサーバー・データセンター向け製品としては致命的なミスとなるためますますAMDなどに乗り換える顧客が増える可能性があります。そのため、この問題についてIntelが今後どのような対応が行われるのかは注目と言えます。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメント一覧 (1件)

  • どんな市場でも1強はマイナス要因だから
    早いとこ何とか星矢

    って言うかインテルの開発力大丈夫か?
    この場合はデバッグ不足なのか。
    人材足りて無いんだろ?
    GPU部門さっさと損切りしてCPUにフルベッドした方が良いんじゃ無いか?

コメントする

目次