英特爾已經(jīng)證實(shí),由于一個新發(fā)現(xiàn)的錯誤,它已經(jīng)暫停了部分第四代至強(qiáng)藍(lán)寶石激流處理器的發(fā)貨。我們收到了英特爾暫停出貨的消息,并對此事進(jìn)行了跟蹤,我們從SemiAnalysis的首席分析師Dylan Patel那里了解到關(guān)于這個問題的一些細(xì)節(jié),他說自6月中旬以來某些SKU的出貨已經(jīng)暫停了。我們還就此事與英特爾進(jìn)行了跟蹤,該公司向Tom"s Hardware發(fā)表了以下聲明:
(相關(guān)資料圖)
"我們意識到第四代英特爾至強(qiáng)中等核心數(shù)處理器(SPR-MCC)的一個子集的問題,在某些條件下可能會中斷系統(tǒng)運(yùn)行,我們正在積極進(jìn)行調(diào)查。在運(yùn)行市面上的軟件時沒有觀察到這個問題,其他第四代英特爾至強(qiáng)處理器SKU(即XCC和HBM)也沒有出現(xiàn)這個問題。出于謹(jǐn)慎考慮,我們確實(shí)暫時暫停了一些SPR MCC的發(fā)貨,同時我們對預(yù)期的固件緩解措施有信心,預(yù)計(jì)不久將發(fā)布剩余的發(fā)貨量。"- 英特爾發(fā)言人對Tom"s Hardware說。
在回答一個后續(xù)問題時,英特爾還告訴我們,它預(yù)計(jì)固件緩解不會對性能產(chǎn)生影響。
英特爾拖延已久的藍(lán)寶石激流處理器是使用兩種類型的底層設(shè)計(jì)制造的:XCC封裝,采用四個計(jì)算瓦片(裸片)來創(chuàng)建一個芯片,以及MCC封裝,使用一個單片裸片。如上面的幻燈片所示,MCC設(shè)計(jì)用于32核以下的芯片,這是英特爾大批量銷售的來源,而XCC變體則用于36至60核之間的光環(huán)芯片。
"英特爾面臨著另一茬與藍(lán)寶石激流MCC有關(guān)的設(shè)計(jì)問題,這是藍(lán)寶石激流的最高容量版本。自6月中旬以來,2插槽和4插槽的SKU由于時間問題而暫停了出貨,"Patel說。
英特爾沒有證實(shí)這個問題僅限于雙插槽和四插槽的SKU,而是將這個問題歸類為僅限于SKU的 "子集",也沒有說明何時開始暫停出貨的。英特爾也沒有證實(shí)帕特爾的說法,即該問題與時間有關(guān),也沒有對該問題的性質(zhì)進(jìn)行任何澄清。
計(jì)時問題可能包括任何數(shù)量的可能性,從UPI互連到指令計(jì)時問題,所以該錯誤的真正性質(zhì)目前仍不明確。我們確實(shí)知道,英特爾可以通過一個固件修復(fù)來糾正這個問題,該固件目前顯然仍在驗(yàn)證中,所以這個問題不需要重新設(shè)計(jì)或新的修訂/步進(jìn)來解決。此外,由于新的固件是一個充分的修復(fù),英特爾可能不需要更換任何已經(jīng)在使用的處理器--盡管這可能對其客戶構(gòu)成一個令人頭痛的驗(yàn)證。
英特爾已經(jīng)贏得了大量的批評,不僅是因?yàn)槠湓谒{(lán)寶石急速賽車pk10計(jì)劃的工藝節(jié)點(diǎn)技術(shù)上的失誤,而且還因?yàn)槠湓O(shè)計(jì)和驗(yàn)證方法的問題,導(dǎo)致了進(jìn)一步的延遲和許多新的步驟(一種典型的小型重新設(shè)計(jì),需要一個新版本的芯片來糾正一個問題)。英特爾的藍(lán)寶石激流(Sapphire Rapids)一直受到傳言的困擾,它的設(shè)計(jì)/驗(yàn)證失誤導(dǎo)致一些配置需要12次步進(jìn)(一個不自然的大數(shù)字--大多數(shù)芯片最多只有三次步進(jìn))。自然,這導(dǎo)致了嚴(yán)重的生產(chǎn)延遲和錯過了發(fā)布日期。
此后,該公司表示,它計(jì)劃對其設(shè)計(jì)、模擬和驗(yàn)證流程采取不同的方法,以糾正這些問題。英特爾表示,這些調(diào)整將在下一代翡翠急流至強(qiáng)處理器中全面啟動。
英特爾說,這個新的藍(lán)寶石急流的錯誤不是在 "運(yùn)行商業(yè)上可用的軟件 "時遇到的(也許這是一個超濾器的定制應(yīng)用),而且顯然不是在驗(yàn)證時發(fā)現(xiàn)的。這種類型的情況并不是完全沒有聽說過;幾乎所有復(fù)雜的芯片都有已知和未知的勘誤和錯誤,通過固件、驅(qū)動程序和軟件解決,可以減少或消除這些問題,而且它們以這種方式發(fā)貨--這就是現(xiàn)代半導(dǎo)體設(shè)計(jì)和生產(chǎn)的本質(zhì)。
例如,英特爾的Skylake一代處理器發(fā)貨時有53個已知的勘誤表,六個月后,英特爾又列出了40個勘誤表。另一個例子是,最近發(fā)現(xiàn)AMD的EPYC Rome芯片在運(yùn)行1044天后崩潰。有些錯誤根本就沒有被修復(fù),因?yàn)樗鼈儽徽J(rèn)為不夠關(guān)鍵,無法修復(fù),或者它們是通過固件和軟件的組合來修復(fù)。最關(guān)鍵的錯誤有時需要一個新的步驟來糾正,這是最糟糕的情況。對英特爾來說,幸運(yùn)的是,這里似乎不是這種情況。
然而,雖然bug并不罕見,但這些類型的bug導(dǎo)致出貨停止的情況并不常見。