國產X86處理器究竟什麼水平?

半導體行業觀察 發佈 2020-04-11T02:17:13+00:00

總部位於中國的兆芯半導體的公司名大致可譯為「百萬核」,他們之前推出了一款基於其神秘的陸家嘴微架構,採用台積電16nm FinFET工藝製造的八核處理器KaiXian KX-U6780A。

來源:內容翻譯自「tomshardware」僅供參考,詳情查看原文,謝謝。

總部位於中國的兆芯半導體的公司名大致可譯為「百萬核」,他們之前推出了一款基於其神秘的陸家嘴(LuJiaZui)微架構,採用台積電16nm FinFET工藝製造的八核處理器KaiXian KX-U6780A。基於該架構的晶片為中國本土的台式PC到伺服器帶來了更強支持,而KX-6000系列則面向遊戲機,PC和辦公機。

最近,我們在兆芯的HX002EH1演示板上測試該晶片,以確定它是否可以躋身我們最佳遊戲CPU列表之列。

在中國,兆芯不是家喻戶曉的名字,但它是設計定製x86處理器的極少數公司之一。這意味著它可以與這個領域的主要晶片生產商AMD和Intel競爭。無晶圓廠兆芯由上海市政府和台灣的威盛電子有限公司合資而成。

兆芯公司是專門為中國市場設計處理器,根據他們的說法,其他們的晶片性能與英特爾第七代Core i5-7400相當。鑒於英特爾第七代處理器於2017年初首次亮相,這肯定不會過分令人印象深刻,但它標誌著兆芯向前邁出了一大步。兆芯聲稱其新的陸家嘴微體系架構的單周期指令(IPC)吞吐量比之前的五道口(WuDaoKou)架構提高了1.5倍。它還還具有一些新功能,例如兆芯的首個集成圖形引擎。KX-6000產品線朝著更大的目標邁出了一步:在該公司的下一代7nm晶片(配備DDR5內存和PCIe 4)之前充當一個中間處理器。

但是,要破壞現有的雙寡頭壟斷並非易事。讓我們快速了解一下兆芯KX-6000系列,然後深入談一下我們的測試結果。

中國的晶片之路

迄今為止,中國是世界上最大的處理器進口國,其中大部分以成品出口。但是,該國長期以來一直尋求擺脫西方對其經濟的影響,因為中國僅生產其國內使用的晶片的16%左右,而且該生產中只有一半是由中國控制。因此,如果出現封鎖或關稅糾紛的情況,中國對西方CPU的依賴就會對中國經濟構成了嚴重影響。

因此,中國在80年代初就啟動了自己的處理器製造計劃。在中美貿易戰爆發之前,美國長期以來一直阻止中國通過併購獲得技術和設備來製造晶片的嘗試,這種情況近來尤甚。但是,中國的晶圓代工廠中芯國際和其他晶圓代工廠仍在繼續發展。但中國不受外部環境影響,大力發展本土晶片設計產業。在X86處理器方面,2016年,AMD與曙光公司合作,開發以基於其Zen架構的Dyhana處理器。

在市場因素的推動下,其他中國本土公司也加入了競爭,但採用非x86架構。華為已經為其台式計算機OEM廠商的主板系列開發了Kunpeng 920 Armv8處理器,而Phytium Technologies也在對外銷售ARM晶片。考慮到Windows在ARM上的興起,這一點很重要,中國公司Loon龍芯也繼續推進其MIPS設計。

但是, x86-64處理器具有無可替代的普遍性,並且兆芯擁有大量的應用。包括聯想和惠普都面向中國市場推出了基於兆芯晶片的產品,聯想提供了其Kaitian台式機,Zhaoyang FF03筆記本電腦和伺服器產品。惠普也有一系列產品,包括由KX-U6780A處理器提供動力的HP 268 Pro G1 MT。

兆芯KX-6000系列規格

兆芯並不是晶片設計的新手。該公司成立於2013年,其首個CPU內核來自於VIA Technologies在1999年收購的Centaur微體系結構。兆芯緊隨其後的是其自己的WuDaoKau架構,該架構代表了對以賽亞(Isaiah)進行的全面重新設計,如今這已演變為x86-64 LuiJiaZui微體系結構。

Khoaxin晶片的前四個疊代是在華力的28nm工藝上製造的,這意味著它們完全是中國製造的處理器。Zhoaxin的KX-6000系列採用台積電(TSMC)的16nm工藝,下一代晶片將採用基於7nm工藝的DDR5和PCIe 5.0。兆芯是否將使用中芯國際(SMIC)或者台積電(TSMC)的產線生產KX-7000系列晶片目前尚無定論,但後者的可能性更大。

我們對LuiJiaZui體系結構了解甚少。我們確實知道該處理器具有超標量亂序的(superscalar out-of-order multi-issue)體系架構,但是該公司從沒發布過相關框圖或更多細節。該架構支持AVX(256位寬度)和SSE 4.2指令集,以及VMX虛擬化(與Intel的VT-X兼容)。過去,Zhoaxin的晶片依靠其ZX-100S晶片組中內置的外部圖形處理器,但是KX-6000標誌著該公司自己的集成圖形引擎的首次亮相。

70W晶片採用可焊接(soldered-down)的HFCBGA封裝,尺寸為35mm x 35mm,因此,您必須隨晶片一起購買主板(沒有socketed)。KX-6000系列有四核和八核版本。

旗艦產品KX-U6880A帶有八個內核,它們可以在高達3.0 GHz的頻率下運行,比上一代機型增加了1 GHz。我們的KX-U6780A型號的時鐘頻率為2.7 GHz,並且與旗艦產品一樣,具有八個核心和八個線程。KX-6000系列配備了八個32KB的L1數據和指令高速緩存片,以及8MB的L2高速緩存劃分為兩個4MB片(L1和L2高速緩存是8路組關聯)。該晶片沒有任何三級緩存。

就兩項關鍵技術而言,這些晶片還處於初級階段:Boost頻率和同步多線程(SMT)。

與Intel和AMD不同,KX-6000晶片沒有SMT /超線程,這使線程工作負載的性能有所提高。這些晶片也不具有boost 功能,因此,如果您選擇Windows大功率或平衡功率配置文件,則它們將在2.7 GHz的頻率下運行,而不管工作量,電氣或熱條件如何(除了用於自我保護的正常溫度調節機制之外) 。那就意味著更好的散熱效果將無法發揮出更高的性能,而且菜單上也沒有超頻功能。如上我們的升壓測試所示,使用省電功能確實可以實現P狀態轉換,但這是為省電而設計的,而不是將性能擴展到超過70W的功率預算。

第一代ZX-C晶片確實具有增強功能,但是在較新版本的體系結構中顯然不贊成使用此功能。顯然,這對輕線程應用程式具有性能影響。該晶片還支持C1-C4 C狀態。

Khaoxin列出了支持雙通道DDR4-2666(不支持ECC)的晶片,但是我們的spartan開發板不允許操作內存頻率和時序,並且不支持XMP配置文件。這些選項可能已在出廠的時候啟用,但就目前而言,開發板僅使用默認的SPD配置文件。這意味著您必須購買昂貴的套件,並針對更高的頻率量身定製。兆芯表示,預計該晶片將來會支持DDR4-3200,但仍在開發中。

該處理器具有16條PCIe 3.0通道,並具有一個未公開架構的集成圖形引擎(該架構基於威盛合作夥伴S3 Graphics的 IP )。我們確實知道它支持DX11,OpenCL 1.1和OpenGL 3.2,並具有硬體加速的視頻編碼和解碼功能,但是細節很少,GPU監視應用程式無法在體系結構組件上抓取更多細節。集成的圖形支持DisplayPort,eDP,HDMI和VGA接口,並可以4K解析度同時輸出到兩個螢幕。

兆芯告訴我們使用默認的Windows 10顯示驅動程序以獲得最佳性能,該解析度在最低質量設置下以1280x720在DOTA 2中產生15 fps。我們還在HP的產品上找到兆芯圖形DCH驅動程序,並對其進行了調試。惠普的驅動程序用於Windows 10中國政府版,該版本旨在滿足中國的安全和隱私標準(微軟為中國政府專門為此特殊版本的Windows剝離了所有間諜軟體,我們無權訪問)。

該驅動程序在我們的Windows 10 Pro測試映像上安裝得很好,從而獲得了上表所列的性能。我們同時對DDR4-2133和DDR4-2666進行了測試,但是增加的內存吞吐量並沒有像我們在Intel和AMD iGPU上通常看到的那樣帶來大幅的性能提升。1280x720時〜1.6 fps的增益以及1920x1080時沒有改善,這意味著瓶頸處在其他地方。無論哪種情況,這些性能指標都大大落後於Core i5-7400的UHD Graphics 630引擎。我們認為與AMD一起獲得集成顯卡性能仍然是最好的選擇。

Dota 2在兆芯測試系統上的加載也非常慢,並且在我們的部分測試運行中通常沒有響應。因此,您需要將KX-U6780A與獨立的GPU配對才能獲得體面的遊戲體驗,更不用說獲得DX12支持了。接下來的頁面中,我們進行了大量的獨立GPU測試。

該處理器支持Linux,Windows 10和中國自製的「 本土作業系統 」。中國對國產設計和生產的晶片也有嚴格的加密技術要求,其中包括由中國國家標準定義的自己的SM3和SM4加密哈希函數(基於橢圓曲線密碼學)。這與包含處理器的Hygon系列的經過修改的AMD EPYC設計中使用的加密類似,其明顯目的是避免通過潛在的後門加密算法來破解。中國網際網路信息中心聲稱,SM3與SHA-256具有相似的安全性和效率,而SM4與AES-128類似。該晶片還支持SHA-1和SHA-256。

在安全漏洞方面,這些晶片確實需要針對Spectre Variant 2採取措施,且不會遭受Meltdown的影響。兆芯正在將Spectre v2的矽內修復集成到未來的體系結構中。在針對具有推測執行功能的處理器的其他措施方面,我們不知道該公司的狀態。

儘管我們已經在市場上看到了系統,但是Zhaoxin沒有指定KX-U6780A的價格。鑒於價格缺乏,並且我們正在使用開發板而不是裝運的主板進行測試,因此可以將其視為性能預覽。

讓我們仔細看看。

兆芯KX-6000 IPC和性能擴展

我們更喜歡通過將所有處理器鎖定在相同的頻率上來測量每周期指令(IPC)的吞吐量,通常匹配最快處理器的最小基本速度,以最大程度地減少對緩存和架構時序的影響,這些時序會影響性能。但是,兆芯 KX-U6780A的頻率僅為2.7 GHz,遠遠低於同類處理器的最低基本速度,而spartan BIOS不支持修改乘法器。我們也無法調整內存時序。因此,我們在不具有升壓(boost)機制或固定時鐘頻率(A10-9700)的可比較處理器上進行了測試,以確保靜態頻率,將內存設置為每個晶片支持的頻率,然後對結果進行歸一化。這不是我們首選的方法,但是對於手頭的任務來說已經足夠了。

我們將兆芯KX-U6780A設為基準模型,但顯然明顯落後於競爭對手的晶片。AMD採用Zen之前一代核心Excavator的Bristol Ridge A10-9700在所有指標上均擊敗了兆芯晶片,而採用12nm Zen +架構的Ryzen 3 3200G則進一步擴大了領先優勢。配備Zen 2的Ryzen 5 3600鞏固了AMD的領先地位。

英特爾的Kaby Lake也同樣領先兆芯,代表著更新的Skylake架構的總體IPC趨勢。英特爾當前一代的Coffee Lake處理器提供了幾乎相同的IPC性能,因此這是對英特爾當前工作狀態的準確描述,其中包括安全措施。英特爾在微體系結構方面的停滯在與AMD競爭時顯得被動,但與兆芯相比,它仍有很大的喘息空間。

兆芯的主要職責是將來通過架構增強和增加頻率來改善IPC,但這並不是一個簡單的主張:晶片的其他方面也必須步調一致。

我們的第一張圖表包含我們在每個處理器上獲得的多線程Cinebench得分(多核),以及該得分除以內核數(多線程每核得分)。我們還包括了Cinebench單線程測試(單線程分數)的結果。

這些線程密集的應用使我們了解了每個工作負載在相應體系結構上的擴展程度。在這些測試中,線程化在提高每核性能方面都發揮著作用,但是無論核心數量如何,我們都只關注於每個物理核心的性能。KX-U6780A獲得較差的每核性能,但是可能還有其他架構問題在起作用,從而阻礙了可擴展性。

請注意我們根據多線程結果計算出的每核心分數,以及根據單線程測試得出的分數。您會注意到,具有超線程功能的晶片在多線程測試中獲得的性能要高於我們的計算,通常在約20%的範圍內,因為現在兩個線程都在單個內核上處於活動狀態。對於採用升壓技術的晶片,儘管考慮到測試時間的長短,它們通常還具有更高的單核升壓頻率的額外好處。不用說,這些技術的結合將使兆芯的處理器受益。

但是,還有其他因素可能會限制性能可伸縮性。

Core i3-8100沒有Hyper-Threading或Boost技術,您會注意到,在將單線程測試結果與我們根據計算得出的單核測試結果進行比較時,它會損失一些性能,儘管不是很多。而在多線程測試中,這些類型的縮放損失可能來自高速緩存和fabric contention,這種情況會因占用帶寬的線程依賴性而加劇,因此必須在處理器的設計階段考慮這些因素。您必須正確調整fabric的大小才能完成工作,在這裡我們可以確定兆芯的晶片在兩次測量之間僅損失了四個點。通過POV-Ray測試,您會看到類似的趨勢。

提升每核性能需要更快的互連來處理核間流量,更不用說訪問內存和I / O設備了。這就是AMD和Intel如此頻繁地在營銷材料中吹噓互聯的關鍵原因,因為它對工作負載可伸縮性產生了巨大影響。

KX-U6780A的製程節點很有可能會提高時鐘頻率,但要達到每核性能與晶片互連之間的正確平衡,最好的方法是回撥頻率(dialing back )以匹配互連飽和點(interconnect saturation point,),從而降低電壓/頻率曲線,並產生更好的功率效率和散熱。但在兆芯共享更多有關其體系結構的詳細信息之前,我們並不了解。

我們還在V-Ray和Stockfish基準測試中包括了縮放測試,這兩個縮放比例都很好,並且在運行期間完全飽和了核心。我們沒有可比的單線程測試結果(沒有基準測試結果),但是它確實提供了一個有趣的整體觀點,即兆芯如何依靠更多的內核與設計效率更高的晶片競爭。

兆芯KX-U6780A的功耗

測量功耗始終是一個棘手的問題,不同的方法會產生不同的結果。在物理層截取功率(即在8針連接器處進行測量)可提供最準確的測量結果,但VRM效率低下會導致更高的功耗測量值,與處理器消耗的實際功率不匹配。

許多軟體實用程序提供了詳細的電源記錄功能,但是某些主板上的這些報告可能不準確。但是,輪詢傳感器環路(polling the sensor loop)的優勢歸結為以下幾點:該技術可測量處理器本身消耗的實際電量。為了在確保準確性的同時兼顧兩者的優勢,我們通常會比較物理層的功率測量結果和從傳感器迴路提取的功率測量結果,以驗證軟體輸出是否合理。該技術可以進行細粒度的電源測試,該測試代表了被測處理器的實際功耗。

不幸的是,兆芯開發板不支持基於傳感器環路的功率記錄,因此我們轉向 Passmark的Inline PSU測試儀來測量流入8針連接器的功率量。該器件以直通模式進行測量,具有很高的精度,並具有擴展的日誌記錄功能,使其成為我們的電力測試工具庫的絕佳補充。但是,Khaoxin處理器的測量結果直接來自8針連接器,而不是來自傳感器環路的信息,因此您必須考慮VRM效率低下的問題,這可能會使功率讀數降低10%到15%。

兆新的設計也使事情複雜化。我們對LiuJiaLolapoolza架構知之甚少,但該公司告知我們,雖然晶片組和圖形單元是散熱器下方單個單片晶片的一部分,但這些單元從通過24針連接器饋電的單獨電源域中獲取電源。該公司使用特殊的主板來測量處理器的總功耗,但我們無法使用該設備。

由於這種電源分配方式,我們無法確定封裝的實際總功耗(具體來說,我們無法知道從24針流向處理器的功率多少)。但是,我們確實通過8針連接器測量了約55W的功耗,並且在考慮了VRM損耗之後,我們正在尋找的功耗與製造在28nm上的AMD A10-9700大致相同,甚至略有降低。

即使功率結果有些不清楚,我們仍然可以看到較舊的16納米工藝所賦予的功率負擔。當該公司使用KX-7000系列轉向7納米工藝時,這肯定會有所改善,但是不足為奇的是,與具有較小工藝節點的競爭處理器相比,KX-U6780A的電源效率不是很高,而後者具有更低的功耗和更高的性能。

兆芯HX002EH1開發板

普通消費者永遠不會看到此參考驗證板,因為它是為兆芯自己的內部開發工作而設計的。我們可以看到,位於晶片頂部的備用冷卻器帶有三個熱管以有效散熱,但風扇很大,BIOS沒有提供任何bells 或whistle,例如自定義風扇曲線。相反,風扇會根據負載自行運行。

定製散熱器安裝在與16通道PCIe插槽相鄰的BGA封裝上(通道寬度為x8)。該板還包含一個4通道和3個單通道PCIe插槽,以及一個老式的PCI插槽。

PCB四層板尺寸為244 mm x 305 mm,這意味著它符合ATX規範。因此,它還支持標準的ATX電源連接,例如24針和單個8針用於供電。8引腳為三相供電子系統供電,該子系統不附帶額外的冷卻裝置,例如散熱器。鑒於該晶片的TDP為70W,這並不是什麼大問題。

該板提供了不錯的連接幫助,其中包括VGA,HDMI和DisplayPort輸出以及以下組件:

四個SATA 3.0連接器

一個PCIe M.2-

一個C型連接器上

一個USB 3.1 Gen 2埠-一個C型插針接頭上一個USB 3.1 Gen 2埠

一個A型連接器上兩個USB 3.1 Gen 1埠

兩個USB一個針腳接頭上的3.1 Gen 1埠

一個A型連接器上兩個USB2.0埠

x4針接頭上的八個USB2.0-

兩個UART埠

一個音頻編解碼器ALC662

主板上裝有ZX-200 IO擴展晶片(6W晶片組) )提供了八個PCIe 2.0通道,並內置了SATA和USB控制器。如上所述,40nm晶片最多可支持11個USB埠。兆芯表示,該晶片組用於台式PC,一體機和筆記本電腦。

該板極簡陋,並具有可匹配的BIOS。您無法指定內存頻率或時間,不允許超頻,並且幾乎所有功能都會自動處理。我們認為,定製主板將帶有更多發燒友的修飾,儘管考慮到晶片的功能,我們不會期望在高端板上看到如此出色的RGB燈光秀和強大的電源散熱解決方案。

測試筆記

我們在DDR4-2133和DDR4-2666上測試了遊戲套件,並在一些遊戲中記錄了性能差異。我們將DDR4-2133結果包括其中,超出正常標準偏差的範圍有所增加。這對兆芯未來對DDR4-3200的支持來說是一個好兆頭,儘管規定您需要帶有預定義DDR4-3200 SPD的昂貴套件。

合成(Synthetic)遊戲基準通常不能指示真實的性能,但3DMark DX11和DX12測試可以衡量遊戲引擎所具有的原始計算能力。就目前而言,當今大多數遊戲引擎都無法通過額外的計算資源線性擴展,但是這些測試有助於我們評估隨著引擎變得越來越複雜,遊戲如何利用處理資源。

在Fire Strike基準測試的綜合世界中,除超頻的Ryzen 3 3000G以外,兆芯處理器的擴展性很好,幾乎擊敗了所有雙核競爭對手。而與兆芯用作比較點的酷睿i5-7400相比,領先份額達到8%,這對於後來者的兆芯來說並不算差。但是,進行DX12物理測試後,發現兆芯處理器幾乎無法超越AMD的Bristol Ridge A10-9700。前一代Athlon處理器僅具有兩個內核,其性能也優於KX-U6780A。

VRMark測試體現每核性能(頻率和IPC的混合),從而揭示了KX-U6780A在輕線程工作負載方面的弱點。甚至2016年推出的Bristol Ridge晶片也勝過Khaoxin處理器。同時,Core i5-7400接近榜首。

Civilization VI體現每核性能,因此看到英特爾晶片在基於回合制策略遊戲的AI引擎性能測試中處於領先地位也就不足為奇了。KX-U6780A由於其較低的IPC和受限制的時鐘頻率而在這裡沒有競爭力,但它在Bristol Ridge A10-9700的範圍內。但是,Socket AM4在連續幾代AMD中的性能要好得多。

Stockfish是一種開源chess引擎,旨在通過擴展到512核,從多核晶片中獲得最大的性能。這種可擴展性與KX-U6780A的八核設計很好地吻合,但是四核Intel i3機型繼續領先很大。

Ashes of the Singularity::升級喜歡核心和線程,但時鐘速率顯然起著作用。當然,這對八核KX-U6780A毫無幫助,因為它擊敗了除A10-9700以外的所有機型。甚至雙核四線程Athlon 200GE也領先了24%,儘管很明顯,此類處理器並非最適合這樣的高線程工作負載。

《文明6》以其較高的時鐘頻率而聞名,因此再次發現兆芯晶片與Bristol Ridge的爭鬥也就不足為奇了。從DDR4-2133切換到DDR4-2666時,我們確實看到了一點點提升,因此升級到DDR4-3200可能會在將來提供更多性能。不過,我們不會指望奇蹟。

Warhammer 40,000基準測試對線程處理的響應很好,但是很明顯,隨著第8代和第9代晶片的領先,英特爾的時鐘速度和IPC優勢會產生影響。不過,比不上Ryzen 3 3200G,鑒於其價格點,該產品獲得了可觀的成績。兆芯籌碼明顯落後。

孤島驚魂5(Far Cry 5)講述了一個現在熟悉的故事,在我們其餘的測試中,測試表現基本相似。

我們使用標準質量預設運行此測試,以避開導致遊戲引擎使用更高解析度設置渲染螢幕外對象的錯誤的影響。兆芯晶片比上一代雙核奔騰G4560高4.9 fps,這是與英特爾晶片大有可為的勝利。但是,那些勝利不會經常出現。

在使用兆芯處理器的《 Hitman 2》序列中,我們經歷了重大的難題,但A10-9700的性能也不佳。

儘管 據稱Project CARS 2已針對線程優化,但時鐘速率顯然會影響該標題的幀速率。很明顯,在大多數遊戲中,KX-U6780A的性能都與A10-9700類似。

《坦克世界》基準測試絲毫不令人意外,KX-U6780A再次落後。

兆芯提供的開發板上的固件當然是spartan affair,因此很少有選擇。與任何類型的內存操作一樣,超頻也不可行。但是,我們確實找到了禁用AVX的選項,但是我們被告知此功能是為了解決與某些應用程式的兼容性。我們發現它確實在某些工作負載中提供了更高的性能,並且已經將這些結果包括在相關的測試中。

我們預計高線程工作負載將展現八核兆芯的最佳性能,但這僅體現在少數工作負載上。大多數測試都發現處理器落後於雙核競爭對手。該晶片的確比遊戲基準測試中的排名高出很多,但是很明顯,它缺乏單線程性能。

例如,兆芯晶片在單線程Cinebench測試中遠遠落後於競爭模型,但憑藉其額外的內核,它在線程Cinebench結果處在中間。

使用disable AVX選項可以產生一些額外的性能,在多線程測試中達到5.5%的額外性能,在單線程測試中達到5.8%的性能,但這還不足以打贏雙核Core i3-7100,更不用說現代的四核晶片了。這可能是軟體優化問題,但是我們看到POV-Ray出現了類似的趨勢,儘管性能遠遠落後於競爭對手的處理器。

兆芯晶片在Blender基準測試中設法擊敗了奔騰產品線,但在Corona 和v-ray測試中卻落後於較新的奔騰型號。

編碼方式

我們通常使用Intel / Netflix設計的SVT-AV1視頻編碼器來測試線程編碼應用程式中的性能,但是兆芯處理器未能正確執行該測試。這給我們留下了單線程LAME和FLAC編碼測試結果,與英特爾和AMD的競爭晶片相比,這兩個結果都顯示出巨大的性能差異。這可能是缺乏針對該架構的軟體優化,但是很顯然,在未來的兆芯架構中,這種單線程性能需要通過更高頻率和微體系結構的進步來大幅度提高。

線程化的HandBrake x264和x265測試再次揭示了兆芯晶片在AVX工作負載中的性能不佳。與x264測試相比,x265測試使用的AVX指令分配量更大,但在這兩個測試中,即使A10-9700中AMD老化的Excavator內核也優於KX-U6780A。

網頁瀏覽器

與其他類型的應用程式相比,瀏覽器受近期安全性影響更大,因此,英特爾通常會在這些功能全面的系統基準測試中大放異彩。但是,無論是英特爾還是AMD,兆芯信處理器都不會面臨任何有意義的競爭。結果不言而喻– KX-U6780A在輕線程應用程式中不是競爭者。

辦公與生產力

兆芯處理器在所有辦公室和生產力測試中均無法給人留下深刻印象,因為它大幅失去了所有基準。我們希望這些晶片能在政府辦公室中得到廣泛使用,但是這將帶來嚴厲的性能損失,並且在這些類型的應用中通常性能會下降。

壓縮,解壓縮,加密,AVX

7zip和Zlib壓縮/解壓縮基準測試在很大程度上依賴線程處理,並直接從系統內存中進行工作,從而避免了這類任務中的傳統存儲瓶頸。KX-U6780A在這些測試中提供了令人印象深刻的性能,因為它可以利用其內存吞吐量和內核來吞噬工作負載,從而擊敗了四核Intel處理器。AMD雙核Ryzen 3 3200G憑藉其四個線程證明了自己的能力,因為它在7zip解壓縮和壓縮工作負載方面均領先於兆芯晶片。

使用繁重的AVX指令集計算pi的重線程y-cruncher基準測試發現,通過在BIOS中切換AVX兼容性功能,兆芯晶片的性能有了明顯提高,但我們看到了令人擔憂的單線程性能趨勢被線程化工作負載中八個核心的繁重量所抵消。無論哪種情況,在八線程處理器中,在線程化工作負載中敗給50美元的雙核Athlon 200GE都不是一個好選擇。

中國採用國家定義的加密技術是其自主研發的CPU計劃的一大推動力,但ISV名單中還沒有提供成熟的SM3 / SM4測試來提供著名的測試軟體。我們正在發送測試請求,以反映這些算法的優缺點。同時,我們可以看到該晶片在AES,哈希和SHA3基準測試中提供了強大的性能。

中國芯崛起?

從我們今天的測試中可以明顯看出,兆芯仍然落後於處理器市場的領導者,這是工藝技術和架構落後的副作用。整個測試套件中,兆芯KX-U6780A飽受相對較慢的2.7 GHz時鐘速度之苦,而且我們認為旗艦產品的額外300 MHz頻率不會顯著改變總體結果。

AMD和Intel擁有數十年研究和開發的優勢,更不用說在x86指令集發展中的開拓性作用。這使得x86或其他新手很難建立有競爭力的產品。我們經常聽到過KX-6000系列與Intel第七代Core i5系列的比較,但是顯然,這些測試只有非常狹窄的選擇範圍,即使不是單一測試,也可以用作比較點。

可以肯定地說,英特爾還不必擔心兆芯的有意義的競爭,AMD也是如此。甚至AMD帶有Excavator v2內核的過時的Bristol Ridge晶片也足以抵禦挑戰者,我們甚至不必將Zen 2處理器帶入測試池中就可以讓AMD在性能上擁有領先優勢。

但是,隨著英特爾努力經濟地批量生產其10nm節點,英特爾成為集成設備製造商(IDM)的歷史優勢已成為責任。現在,台積電(TSMC)成為處理器市場上的出色均衡器,因為幾乎所有晶片設計人員都可以簡單地採用其7nm節點,並具有與英特爾10nm競爭的領先工藝。如果它繼續利用台灣代工廠的話,這對未來的兆芯晶片來說是個好兆頭。但如果兆芯與中國晶圓廠中芯國際一起為其7nm KX-7000處理器配套,則情況變得更加模糊,但鑒於可輕鬆訪問台積電的成熟節點,因此在短期內這似乎不太可能。但是,鑒於中國政府對完全自主研發的晶片的渴望,任何事情都是可能的。

兆芯計劃在其下一代晶片中採用PCIe 4.0和DDR5接口,但是正如我們在整個測試中所觀察到的那樣,該公司必須將這些功能與其他有意義的進步結合起來,才能取得真正的進展。毫無疑問,更高的時鐘速度,更低的功耗以及7nm節點密度的提高將帶來改善,但是兆芯需要改善其微架構。

該公司已經對其先前的晶片對Centaur的Isaiah架構進行了改動,但是即使我們不知道更詳細的細節,兆芯也可能需要一個乾淨的設計。在很大程度上獨立於Via內部運作的Centaur,確實具有一種令人難以置信的新的CNS核心架構。兆芯可能會在其KX-7000系列中採用這種架構或衍生產品。

就目前而言,在全球市場上,與AMD和Intel相比,兆芯晶片的表現並不令人印象深刻,但是鑒於中國政府的首要願望是擺脫西方對其經濟的影響,這也許會有意義。中國龐大的計劃是在2022年底前將其外國政府的軟體,硬體和加密技術除掉,這是一個令人難以置信的雄心勃勃的目標,這意味著它將採納和激勵幾乎所有本土邏輯,無論其表現如何。還有其他選擇:華為正在為新一代台式PC主板採用ARM體系結構,但是x86指令集的普遍性很難忽略。

正如我們經常看到的那樣,「便宜又好」幾乎總是能贏得大部分市場。如果兆芯獲得正確的價格,它應該能夠在突然擴大的中國個人電腦市場中搶占很大一部分。

不過,這大多僅適用於政府部門,因此英特爾和AMD仍將為中國的日常消費者使用。至少現在是。我們可以肯定,大多數發燒友和專業人士都將繼續使用Intel和AMD硬體,因為它們具有更高的性能和效率,但是兆芯的支持將確保其未來的體系結構更具競爭力。我們今天記錄的一些低迷的性能也可能使人聯想到AMD的新架構所面臨的挑戰,因此更廣泛的採用可能會通過軟體優化提高性能。

還記得AMD像鳳凰一樣從半導體市場的相對灰燼中崛起,成為價值和性能領導者的趨勢嗎?他們僅用了一個大膽的新架構,即可獲得52%的IPC增益,加上足夠好的14nm GlobalFoundries工藝,再加上英特爾在10nm節點上的延遲的運氣,他們會打亂台式機和數據中心市場。

這就引出了一個問題:兆芯是否僅是一個微體系結構,就不會成為全球舞台上的有力競爭者,同時通過晶片計劃使中國獲得成功?只有時間會證明一切,但這一切都始於實現過程節點奇偶性。兆芯計劃在2021年實現這一目標。

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第2276期內容,歡迎關注。

★晶片「備胎」計劃

★定增市場井噴!439億重金砸入A股半導體

★日本晶片廠商Top 10榜單:期待第三個亮點

存儲|射頻|CMOS|設備|FPGA|晶圓|蘋果|海思|半導體股價

關鍵字: