探秘英特爾大連工廠:原來生產一塊SSD需要這麼久

雲體驗師 發佈 2019-12-16T12:23:45+00:00

生產一塊SSD到底需要多長時間?作為市場化程度較高的商品,為什麼SSD的價格也會受供貨量影響,出現震盪?漲價後,SSD廠商是否能在最短的時間內提高產能?前不久,DOIT在英特爾大連工廠解了SSD生產過程中的一些秘密,也看到了英特爾存儲業務的當下與未來。生產一塊SSD需要多久?

生產一塊SSD到底需要多長時間?作為市場化程度較高的商品,為什麼SSD的價格也會受供貨量影響,出現震盪?漲價後,SSD廠商是否能在最短的時間內提高產能?前不久,DOIT在英特爾大連工廠解了SSD生產過程中的一些秘密,也看到了英特爾存儲業務的當下與未來。

生產一塊SSD需要多久?

如今的NAND SSD大都是基於多層的NAND晶片打造,3D NAND從2013年開始走進人們的視野,隨著製作工藝的快速發展,從32層到64層只用了短短的兩三年時間,如今96層的NAND也越來越多了,今年英特爾發布的QLC SSD 665p採用的就是96層的NAND。

然而,伴隨著工藝的提升,SSD的製作周期也越來越長了。

以英特爾目前還未發布的144層NAND為例,它將由多個NAND deck組裝在一起,這對於微觀世界裡的NAND架構來說,無論是對技術的精密程度,還是工期而言要求都相對較高。那麼,生產一塊SSD需要多久呢?

據英特爾中國區非易失性存儲方案事業部戰略業務拓展經理Benny Ni介紹,一塊SSD從無到有需要四到五個月時間,再經過兩周的封裝測試後,才可以進入市場。

這也就意味著,SSD的價格波動大概只能持續四到五個月的時間。

如果要發布一款採用新技術、新工藝的全新SSD的話,從晶圓到SSD的周期會更長。

比如,英特爾大連工廠在2018年9月就宣布投產了96層3D NAND存儲晶片,而採用96層NAND的665p在2019年11月才發布,經過了一年多時間,但這可能已經是現階段能達到的最快速度。

英特爾大連工廠是英特爾3D NAND SSD的主要生產基地,也是英特爾非常先進的晶圓廠之一,其生產速度應該處於世界領先水平。

英特爾大連工廠是英特爾自1992年在愛爾蘭建立F10晶圓廠後新建的第一座晶圓廠,也是英特爾在亞洲的第一個晶圓製造工廠(除美國本土外,英特爾只在愛爾蘭和以色列有晶圓廠),總投資25億美金,目前主要負責生產NAND晶片,未來可能還將負責生產3D Xpoint(英特爾傲騰使用的介質)非易失性存儲晶片。

2015年,英特爾宣布投資55億美元(這是英特爾迄今在中國最大的單筆投資),將大連工廠升級為英特爾 「非易失性存儲」製造工廠,本次投資項目使大連工廠一舉成為英特爾非易失性存儲器產品在集成電路全球製造網絡中使用300毫米晶圓中目前技術最先進的生產中心之一。

整體來看,這不僅是英特爾在技術上十分先進的一個晶圓廠,也是英特爾非常倚重的一個晶圓廠。

英特爾中國晶圓廠的與眾不同

​2019年11月下旬,DOIT記者有幸去到了傳說中的英特爾大連工廠。據了解,英特爾大連工廠有1.5萬平方米的潔凈空間,參觀區潔凈空間裡的人並不多,遠遠看過去,只有三三兩兩全副武裝的工作人員在其中走動,遠處還擺放著一些機器(可能就有光刻機),頭頂上方一台台忙碌的小機器人拿著晶圓正在天花板上快速穿梭,這裡消耗的晶圓大都變成了SSD NAND顆粒。

英特爾非易失性存儲方案事業部副總裁、英特爾大連存儲技術與製造基地總經理梁志權曾在很多不同地區和晶圓廠工作過,從梁志權的介紹中,能感覺到中國的這個晶圓廠還是很了不起的,尤其在執行力和辦事效率上最令人印象深刻。

英特爾大連工廠於2007年開始建設,2010年開始生產晶圓,2012年就得到了英特爾內部最高的團體獎項——英特爾質量金獎,表彰其在質量控制上的表現,這點與英特爾大連工廠在紀律性上的卓越表現有很大關係。

此前,當大連工廠開始投產的時候,英特爾派了很多人去美國亞利桑那州的工廠學習,學成歸來後,生產同樣產品的大連工廠各種質量參數都比美國亞利桑那州的工廠還要好。為了搞清楚為什麼「徒弟」比「師傅」做的還好,美國亞利桑那州工廠又反過來派人到大連工廠學習。

類似的事情不止於此,美國亞利桑那州工廠的人發現,英特爾大連工廠的員工會更重視按照要求來操作生產流程,紀律性非常好。

不僅質量管理水平高,英特爾大連工廠建廠的速度,擴大產能的操作也很快。在2015年開始生產3D NAND顆粒,2017年市場上3D NAND出現供不應求的局面後,工廠很快就新建了Fab68A晶圓廠。

作為一個現代化的晶圓廠,大連工廠內部自動化生產程度非常高。此前,英特爾與美光合作緊密,工廠里用的是美光研發的自動化生產管理軟體,硬體部分是英特爾的,聯合開發的3D Xpoint推出後不久,兩家宣布分手。

然而使用由美光研發的軟體便意味著英特爾的生產線隨時可以被控制,基於此,在英特爾員工的合力研發下,原本可能需要兩三年時間來切換的系統,英特爾大連工廠最終只用了兩三個月。當所有人以為生產線要停滯兩三周時,英特爾大連工廠最終做到了零關閉。

對於資金投入巨大的晶圓廠產線來說,質量水平和生產時間都異常重要,每強化一點帶來的收益是非常巨大的,而英特爾大連工廠在執行力和紀律性上非常有優勢,這也是英特爾大連工廠的獨特之處。

英特爾存儲發展戰略與落地布局

英特爾大連工廠的發展節奏始終與英特爾存儲的發展步伐保持一致,英特爾中國區非易失性存儲事業部總經理劉鋼七年來一直從事相關工作,從劉鋼的介紹中了解到,自2012年到2019年,英特爾非易失性存儲業務營收增長了10倍。不過,英特爾存儲產品中除了NAND SSD方案,還有傲騰(Optane)。

從劉鋼的介紹中了解到,英特爾之所以在SSD領域投入大量人力、物力,主要是由於磁碟響應CPU的速度過慢,因而需要SSD在部分場景中取代磁碟。然而,由於市場上的DRAM內存都是2D平面架構(業內其實有對於3D DRAM探索),不支持堆疊,提升系統性能所需的內存容量增長速度也較慢,容量提升速度遠不如NAND。

雖然NAND技術由來已久,但直到近年來才開始加速發展。一方面,從SLC、MLC、TLC到QLC的發展提升了NAND晶片的容量。另一方面,3D NAND的堆疊技術也在提升容量。在NAND技術演進的道路上,英特爾走在了行業的前列,2018年就率先發布了QLC SSD,最近又發布了採用96層QLC NAND的SSD——665p。

從劉鋼的介紹中了解到,3D NAND的堆疊技術方案有兩大派系,一種是浮柵技術(Floating gate),另外一種是電荷擷取(Charge Trap)技術。

如上圖所見,浮柵技術的上下單元之間是分離的,而電荷擷取技術上下層之間是連通的,當兩者都是幾十層水平時,差異不大,當變為幾百層之後,採用電荷擷取技術的NAND上下電荷之間會發生串擾,隨著時間的推移,電子會流失,會造成數據不可靠。而浮柵技術雖然工藝更複雜一些,但是在數據保留方面更可靠一點。

因此,在NAND層數越來越高的時候,浮柵技術更有優勢,英特爾採取的是浮柵技術方案,也就是說可以把3D NAND做到更高層,實現更高的存儲密度。

同樣支持堆疊技術的還有3D Xpoint(傲騰的介質)。劉鋼透露道,下一代3D Xpoint就有堆疊技術上的創新,第一代的3D Xpoint是2個Deck,而下一代的3D Xpoint會變成4個Deck,簡單看就是容量翻倍。如果把3D Xpoint做成傲騰持久內存的話,理論上說,單台伺服器的內存極限將進一步提升。


然而,英特爾意識到只靠NAND增長容量是無法滿足需求的,從SLC到QLC使用壽命越來越不理想,而且帶寬越來越低,訪問延遲越來越高,跟DRAM的差距越拉越大,於是英特爾選擇用NAND和傲騰兩種方案並行的方式,一邊持續演進NAND,一邊用傲騰填補內存和NAND SSD在性能和容量上的鴻溝。

劉鋼還分享了數據緩存分層的90/10原則,即在一個存儲層中,90%的時間都在訪問其中10%的數據,然而實際應用中,需要將常用的10%的數據放在性能更高的介質上,這就是存儲分層之間的大致關係。3D Xpoint(傲騰的介質)的出現填補了DRAM和NAND之間的鴻溝,讓數據從計算層到存儲層的流動更為順暢。

多種多樣的傲騰落地方案

傲騰能夠在多樣化應用場景中使用。在實踐中,傲騰的應用類型可以分為兩類,一種是當作內存用,雖然性能略遜於DRAM,但價格比DRAM便宜,可部分替代內存;一種是用作SSD,延遲比NAND SSD低,但耐久性比NAND SSD要高很多。

在實際應用中,傲騰技術首先在網際網路公司落地,其中:

百度把英特爾傲騰固態盤+英特爾QLC SSD的方案用在了其智能雲平台上,打造了高性能的全閃解決方案,不僅IOPS更高、更穩定,為AI、高性能計算提供統一接口的對象存儲服務,而且TCO還降低了60%。

騰訊雲用了傲騰數據中心持久內存來打造Redis內存資源池,提升了單台設備的內存容量,讓騰訊雲在同等成本下獲得了更高的Redis資料庫服務能力。

阿里則把Polar DB的Journal放在傲騰SSD上,將Polar DB資料庫性能表現提升了幾倍,延遲更低,吞吐帶寬更高,整體高QoS表現令人眼前一亮。

快手使用傲騰持久內存來支撐其推薦系統和Redis內存資料庫方案,在對應用進行優化調整後,整體方案的性能與原有純DRAM方案相差無幾,但TCO降低了大約30%。

隨著應用的深入,一些應用還挖掘到了傲騰持久內存的非易失性,使得一些大型應用的故障恢復時間從原來幾個小時變成幾分鐘。這一特性在快手等用戶的大型系統方案中均有體現。

在一些大型公有雲數據中心裡,傲騰持久內存被用作雲主機(虛擬機)的內存,將DRAM用作傲騰持久內存的緩存層,雲主機服務的成本進一步降低,這已成為部分雲廠商在競爭中碾壓對手的一個有力手段。

除了網際網路數據中心外,傲騰在越來越多的行業得到了應用。

諸如,中國電信四川ABM系統中使用傲騰固態盤來滿足REDO系統所需要的高並發、大數據量、響應速度等較高要求。

海鑫科金掌紋識別系統中,傲騰持久內存部分替代了內存存儲池存儲比對樣本,用更有成本優勢的傲騰持久內存方案,打造了性能不遜於原有DRAM方案的內存池。

英特爾雙埠NVMe SSD——DC 4800X有雙控高可用設計,被視為打造高可用企業存儲方案的有力武器,不僅在全球範圍內有諸如戴爾易安信PowerMax的使用,在中國,浪潮也於近期攜手英特爾在其中端存儲AS5000G5中進行應用。雙埠固態盤的推出將會讓傲騰在企業級存儲市場發揮更大價值。

傲騰的應用案例還有很多,目前用戶對傲騰的應用水平大致分為兩個階段,初級階段是單純的替換硬體,比如傲騰持久內存的Memory Mode就是單純的將傲騰持久內存當內存來用,高級階段的應用比如傲騰持久內存的App Direct Mode則需要對應用做一些修改。

比如青雲在NeonSAN分布式存儲方案中使用了傲騰SSD,其中的iCAS緩存加速軟體,能夠自動識別冷熱數據後進行分層,而這個軟體就是英特爾免費提供的。同時,英特爾還開放了Open CAS架構,用戶可以基於Open CAS架構做優化。

對普通用戶來說,英特爾傲騰方案相對依然有一定的技術門檻,如果想要充分發揮傲騰的優勢,還需要在硬體和軟體上做許多優化,而對於想輕鬆應用傲騰方案的用戶來說,最直接的辦法就是選擇軟硬一體的OEM解決方案。

目前來看,浪潮便可以提供傲騰OEM解決方案,比較典型就有軟硬一體的Ceph分布式存儲方案,從浪潮公布的數據可見,浪潮提供的傲騰固態盤優化Ceph方案在同等TCO的情況下,Ceph集群容量,性能有大幅提升。

結語

在2019年,英特爾傲騰在更多場景下普及和落地,為大型網際網路數據中心、企業用戶等帶來較高的業務價值,也讓越來越多的用戶也了解到傲騰的應用價值。

英特爾以傲騰和3D NAND為主的存儲架構革新非常具有創新性,其中,傲騰還非常具有顛覆性。目前來看,在2019年市場上與傲騰定位類似的方案出現了好幾個,這也從一個側面證實了傲騰的遠見性。

從諸多應用案例中能看到,傲騰的許多經典案例應用場景都出現在中國,這也意味著中國企業的創新熱情給傲騰留下了廣闊的發展空間。而創新與顛覆並非一朝一夕的事情,英特爾正在為下一代傲騰做準備。2020年,英特爾會發布下一代傲騰,隨著其普及步伐的進一步加速,我們有理由相信傲騰的差異化的價值將進一步發揚光大。(源:DOIT朱朋博)

關鍵字: