圖片來源@視覺中國
文 | 談擎說AI,作者 | 鄭開車
最近美國又加大對中國晶片行業的限制力度,英偉達、AMD兩家企業旗下生產的部分GPU產品將被美國列入停售範圍。
據悉,不允許出售到中國企業的晶片主要包括英偉達A100和H100、AMD MI250等高性能AI晶片,並且未來峰值性能和I/O性能達到或高於A100的晶片,都在新的出售許可證所要求的範圍。
由于禁售的幾種晶片主要用於自動駕駛雲端訓練,所以國內自動駕駛和汽車行業都在消化這個黑天鵝式的突發消息。
對此小鵬汽車創始人何小鵬樂觀地表示,「未來幾年的需求提前買回來了」,百度副總裁王雲鵬則馬上回應「我們通宵討論如何加速創新、實現前沿科技自立自強」,並批評何小鵬「和資本市場說我沒事兒」顯得格局太小。
兩位大佬的發聲都是站在自家企業的立場發聲,誰是誰非我們暫且不做評論。眼下更為重要的是,「限芯令」會不會再加大力度?「限芯令」實施之後,整個自動駕駛行業中,究竟哪些企業首當其衝,哪些企業反而可能迎來機遇?
英偉達卡了誰的脖子?
首先要明確一點,「限芯令」針對的主要是用於雲端數據中心的高性能GPU晶片,主要用於AI算法的訓練。這對自動駕駛行業有多重要呢?
業內普遍認為,智能駕駛的量產競爭,主要取決於時間和成本兩個維度。
一是時間維度,即算法疊代的周期中,處理海量數據的速度決定自動駕駛能力提升速度。另一個是成本維度,即在整個算法疊代周期中,處理海量數據所消耗的計算、存儲、帶寬等資源成本。
由於有海量數據的主機廠並不在少數,所以能把海量數據中蘊藏的「算法養料」提取出來就成為關鍵。
在英偉達推出大算力晶片之前,數據處理依賴大量人工,效率太低。以至於行業內有一個流傳甚廣的玩笑,「所謂人工智慧,就是有多少人工就有多少智能。」
從效率的對比來看,本地AI訓練數據處理的效率較人工提升3~4倍,而依託雲端的更高算力,汽車雲服務數據處理的綜合處理效率提升10倍以上,數據處理的成本也較人工降低50%。
對主機廠和自動駕駛公司而言,自動駕駛的時間窗口需要用算力來爭取,英偉達的高性能GPU晶片就是前者的生產力。
去年特斯拉公布了採用英偉達A100晶片的雲端訓練集群,還發布了超級計算機Dojo,以此打造自動駕駛算法的雲端基礎設施,構建數據驅動的閉環。
在國內,繼特斯拉之後,蔚來汽車、小鵬汽車、毫末智行等公司摸著特斯拉過河,也都在基於英偉達A100晶片打造自動駕駛訓練中心。
「量產車產生的海量數據是蔚來自動駕駛能力護城河。而NVIDIA 的高性能計算解決方案,成為了蔚來在自動駕駛這條道路上的加速器。」蔚來 AI 平台負責人白宇利表示。
小鵬一直是自動駕駛布局相當積極的新勢力車企,近日小鵬汽車基於阿里雲建成了自動駕駛智算中心「扶搖」,用於自動駕駛模型訓練,所以何小鵬表示自己沒有壓力。
而如果從長遠來講,用於L4的自動駕駛的數據量在不停遞增,以後是否還需要對算力進行升級也猶未可知。
需要注意的是,特斯拉目前已經用自研的D1訓練晶片替代英偉達的A100。而且從官方公布的性能數據對比來看,D1相比英偉達的A100也更有優勢。
所以特斯拉可以說已經擺脫了對英偉達的算力依賴,但是對國內的蔚來、小鵬、百度們來說,很難找到比英偉達更合適的GPU供應商,也沒有自研的能力,這無疑是一種群體性打擊。
L4成本高企,量產或將推遲?
對國內L4級自動駕駛玩家來說,「限芯令」的影響之所以殘酷,是因為無論其L4級自動駕駛的方案如何強調差異化優勢,都繞不開高性能AI晶片。
具體來講,隨著高階自動駕駛逐步進入現實,數據閉環的概念越來越受到重視。所謂數據閉環,就是不僅要有數據的分類採集,還要有為數據生產服務的工具平台,對數據從導入、清洗、加工、篩選、利用等進行全生命周期的管理。
比如在雷射雷達和視覺算法的開發閉環中,需要雲仿真平台。雲端的感知仿真會涉及到大算力GPU的使用,雖然感知算法更多是在車端跑,但是決策、規劃、和控制算法基本上都要在雲端跑才更有效率。
值得注意的是,對於AEB、主動變道等輔助駕駛功能,如果沒有雲端並行仿真,也能完成開發。但是對於L4級的自動駕駛,雲仿真必不可少。
「一款配置有10個攝像頭和2個雷射雷達的車型,在雲端做感知仿真的話,如果讓500個節點並發運行,大概需要三千多塊GPU。考慮到每家主機廠有很多款車型,單是雲仿真對GPU的需要量就相當驚人。」某自動駕駛公司研發人員向談擎說AI表示。
事實上,從AI訓練晶片的性能來看,英偉達的性價比並不是最高,比如英特爾最近推出新一代AI訓練晶片Gaudi2,性能方面大約是A100的兩倍。谷歌旗下的Waymo作為自動駕駛領頭羊,也有自研的TPU晶片來替代英偉達的GPU。
但是美國政府出台的「限芯令」既然是為了針對中國,考慮到以後同樣有被限制出口的風險,英特爾和谷歌的晶片大概沒有中國企業敢大批量採用。
值得一提的是,AI訓練晶片並非沒有可以替代的國產產品,其中華為昇騰910、寒武紀的思元290智能晶片在性能功耗方面已經不輸於英偉達A100。
然而,由於大部分主機廠的軟實力較差,不僅要有晶片、還要有容易上手的工具搭配使用。基於這一點,英偉達的CUDA軟體棧進行第三方應用及工具的擴展,建成了自己的「CUDA生態」。
這意味著,想要繼續攀登L4高峰的主機廠要想置換成國產AI訓練晶片,除了付出遷移成本,可能還要在替代晶片上投入時間和研發成本。
不過,若站在國產AI晶片供應商的角度看,這或許意味著,此時正是投入研發工具鏈生態的有利機會。
不過,英偉達面對「限芯令」,也不想失去國內的大客戶,創始人黃仁勛於是提出了解決方案,其實就是用還沒有被禁止的低端晶片來替代,比如12nm製程的Volta架構產品V100。
對AI晶片有旺盛需求的國內主機廠和自動駕駛廠商來說,要麼忍受自動駕駛技術「原地踏步」一段時間,隨後徹底使用國產替代產品,要麼繼續英偉達的低端晶片。不過這同樣意味著L4的研發進度或成本可能無法達到此前的預期。
L2不再是「雞肋」,高性價比視覺方案「上位」?
雖然L4自動駕駛玩家受到「限芯令」的打擊比較明顯,但是對L3級以下的自動駕駛玩家來說,不僅沒有不利的影響,可能對這個賽道的繁榮都是一種利好。
首先,從商業化的緊迫性來看,L4企業無法再輕易獲得高性能AI訓練晶片,會傾向於降維求生。
就好比Robotaxi玩家們今年融資和上市遇冷之後,紛紛「降維」與主機廠合作,L2開始成為自動駕駛創企們角逐的焦點。
其次,從技術成本來看,L2自動駕駛方案暫時不需要AI晶片,其商業價值的想像力雖遠不及L4,但依然有投資機構願意用真金白銀支持。
據天眼查APP顯示,自動駕駛前裝系統方案提供商知行科技近日獲得了來自HL Klemove的戰略融資。
這家此前不太受到關注的公司能夠贏得資本青睞,不僅在於其已實現L2、L2++方案的規模化量產。更重要的是,在產品定位方面,知行科技的自動駕駛量產方案更重視BOM成本控制和硬體使用效率,一開始就走的是相對低調而務實的單目視覺路線。
單目視覺和雙目、多目等都屬於不依賴雷射雷達的純視覺方案,這幾種路線大致的差別是:
多目和雙目路線的攝像頭融合技術難度大、上限高、成本也較高,豐田、奔馳、華為、博世等車企和供應商都加入了雙目立體派的陣營。可以發現,無論是供應商還是主機廠,都是頭部企業在布局。
而單目攝像頭則是一種低成本高可靠性的感知解決方案,搭配其他傳感器,可以滿足L1、L2以及部分L3場景下的智能駕駛功能。
事實上,在英偉達以算力優勢超越Mobileye的市場份額之前,Mobileye最引以為傲的技術就是單目攝像頭解決方案。只不過後來Mobileye的「黑盒」合作模式給主機廠帶來很多調試疊代方面的不方便,所以英偉達的依託工具鏈和CUDA生態壁壘得以後來居上。
從這裡也可以看出,採用單目攝像頭的自動駕駛供應商並非一種落後的、低級的技術方案。更多是因為在特斯拉的示範效應和大家對L4報以超高期待的前提下,算力才成為生產力。
然而在L4因缺芯不斷推遲落地的背景下,低階自動駕駛方案可能迎來批量上車的機會。或者說在現有市場環境下,單目攝像頭解決方案可能更有利於車企提升產品的智能性價比。
當中低端車型的智能化市場規模開始大量釋放,對主機廠來說,也不失為一股提升生產力的推動力。
此外,便宜的方案可能只是聽起來比較low,向L4進階的路並沒有被「堵死」。在經過多次疊代升級之後,配合其他傳感器,也有可能升級為完全自動駕駛。
例如,根據Mobileye給出的方案,其L4級系統的硬體配置包括360度環繞攝像頭、4D成像雷達,甚至還融合了一顆高解析度的前置FMCW雷射雷達。或許成熟的單目感知技術配合上其他「高大上」的配置,也是漸進式實現L4的一種可行路徑。
事實上,國內首款搭載了Mobileye SuperVision(純視覺自動駕駛方案)的極氪 001,就是一台沒有搭載雷射雷達,也能在城區實現領航輔助駕駛的車型。
在談擎說AI看來,如果按照上文的猜測,也就是說,英偉達主導的算力至上的自動駕駛方案不再具有性價比優勢,那麼或許效仿Mobileye的算法派車企和供應商會越來越多。
過去幾年,漸進式路線與一步到位的路線一直是自動駕駛爭論的話題,而事實上,無論哪種路線,都是殊途同歸,就是乘用車的完全無人駕駛。
而在真正的量產落地之日來臨之前,一邊不斷嘗試多樣的替代方案,一邊保持沿途下蛋,可能是每個國內自動駕駛公司和車企保持穩定競爭力的權衡之策。