英偉達遭「限芯令」，國內自動駕駛玩家怎樣變招？

圖片來源@視覺中國

文 | 談擎說AI，作者 | 鄭開車

最近美國又加大對中國晶片行業的限制力度，英偉達、AMD兩家企業旗下生產的部分GPU產品將被美國列入停售範圍。

據悉，不允許出售到中國企業的晶片主要包括英偉達A100和H100、AMD MI250等高性能AI晶片，並且未來峰值性能和I/O性能達到或高於A100的晶片，都在新的出售許可證所要求的範圍。

由于禁售的幾種晶片主要用於自動駕駛雲端訓練，所以國內自動駕駛和汽車行業都在消化這個黑天鵝式的突發消息。

對此小鵬汽車創始人何小鵬樂觀地表示，「未來幾年的需求提前買回來了」，百度副總裁王雲鵬則馬上回應「我們通宵討論如何加速創新、實現前沿科技自立自強」，並批評何小鵬「和資本市場說我沒事兒」顯得格局太小。

兩位大佬的發聲都是站在自家企業的立場發聲，誰是誰非我們暫且不做評論。眼下更為重要的是，「限芯令」會不會再加大力度？「限芯令」實施之後，整個自動駕駛行業中，究竟哪些企業首當其衝，哪些企業反而可能迎來機遇？

英偉達卡了誰的脖子？

首先要明確一點，「限芯令」針對的主要是用於雲端數據中心的高性能GPU晶片，主要用於AI算法的訓練。這對自動駕駛行業有多重要呢？

業內普遍認為，智能駕駛的量產競爭，主要取決於時間和成本兩個維度。

一是時間維度，即算法疊代的周期中，處理海量數據的速度決定自動駕駛能力提升速度。另一個是成本維度，即在整個算法疊代周期中，處理海量數據所消耗的計算、存儲、帶寬等資源成本。

由於有海量數據的主機廠並不在少數，所以能把海量數據中蘊藏的「算法養料」提取出來就成為關鍵。

在英偉達推出大算力晶片之前，數據處理依賴大量人工，效率太低。以至於行業內有一個流傳甚廣的玩笑，「所謂人工智慧，就是有多少人工就有多少智能。」

從效率的對比來看，本地AI訓練數據處理的效率較人工提升3～4倍，而依託雲端的更高算力，汽車雲服務數據處理的綜合處理效率提升10倍以上，數據處理的成本也較人工降低50%。

對主機廠和自動駕駛公司而言，自動駕駛的時間窗口需要用算力來爭取，英偉達的高性能GPU晶片就是前者的生產力。

去年特斯拉公布了採用英偉達A100晶片的雲端訓練集群，還發布了超級計算機Dojo，以此打造自動駕駛算法的雲端基礎設施，構建數據驅動的閉環。

在國內，繼特斯拉之後，蔚來汽車、小鵬汽車、毫末智行等公司摸著特斯拉過河，也都在基於英偉達A100晶片打造自動駕駛訓練中心。

「量產車產生的海量數據是蔚來自動駕駛能力護城河。而NVIDIA 的高性能計算解決方案，成為了蔚來在自動駕駛這條道路上的加速器。」蔚來 AI 平台負責人白宇利表示。

小鵬一直是自動駕駛布局相當積極的新勢力車企，近日小鵬汽車基於阿里雲建成了自動駕駛智算中心「扶搖」，用於自動駕駛模型訓練，所以何小鵬表示自己沒有壓力。

而如果從長遠來講，用於L4的自動駕駛的數據量在不停遞增，以後是否還需要對算力進行升級也猶未可知。

需要注意的是，特斯拉目前已經用自研的D1訓練晶片替代英偉達的A100。而且從官方公布的性能數據對比來看，D1相比英偉達的A100也更有優勢。

所以特斯拉可以說已經擺脫了對英偉達的算力依賴，但是對國內的蔚來、小鵬、百度們來說，很難找到比英偉達更合適的GPU供應商，也沒有自研的能力，這無疑是一種群體性打擊。

L4成本高企，量產或將推遲？

對國內L4級自動駕駛玩家來說，「限芯令」的影響之所以殘酷，是因為無論其L4級自動駕駛的方案如何強調差異化優勢，都繞不開高性能AI晶片。

具體來講，隨著高階自動駕駛逐步進入現實，數據閉環的概念越來越受到重視。所謂數據閉環，就是不僅要有數據的分類採集，還要有為數據生產服務的工具平台，對數據從導入、清洗、加工、篩選、利用等進行全生命周期的管理。

比如在雷射雷達和視覺算法的開發閉環中，需要雲仿真平台。雲端的感知仿真會涉及到大算力GPU的使用，雖然感知算法更多是在車端跑，但是決策、規劃、和控制算法基本上都要在雲端跑才更有效率。

值得注意的是，對於AEB、主動變道等輔助駕駛功能，如果沒有雲端並行仿真，也能完成開發。但是對於L4級的自動駕駛，雲仿真必不可少。

「一款配置有10個攝像頭和2個雷射雷達的車型，在雲端做感知仿真的話，如果讓500個節點並發運行，大概需要三千多塊GPU。考慮到每家主機廠有很多款車型，單是雲仿真對GPU的需要量就相當驚人。」某自動駕駛公司研發人員向談擎說AI表示。

事實上，從AI訓練晶片的性能來看，英偉達的性價比並不是最高，比如英特爾最近推出新一代AI訓練晶片Gaudi2，性能方面大約是A100的兩倍。谷歌旗下的Waymo作為自動駕駛領頭羊，也有自研的TPU晶片來替代英偉達的GPU。

但是美國政府出台的「限芯令」既然是為了針對中國，考慮到以後同樣有被限制出口的風險，英特爾和谷歌的晶片大概沒有中國企業敢大批量採用。

值得一提的是，AI訓練晶片並非沒有可以替代的國產產品，其中華為昇騰910、寒武紀的思元290智能晶片在性能功耗方面已經不輸於英偉達A100。

然而，由於大部分主機廠的軟實力較差，不僅要有晶片、還要有容易上手的工具搭配使用。基於這一點，英偉達的CUDA軟體棧進行第三方應用及工具的擴展，建成了自己的「CUDA生態」。

這意味著，想要繼續攀登L4高峰的主機廠要想置換成國產AI訓練晶片，除了付出遷移成本，可能還要在替代晶片上投入時間和研發成本。

不過，若站在國產AI晶片供應商的角度看，這或許意味著，此時正是投入研發工具鏈生態的有利機會。

不過，英偉達面對「限芯令」，也不想失去國內的大客戶，創始人黃仁勛於是提出了解決方案，其實就是用還沒有被禁止的低端晶片來替代，比如12nm製程的Volta架構產品V100。

對AI晶片有旺盛需求的國內主機廠和自動駕駛廠商來說，要麼忍受自動駕駛技術「原地踏步」一段時間，隨後徹底使用國產替代產品，要麼繼續英偉達的低端晶片。不過這同樣意味著L4的研發進度或成本可能無法達到此前的預期。

L2不再是「雞肋」，高性價比視覺方案「上位」？

雖然L4自動駕駛玩家受到「限芯令」的打擊比較明顯，但是對L3級以下的自動駕駛玩家來說，不僅沒有不利的影響，可能對這個賽道的繁榮都是一種利好。

首先，從商業化的緊迫性來看，L4企業無法再輕易獲得高性能AI訓練晶片，會傾向於降維求生。

就好比Robotaxi玩家們今年融資和上市遇冷之後，紛紛「降維」與主機廠合作，L2開始成為自動駕駛創企們角逐的焦點。

其次，從技術成本來看，L2自動駕駛方案暫時不需要AI晶片，其商業價值的想像力雖遠不及L4，但依然有投資機構願意用真金白銀支持。

據天眼查APP顯示，自動駕駛前裝系統方案提供商知行科技近日獲得了來自HL Klemove的戰略融資。

這家此前不太受到關注的公司能夠贏得資本青睞，不僅在於其已實現L2、L2++方案的規模化量產。更重要的是，在產品定位方面，知行科技的自動駕駛量產方案更重視BOM成本控制和硬體使用效率，一開始就走的是相對低調而務實的單目視覺路線。

單目視覺和雙目、多目等都屬於不依賴雷射雷達的純視覺方案，這幾種路線大致的差別是：

多目和雙目路線的攝像頭融合技術難度大、上限高、成本也較高，豐田、奔馳、華為、博世等車企和供應商都加入了雙目立體派的陣營。可以發現，無論是供應商還是主機廠，都是頭部企業在布局。

而單目攝像頭則是一種低成本高可靠性的感知解決方案，搭配其他傳感器，可以滿足L1、L2以及部分L3場景下的智能駕駛功能。

事實上，在英偉達以算力優勢超越Mobileye的市場份額之前，Mobileye最引以為傲的技術就是單目攝像頭解決方案。只不過後來Mobileye的「黑盒」合作模式給主機廠帶來很多調試疊代方面的不方便，所以英偉達的依託工具鏈和CUDA生態壁壘得以後來居上。

從這裡也可以看出，採用單目攝像頭的自動駕駛供應商並非一種落後的、低級的技術方案。更多是因為在特斯拉的示範效應和大家對L4報以超高期待的前提下，算力才成為生產力。

然而在L4因缺芯不斷推遲落地的背景下，低階自動駕駛方案可能迎來批量上車的機會。或者說在現有市場環境下，單目攝像頭解決方案可能更有利於車企提升產品的智能性價比。

當中低端車型的智能化市場規模開始大量釋放，對主機廠來說，也不失為一股提升生產力的推動力。

此外，便宜的方案可能只是聽起來比較low，向L4進階的路並沒有被「堵死」。在經過多次疊代升級之後，配合其他傳感器，也有可能升級為完全自動駕駛。

例如，根據Mobileye給出的方案，其L4級系統的硬體配置包括360度環繞攝像頭、4D成像雷達，甚至還融合了一顆高解析度的前置FMCW雷射雷達。或許成熟的單目感知技術配合上其他「高大上」的配置，也是漸進式實現L4的一種可行路徑。

事實上，國內首款搭載了Mobileye SuperVision（純視覺自動駕駛方案）的極氪 001，就是一台沒有搭載雷射雷達，也能在城區實現領航輔助駕駛的車型。

在談擎說AI看來，如果按照上文的猜測，也就是說，英偉達主導的算力至上的自動駕駛方案不再具有性價比優勢，那麼或許效仿Mobileye的算法派車企和供應商會越來越多。

過去幾年，漸進式路線與一步到位的路線一直是自動駕駛爭論的話題，而事實上，無論哪種路線，都是殊途同歸，就是乘用車的完全無人駕駛。

而在真正的量產落地之日來臨之前，一邊不斷嘗試多樣的替代方案，一邊保持沿途下蛋，可能是每個國內自動駕駛公司和車企保持穩定競爭力的權衡之策。