又一個百億規模智能汽車新賽道,誰在「領跑」數據引擎中間件

高工智能汽車 發佈 2024-03-11T00:56:27.831681+00:00

基於數據閉環驅動的汽車智能化疊代升級模式,已經成為行業的共識。時間線推到2021年8月,特斯拉在美國加州總部舉行的AI DAY,一個名為「DOJO超級計算機」的項目正式亮相。這是特斯拉首次對後端大數據分析、模型訓練體系進行公開披露。

基於數據閉環驅動的汽車智能化疊代升級模式,已經成為行業的共識。

時間線推到2021年8月,特斯拉在美國加州總部舉行的AI DAY,一個名為「DOJO超級計算機」的項目正式亮相。這是特斯拉首次對後端大數據分析、模型訓練體系進行公開披露。

DOJO超級計算機的「內核」是D1晶片,每個DOJO由25顆D1晶片組成,形成36TB/s的帶寬和9PetaFLOPS(9千萬億次)算力。通過分布式計算機架構,使人工智慧擁有更高速的學習能力,並驅動車端智能駕駛功能的不斷優化。

這得益於特斯拉在汽車行業率先布局的「影子模式」(shadow mode),藉助車端標配的傳感器(比如,攝像頭),採集實時數據並進行模擬和測試神經網絡的駕駛決策。

而DOJO則是更進一步,目標是能夠接收車端採集的大量數據並在視頻級別(過去,主要基於圖像幀+人工標註或者半自動標註)上進行訓練,再藉助自動化標籤技術,進行無監督的大規模訓練。

這意味著,在打通車雲數據通道的基礎上,特斯拉可以快速在任何一個區域進行智能駕駛系統的前期訓練(比如,特殊的場景和區域性特色的法規要求),並加速FSD等高階智駕系統的OTA釋放。

眾所周知,基於規則(或者知識、經驗)的系統開發模式是一直以來汽車智能化,尤其是智能駕駛系統的常規做法。

比如,典型的就是以Mobileye為代表的廠商。比如,這家公司主推的RSS模型就是一整套數學公式,將安全駕駛的理念和概念轉化成為數學公式和計算方式,用來界定什麼樣的駕駛行為才是安全的駕駛。

而特斯拉為代表的新玩家,則是依靠神經網絡+採集大量數據進行模型訓練,並基於樣本特徵賦予相應的權重來決定如何對事件(比如,車輛前方出現障礙物)做出反應。

這種模式的優勢,非常明顯。

尤其是對於車企來說,這是打造智能化核心「差異化」的關鍵所在。原因是,不管是計算平台還是傳統的基於規則的開發模式,車企與車企之間並不存在壁壘。有能力、經驗的工程師可以挖,晶片也可以從第三方供應商採購。

但,數據則是核心壁壘。比如,經過訓練的神經網絡的規則和關係的結構是未知的,任何人都無法「拷貝與複製」,數據與模型是深度耦合的狀態。同時,模型訓練的效率,則取決於車企採集數據集的規模和質量。

而隨著NOA等高階智能駕駛搭載率逐步上升,和傳統入門級L2輔助駕駛(以完整功能交付為主)不同,更需要一套完整的車雲數據驅動架構來實現功能的快速疊代升級。

第一步,就是搭建車端的數據引擎。

在特斯拉之前,絕大多數L4級自動駕駛公司以及前裝工程開發階段都是採用最原始的「硬碟拷貝」方式,回傳道路採集數據,然後再進行數據挖掘、分析和訓練。但這種方式,並不適合大規模量產交付後的數據交互。

在智協慧同看來,特斯拉以外的車企都亟需一套高效的Data Engine。作為一家專注於為OEM打造跨車雲的數據驅動能力,能夠打造車雲計算全棧解決方案的供應商,2021年國內首個搭載智協慧同EXCEEDDATA解決方案的量產車型已落地(高合HiPhiX)。

所謂的Data Engine,就是數據引擎中間件,也可以類比為域控制器的中間件模塊。作為中間件,位於上層應用和底層作業系統之間,除了基礎的通信交互外,還承載著屏蔽底層複雜性的功能,向下適配不同的作業系統和硬體平台。

數據引擎中間件一方面在邊緣端保證高價值數據的獲取,為智能應用和算法模型提供最有價值的數據;一方面通過車雲一體的架構解決了車雲異構帶來的效率和複雜度問題,大幅提升算法模型的疊代效率,幫助車企通過海量量產數據去持續優化算法模型。

比如,EXCEEDDATA車雲一體數據底座,在車端對上萬個高並發、毫秒級、時序數據進行高效管理,並基於邊緣計算引擎實現對Corner Case的結構化數據和非結構化數據融合採集,相比於傳統車聯網,效率提升幾十倍,成本降低85%以上。

同時,封裝了不同車型的異構和車雲異構,生態合作夥伴可以基於數據底座去更高效地開發數據智能應用,只需要專注於本身的業務邏輯,而不用去考慮跨車雲的算法部署問題和跨車型的適配開發問題,大幅提升智能應用的部署效率。

此外,Data Engine也適用於智能座艙。

比如,艙內普及率較高的語音交互系統,智能化的背後同樣是基於數據收集、標註、訓練和部署等閉環驅動流程。通過在模型訓練中基於真人語音交互數據,讓語音交互更加自然和個性化。

同時,解決人-車-環境數據與智能座艙場景智能的打通問題,打造真正智能化的產品體驗。比如,通過分析車輛的歷史導航數據,系統可以更加合理地規劃出行路線。

而在商業模式上,目前,除了少部分車企在自研類似的數據引擎(定製化,無法橫向複製),大部分車企以及Tier1供應商都在尋求與類似智協慧同這樣的解決方案提供商合作,來快速積累豐富的corner case場景庫,同時實現多傳感器數據融合採集和交叉驗證,以及影子模式的量產落地。

這種需求的背景是,從基礎L2到NGP、NOA等等,整個行業也不再只是車企自研一條路徑。比如,基於ODIN平台最新打造的域控產品ADC20,福瑞泰克也率先實現了國產NOA行泊一體方案的量產落地,具備高速NOA、HPA記憶泊車、影子模式等功能。

一些供應商已經可以在不增加雷射雷達的前提下,將攝像頭+毫米波雷達+域控制器+OTA的整套NOA方案成本做到數千元的級別。同時,在數據觸發與回傳機制方面,這些供應商也已經有能力幫助車企構建一套完整的數據驅動疊代升級體系。

「不是每家主機廠都堅持全棧自研,會採取部分自研,部分找合作夥伴做共同推進。此外,隨著產業鏈的成熟健全,更多玩家會選擇採用第三方的方案。」這背後,實際上就是功能和成本的平衡。

按照高工智能汽車研究院監測數據顯示,高階輔助駕駛方面,2022年中國市場NOA前裝標配搭載交付達到21.22萬輛,首次突破20萬輛大關(前裝搭載率為1.06%),同比增長接近80%。預計2025年,NOA(含城區)前裝標配搭載量將超過380萬輛,前裝搭載率將超過17%。

根據高工智能汽車研究院基於收費模式測算,應用於整車四大域控(座艙、智駕、車身、底盤),到2025年數據引擎中間件(包括車端、雲端以及應用分發)的市場規模就將超過120億元。

這意味著,一個全新的智能化細分賽道正在出現。

比如,智協慧同於2022年12月獲商湯國香資本投資,並於近期完成交割,這也是該公司在2022年完成的第2輪融資。本輪融資主要用於車雲數據底座及數據智能應用的研發與銷售。

按照計劃,智協慧同將與商湯等優質合作夥伴攜手打造自動駕駛數據全棧解決方案,為主機廠提供可解耦、開放集成全數據鏈路解決方案,打通從採集到仿真訓練的數據壁壘,提升自動駕駛數據價值和使用效率。

第二步,則是構建後端的數據超算中心,從而打造車雲一體的架構,從而實現真正意義上的端到端數據驅動閉環。

以智協慧同的車雲數據底座為例,一方面使雲端能夠按需、及時且便捷地獲得車端高價值數據,另一方也能將雲端數據算法策略快速地完成車端部署,較大地提升了汽車功能開發者收集和使用量產車輛數據的能力和效率。

尤其是近兩年時間,隨著特斯拉「影子模式」+「超算訓練」模式成為行業標杆,打造支持自動駕駛數據訓練的超算中心成為各家車企的頭等大事。這也是不少網際網路公司、雲計算及傳統數據中心服務商的汽車業務切入點。

比如,在毫末智行看來,近十年自動駕駛技術的發展可以分為三個階段,最早的1.0時代是硬體驅動,以L1、入門級L2為主;最近幾年進入2.0時代,主要是軟體驅動,以L2+(NOA為代表)為主;接下來即將很快發生並持續發展的是3.0時代,依靠的是數據驅動,實現自動駕駛的持續疊代。

而在去年8月,基於阿里雲智能計算平台,小鵬汽車在烏蘭察布建成自動駕駛智算中心「扶搖」,專用於自動駕駛模型訓練。「扶搖」算力可達600PFLOPS,同比此前的自動駕駛核心模型訓練速度提升了170倍。

此外,騰訊雲也在兩年前宣布與寶馬合作共建高性能數據驅動開發平台,研發更符合中國市場的自動駕駛技術和產品。去年,騰訊再次與奔馳達成合作,提供自動駕駛研發、驗證等相關的雲服務和數據合規支持。

與此同時,5G上車也將驅動車雲一體數據驅動模式的加速落地。

高工智能汽車研究院監測數據顯示,2022年中國市場乘用車前裝搭載5G聯網功能滲透率為2.09%,預計到2025年這個數字將提升至25%;未來三年(2023-2025)累計5G上車(按單車計算)交付將接近1000萬輛。

關鍵字: