36氪專訪 | APUS創始人李濤:數據、場景、算法、算力,中國創業者目前能抓住前三個

36氪 發佈 2024-03-06T20:08:10.575186+00:00

文 | 周鑫雨編輯 | 蘇建勛關注到大模型能成為蝴蝶的翅膀,全球化移動網際網路企業 APUS創始人李濤比許多人早得多。第一次是在2019年,李濤和字節跳動創始人張一鳴、紅杉中國創始人沈南鵬在矽谷見到了OpenAI創始人Sam Altman。

文 | 周鑫雨

編輯 | 蘇建勛

關注到大模型能成為蝴蝶的翅膀,全球化移動網際網路企業 APUS創始人李濤比許多人早得多。

第一次是在2019年,李濤和字節跳動創始人張一鳴、紅杉中國創始人沈南鵬在矽谷見到了OpenAI創始人Sam Altman。Altman通過視頻demo向所有人展示了GPT-2操作遊戲DOTA2的過程,「很震撼」。

只是那時,所有人都覺得Altman口中「做一個通用人工智慧的引擎」的計劃太過遙遠和模糊,沒有人下定決定投這樣一家充滿理想主義的企業。

第二次,是在多數從業者都能感到的奇點時刻——2022年11月,ChatGPT炸場。彼時,APUS已完成了從「出海」到「全球化」的戰略更迭,正全力發展企業的第二曲線。

成立於2014年的APUS,是最早把「出海」的概念帶進創投圈的公司之一。基於Launcher桌面系統、清理安全、加速等工具類產品,APUS的用戶增長實現了「上線1個月超千萬,6個月破億」的成績。目前,APUS全球用戶量已超24億,覆蓋200多個國家和地區。

「出海」從來都伴隨著未知與變數,APUS在高速發展中也受到時局等多重因素影響——被封殺、被打壓,是出海企業難以規避的「漩渦」。「社會政治環境以及國際格局對企業的影響還是很大的,我們沒有能力阻擋這種衝突所帶來的影響,這超過了一個創業企業所能夠承擔的。」李濤坦言。

痛定思痛,自2019年起,APUS將發展戰略從「出海」進化為」全球化「,既分散了單一市場風險,弱化了國際關係變化對企業的影響,也為其開拓美國、日本、歐洲以及國內等更大海域帶來機遇。

戰略的變化透露著思維模式的改變,李濤告訴36氪,APUS面對的是全球競爭者,嗅覺要格外敏銳,動作要足夠敏捷,「作為技術驅動型企業,在與全球巨頭競合的過程中,我們一直對技術革新保持極高的關注,還要匹配隨時升級疊代產品的能力。」

ChatGPT一經公開,APUS就基於大模型進行了一系列業務改革——1月,APUS所有內部系統已全部接入人工智慧,用以提升辦公效率;隨後,APUS用人工智慧對現有的產品進行改造升級——時間比國內年後席捲的熱潮提前了近兩個月。

APUS創始人李濤。圖源:視覺中國

對於中國能否做出下一個ChatGPT,轉換思維模式後的李濤也總結出了中國創業者的一套AI打法:小模型領跑,大模型蓄力——這關乎行業資源,也關乎社會價值觀。以下是36氪和李濤的對話:

理想的驅動,商業化的管理

36氪:為什麼國內關注到ChatGPT比海外晚了2個月?

李濤:一方面是企業發展戰略的問題。因為國內大部分企業關注的都是國內市場,不在海外,所以敏感度不是很高。

另一方面是價值觀的問題。2019年我在美國矽谷見到Sam Altman,那個時候他剛從YC孵化器的總裁位上退下來,決定專心做OpenAI。他當時和我們說自己要做一個「人工智慧的通用引擎」,但是沒有人理解。我覺得中國很多科技企業的想像力都被商業化給扼殺掉了,這個本質上是中國社會對「錢」的態度問題,很多投到企業上的錢都追求回報。

36氪:您覺得價值觀如何影響科技走向?

李濤:科技創新常常由商業+價值觀同時驅動,馬斯克經營企業的時候,絕對有商業的成分在,但他選擇做很多事的時候,也受他個人的價值觀影響,比如造火箭上太空——在價值觀驅動的同時,用商業化的方式來管理和提升效率。

而顯然更普遍的科技創新是由商業驅動,在新技術的實用性還沒被驗證的時候,還沒有體現出很強的商業價值的時候,企業以及所有社會層面都很難下決心去推動。

36氪:大模型的實用性目前有得到證明嗎?

李濤:這是一個還有待證明的事。

36氪:您覺得發展大模型的必要性在哪?

李濤:雖然大模型的實用性沒有被證明,但中國企業也不是完全沒有想像力。我們目前已經看到了商業價值的端倪,只是還沒辦法評估。

大模型的核心價值其實就在於:當它的算力足夠多、數據量足夠大、算法足夠豐富的時候,就能用來輔助訓練各種各樣的中模型和小模型

小模型的能力來源有三個,一是基於特定場景的數據從0訓練,二是基於中模型用疼場景數據訓練,三是基於大模型。這麼區分的原因是因為三者所需的算力成本不一樣。比如人臉識別是一個小場景,所需的參數很少,用人臉數據直接從0訓練的成本不高,就不需要大模型輔助。

雖然基於大模型訓練要的算力成本高,但相對而言準確定也更高,能夠應用於更多場景。舉個簡單的例子,北京交通擁堵的問題80%的原因不在於車多,而在於交通系統的配合程度低。紅綠燈的位置、不同路口亮燈的時長、燈與燈之間的配合,在大模型出現之前,這些海量的交通數據是難以處理的,相應的問題也很難得到解決。但有了大模型,這些交通規劃的問題就能被解決。

抓住場景和數據發展小模型,為算法和算力蓄力

36氪:價值觀的問題需要時間去改變,當下國內企業能否發揮能動性,推動大模型的發展?

李濤:剛才我們聊的是理想主義的培養,但從商業化的現實角度來講,我覺得國內人工智慧落地有4步走:內部提效工具、現有產品進化,AI+場景重塑、構建新產業引擎

第一步是內部提效工具。從今年1月份開始,APUS所有的內部系統全都接入了人工智慧來提升效率。我們投餵了自己歷史上的業務數據。現在所有業務的自動化投產都是實時的,每一秒鐘花了多少錢、賺了多少錢、增長了多少用戶,都是典型的小模型應用場景。

第二步現有產品進化,也就是用人工智慧來改造我們現有的一些產品。在結合人工智慧、和用戶頻繁產生交互的工程中,就能找到新的場景和服務,這就是第三步AI+場景重塑。第四步也有一些普惠的意思,公開成熟模型的API,助力產業發展。

36氪:對中國創業者來說有麼有比較好的切入點?

李濤:英偉達A100的晶片也好、大的算力也好,客觀來講是要花十年的時間追趕的部分。但這也不是絕對的。舉個例子,Meta做過一個測試,130B參數的模型輸出的結果有時比超過1750億參數的GPT-3要好,原因是小模型的算法更強。

所以模型的優化本質上是基於算法的優化。模型的4要素是數據、場景、算法、算力。中國有數據有場景,就能把模型的算法打磨出來。算力是短時間只能難以追上的,那就先把前3個要素拿在手裡

36氪:現階段算力的問題怎麼解決?

李濤:我覺得中國應該先建立起中模型和小模型,在各個場景上先使用起來。換句話說,在先進科技面前我們不要掉隊,這非常重要。

要意識到,落到具體場景是需要中模型和小模型來支撐的。現階段中國不能完全沒有自己的模型,換句話說中國人做場景服務,不能直接用別人的大模型,一是成本高,二是牽涉數據安全。

但海外公司的算力,是可以幫助中國公司來訓練小模型的。比如說基於GPT,中國的企業可以先對一些場景進行可行性的驗證,在AI能夠跑通的場景,我們再用自己的數據去訓練,那試錯成本就會降低。

還有一點,我覺得是需要聯合社會政府力量一起來做的。在風口中很多公司決定做模型,我們需要從正反兩面看待這個現象。一方面,這個熱潮對行業價值觀和社會認知的培養是好事;另一方面,太多人入局也會造成算力資源的分散

中國現在的問題是基礎設施和企業剝離,企業的設施基本上是針對業務商業化來做的,而國家也有大量的超算中心,但是兩邊的資源沒有打通。所以喊口號是沒用的,要做好資源整合才能做行業發展的後盾。

所以,只要積極結合社會發展的特點,人工智慧行業在中國就不存在跑不通的現象。

36kr製圖

關鍵字: