ChatGPT浪潮重構網際網路生態 哪些創業機會湧現?

每日經濟新聞 發佈 2024-03-27T06:51:29.820106+00:00

每經記者:文 巧 每經編輯:高,涵ChatGPT依然在攪動人工智慧(AI)風雲。儘管谷歌在過去的兩年中由于謹慎的態度未能發布Bard,讓OpenAI搶占先機。但作為矽谷巨頭,谷歌從來不缺乏「後來居上」的決心和實力。

每經記者:文 巧 每經編輯:高,涵

ChatGPT依然在攪動人工智慧(AI)風雲。儘管谷歌在過去的兩年中由于謹慎的態度未能發布Bard,讓OpenAI搶占先機。但作為矽谷巨頭,谷歌從來不缺乏「後來居上」的決心和實力。

當地時間3月6日,來自谷歌和德國柏林工業大學的一組AI研究人員公布了史上最大的視覺語言模型:PaLM-E。作為一種多模態具身視覺語言模型,PaLM-E能將視覺和語言集成到機器人控制中。

視覺中國圖

這個消息,讓已經在AI投資圈深耕多年的劉天傑興奮起來。劉天傑是華映資本董事,也是AIGC領域的一線投資人。早在去年下半年,由ChatGPT模型前身GPT3驅動的戀愛應用——AI聊天軟體Replika就走入了他的視線,他意識到基於NLP(自然語言處理)的AI模型已經較以前有了變化。

在接受《每日經濟新聞》記者採訪時,他表示,「我們理解,它(PaLM-E)已經跟真實世界有一些交互能力。」巧合的是,在他的預想中,ChatGPT引領的這條路子是很清楚的,他看重的就是未來更多各行各業能夠去做AI賦能的應用,比如SaaS、RPA(機器人流程自動化),甚至是機器人。

隨著ChatGPT及其API的發布,這一大模型身後的藍海讓許多創業公司蜂擁而至。劉天傑認為,這一波興起的AI浪潮與元宇宙、Web3有本質上的區別,網際網路的生態得以重建了。但在泥沙俱下的市場中,第一波有很多「蹭熱度的」,只有擁有真實用戶和了解用戶需求的項目才能生存下來。

ChatGPT出圈 創業者擁抱大模型

2022年下半年,一款AI聊天軟體Replika突然火爆全球。人們驚喜地發現,與AI聊得越多,AI就越「懂」你,甚至還會提煉出用戶的語氣。更有意思的是,該軟體的創始人在採訪中表示,約有40%的用戶描述自己與AI為戀人關係。

Replika這款聊天軟體正是基於OpenAI的GPT- 3大模型,它也是ChatGPT基於的GPT-3.5模型的前身。很快,Replika就走入了劉天傑的視線。他意識到,基於NLP(自然語言處理)的AI模型已經較以前有了很大變化,他開始關注相關領域的投資機會。

隨著ChatGPT的公布,以及GPT-3.5 Turbo的API開放,AI的浪潮蔓延到各行各業,市場對此的反應可以用「狂歡」二字來概括。在劉天傑看來,實際上,開放API是符合預期的,這個項目原本就是開源的,此前也已經有很多人在用GPT3或者GPT-3.5的開原始碼來做應用。

不過,ChatGPT如此「出圈」,還是超出了他的意料。放眼整個AIGC領域,「國內現在肯定是風起雲湧。矽谷這股風比國內要更大,因為(國外)幾個大模型都已經成熟了,美國那邊至少已經有幾百上千的項目湧現出來。」

「(ChatGPT)確實加快了公眾對於AIGC或者AI領域的關注。但是,這條路進化到今天並非一蹴而就。包括ChatGPT的基礎模型Transformer,實際上也是2017年就提出來了。」劉天傑告訴《每日經濟新聞》記者,「從2017年到今天,大家一直在做大量的工程化工作。到今天ChatGPT有這個成績,跟之前多年的積累是息息相關的。」

他向《每日經濟新聞》記者透露,目前看到的創業者其實不僅僅是AI領域的,其他很多領域也在開始擁抱新的大模型以及新的AI能力。

「我們更多地會把這個領域定義成AI+,而不是AIGC。意思就是,利用AI賦能給各行各業。我覺得未來這將是(所有公司的)一個基礎能力。」劉天傑說道。

低價策略 OpenAI構建「AI飛輪」

OpenAI在ChatGPT上的腳步顯得非常主動和激動。大熱剛剛3個月,ChatGPT API就高調上線了。這個API由GPT-3.5 Turbo模型支持。HerAI App的開發者王紹此前告訴《每日經濟新聞》記者,接口服務定價大約是3分/1000個漢字。這一定價較GPT-3.5模型便宜90%。

「Turbo就是加速的意思,它的反應速度是要比ChatGPT要快很多的。從底層算力上看,其實沒有發生太大的變化。但成本降低、反應速度提高,這只能說明一件事,就是GPT-3.5 Turbo模型實際使用的參數相比ChatGPT下降了。」劉天傑說道。

他隨即向《每日經濟新聞》記者解釋,「比如說,你有1750億個參數,但是你餵給它的訓練集很小,也訓練不出效果,會導致大量的問題,我們稱其為過擬合。所以,參數大意味著訓練集要足夠大。但是,參數越大並不意味著模型的表現越好,越能理解人的語義。恰恰相反的是,現在大家都想用更少的參數訓練出一個更好的大模型。」

為什麼GPT-3.5 Turbo能在更小的參數上實現更好的效果呢?「實際上,ChatGPT已經積累了大量用戶使用的實際對話集,這些對話集相比OpenAI使用無監督訓練的語義集,要更準確、更高質量。」劉天傑說道,「因為,用戶實際使用的對話中有上下文、有反饋,收集這些數據後再去訓練模型,新的模型就會比之前更精確,就達到了用更小的參數量實現更準確的效果。

在劉天傑看來,GPT-3.5 Turbo成本的下降,核心的一點就是實際計算的成本確實比之前要低,因為它的模型更准了。

「當然,一方面也因為OpenAI本身不是一個盈利機構,並且它也需要更多的用戶參與進來,去形成這種實際的對話集,再輸入模型中做進一步的訓練,而低價也會導致用戶量進一步的增長。」他說道。

劉天傑表示,這就是所謂的「AI飛輪」。「用戶提高了,數據變多了,模型更准了,用戶自然更多了。飛輪一旦跑起來,OpenAI就能甩掉其他對手,這也是它低價策略的一個原因。」

生態重構 三類創業機會湧現

隨著ChatGPTAPI的開放,調用這個接口來實現AI賦能成為許多創業公司的追求,這種熱潮不免讓人想起元宇宙、Web3等新概念引領的風潮。許多人會問,看看兩年前扎克伯格看好的元宇宙如今在哪兒,未來ChatGPT又會在哪兒?不過,在劉天傑看來,這一波興起的AI浪潮與前一段時間的元宇宙、Web3有本質上的區別。

「元宇宙、Web3是一個分布式的東西。在這裡,大家希望網際網路信息或者經濟系統,都用一個分布式、加密式的方式去重構。」他向《每日經濟新聞》記者說道,「但當前這一波AI浪潮恰恰相反,它會變成一個非常集中的東西,未來AI的底層能力將由有基礎預訓練大模型能力的幾個大廠提供,其他人就在這些底層大模型上去開發應用。」

「所以說,整個網際網路的生態我認為是重構了。這有點類似於當年的雲服務,由幾個大廠來做雲服務廠商,在雲之上,你們去開發各種各樣的應用。」劉天傑進一步說道。

在ChatGPT引領的這一波AI浪潮中,劉天傑看到了三大層次的創業機會。第一類是做中文的底層大模型。「這類創業者往往都是高校出來的,比如說清華系有一大堆人在做底層大模型。但任重而道遠,訓練底層大模型,一是非常燒錢,二是要有足夠強的算力。」他告訴《每日經濟新聞》記者。

「另外,小公司收集訓練集的能力不夠,而大模型的『大』,大在它的訓練集。小公司並沒有積累大量的數據。」他說道。

第二類是中間層,比如做模型的微調、預訓練;或者在底層大模型的基礎上訓練新模型,比如虛擬人模型。「這些模型是基於底層大模型的語義能力,然後在這個能力之上加了各種限制條件。」他說道,這裡有一些創業機會,但並不算多。

第三類是應用層,這也是大多數創業公司正在探究的道路。「目前最直接的是生成圖片、文字、視頻甚至3D內容。但是這些相對來說壁壘不夠,因為模型也不是你的,訓練集也不是你的,無非就是做一點優化的工作。」劉天傑說道。

「當然還有更前沿的,就是科學家團隊在探索真正的終局——通用智能,但這一塊現在還在一個非常早期的階段。」他向《每日經濟新聞》記者介紹道。

泥沙俱下 用戶需求才是根本

在劉天傑的預想中,ChatGPT引領的這條路子是很清楚的,他看重的就是未來更多各行各業能夠去做AI賦能的應用,比如SaaS、RPA(機器人流程自動化),甚至是機器人。

他現在主要關注兩大板塊,一是AI生成3D資產。「因為這一塊有真正會掏錢的客戶——遊戲公司。這一塊是他們的痛點,因為製作3D內容非常昂貴,如果能用AI製作3D內容,是他們求之不得的。但目前大模型的能力還解決不了3D的生成,這是一個我們會重點關注的領域。」

二是文字轉換動作的應用。「也就是說,我用AI指揮實體的東西去執行操作,比如說機器人、RPA(機器人流程自動化)、全局的智能助手等。這一塊涉及到大模型的多模態輸出和輸入,是一個相對來說比較前沿的領域,也是大模型沒有完全解決的領域。」劉天傑解釋道。

市場太熱,到底哪些才是靠譜的項目?對此,一些投資人直言「又興奮又焦慮」。

不過,劉天傑還沒到焦慮的地步,他直言,「我們看了太多這種新技術、新概念的例子,第一波(沖在前面的)有很多蹭熱度的。從經典的蓋特納創業模型來看,新技術都會先經歷這樣的事情,後面真正能使用這個技術的人才會崛起。」

他向《每日經濟新聞》記者透露,很多很強的創業者,例如傳統大廠裡面職位非常高的人,或者在科學界有頭有臉的人,也都被吸引入場。「國內比如說美團的王慧文、快手CTO以及某電商大廠技術負責人。」

據劉天傑介紹,某電商大廠技術負責人提出了Transformer大模型中一個關鍵的技術路線,叫做多頭注意力機制。「泥沙俱下,當然有大量蹭熱度的,但是也有很多很強的創業者在開始幹這件事。」他說道。

ChatGPT身後的藍海讓許多創業公司蜂擁而至。在劉天傑看來,「現在許多所謂的AIGC項目,並非這一波預訓練大模型(ChatGPT)之後產生的,它的技術路線上其實跟大模型沒有任何關係,相當於之前傳統範式的AI上,包了一層AIGC的殼,就非說自己是大模型,但實際上跟大模型沒什麼關係。」

他認為,能夠落地的應用需要創業者在對應的細分產業中做實。「你要理解產業本身的經濟機制和運行規則,以及用戶需求,尤其用戶需求永遠是最重要的。因為在這裡,AI只是提供效率的工具,它類似一個乘數。你必須得有前面的『1』,也就是真實的客戶和客戶需求。」

每日經濟新聞

關鍵字: