36氪專訪Nolibox:AIGC應用層迎來發展機遇,但尚在「摸著石頭過河」|Chat AI

36氪 發佈 2024-02-26T14:58:53.722732+00:00

文|沈筱編輯|王與桐 毋庸置疑,通往AGI時代的大門正在開啟。OpenAI在GPT-4宣傳片中提到,其與微軟的合作正致力於將生成式AI技術塑造成對世界真正有用的東西。

文|沈筱

編輯|王與桐

毋庸置疑,通往AGI時代的大門正在開啟。OpenAI在GPT-4宣傳片中提到,其與微軟的合作正致力於將生成式AI技術塑造成對世界真正有用的東西。

OpenAI所謂的「有用」,是通過實現生成式AI技術在各行各業中的大規模落地應用,來提升生產力,並最終提高人類生活質量。這也是谷歌、百度等一眾企業期望達成的目標。

而這些企業近期的一系列動作表明,他們正試圖搶先塑造行業未來格局——在尋求構建模型層技術優勢的基礎上,致力於成為未來AGI生態中基礎設施供應者;同時,以引領新技術的應用落地方向、吸納更多合作夥伴的方式,推動中間層和應用層發展。

3月3日,OpenAI開放基於GPT-3.5的ChatGPT模型接口;

3月15日,谷歌推出PaLM模型API和Generative AI App Builder平台;Anthropic發布類ChatGPT產品Claude;OpenAI緊隨其後發布GPT-4;

3月16日,百度發布文心一言;

3月24日,OpenAI推出ChatGPT插件,允許ChatGPT通過授權訪問外部信息源,調用開發者自有API,實現與第三方應用程式的連接;

3月27日,百度智能雲在線下舉辦閉門交流會,推出大語言模型服務平台文心千帆 。

上述行動,也無不指向生成式AI技術的初探期或已結束。OpenAI領跑,大廠爭鋒,其他創業公司也不甘示弱,模型層混戰已然開啟。接下來將迎來技術落地應用的集中探索期

百度CEO李彥宏在此前接受36氪專訪時也表示,未來行業生態中,最大的創業機會產生於應用層。但是,當前生成式AI技術突破對各行各業的顛覆性僅初現端倪,行業最終形態尚無定論,最終能否呈現出模型層、中間層、應用層分而治之的格局仍未可知。

在模型層混戰的情況下,應用層企業將面臨何種機遇和挑戰?又該如何摸索發展路徑?企業可以在哪些方面構建差異化,基於當前的行業生態定位形成一定優勢?這些問題的答案還需進一步探索。

當前,與OpenAI深度綁定的微軟,除了基於Azure雲計算平台,承擔部分基礎設施供應商的角色,也正在嘗試加速新技術商業化的探索。3月16日,微軟宣布推出Microsoft 365 Copilot,將GPT-4接入Office全家桶,並於近日推出網絡安全產品Security Copilot。同時,在應用層,已經有Shopify、Duolingo等開始利用生成式AI技術進行產品、服務創新的企業;還有諸如Jasper AI、Character.AI,直接基於生成式AI技術打造產品、服務,試圖占據應用層風口的創業公司。

同樣,在國內,也有較早布局AIGC領域的企業。為了了解他們的看法和做法,帶著上述問題,36氪採訪了Nolibox 創始人兼CEO徐作彪、CTO 何宇健。

Nolibox是國內最早一批探索生成式AI技術在設計領域中應用的企業之一,聚焦於將美學原理、設計模型與人工智慧技術進行深度融合。36氪此前報導了Nolibox的Pre-A輪融資新聞。

目前,Nolibox已經接入了Stable Diffusion、GPT、百度文心等多個大型語言模型,並在對相關模型進行二次開發的基礎上,構建了畫宇宙、圖宇宙兩大核心產品,服務於服裝、電商、遊戲、教育等多個有智能設計需求的應用場景。

以下是專訪內容,經36氪編輯:

01 模型層混戰開啟,應用層迎接機遇

隨著市面上可用的大模型湧現,應用層企業迎來了發展機遇。

一方面,企業可以綜合對比不同模型,選擇與業務契合的最優解。另一方面,通過接入不同模型能力,企業可以進一步豐富產品形態。現階段,應用層企業可以與模型層企業達成合作,發揮比較優勢,以挖掘特定領域和場景的機會。

36氪:近期,OpenAI動作頻頻,在開放基於GPT-3.5的ChatGPT模型API之後又推出了GPT-4。OpenAI一系列動作對行業內自研大模型的企業有什麼影響?

Nolibox:作為技術領先者,OpenAI開放更優性能的模型接口,對自研大模型的企業會是很大的挑戰。

目前OpenAI基於GPT-3.5的ChatGPT模型API成本已經被壓得很低,也壓縮了其他廠商的實際利益空間,甚至是生存空間。另一方面,這些企業的投資回報周期可能會被拉長,因為涉及與更優性能模型的對比、競爭。從資方角度來講,會關注這些廠商自研的大模型與GPT差距有多大,是否可靠,是否能夠投入到應用層面。

對試圖進入該領域的初創公司來說,做大模型需要有相關背景。企圖平地而起製作大模型,是很困難的。

36氪:谷歌的PaLM、百度文心一言近期也紛紛官宣。對應用層企業來講,大模型混戰會帶來什麼影響?

Nolibox:對我們做應用層的企業來說更多是機遇。

首先,市面上可用的大語言模型越多,我們的選擇就更多。企業能在對比模型表現、效果、速度、成本等因素的基礎上找到契合業務的大模型。從價格的角度來講,我們調用第三方大語言模型API的成本降低了,相應產品和服務給到市場的價格也會變低。

其次,在接入不同模型能力後,我們能夠服務的企業也變多了。一是能進一步豐富產品形態,二是能夠基於相關模型進行二創,提供相應的API。

另外,我們一直標榜自己是多模態畫板產品,無論是GPT-4,還是百度文心一言,新的多模態模型出現,給了我們驗證多模態產品形態的好機會。

36氪:Nolibox目前也使用了多個不同的底層模型,是如何布局的?

Nolibox:我們已經接入了Stable Diffusion、百度文心、GPT,以及其他一些開源的大模型。目前我們的API二創主要是在Stable Diffusion的基礎上,底層的building block則融入了一些我們積累下來的技術,比如better transformer和模型的dynamic loading,使得部署成本、推理速度都得到了較大的優化。

我們首先接入的圖像生成類大模型,文本生成類的大模型是後來陸續接入的。GPT是今年剛接入的,一開始使用的是GPT-3 davinci接口,GPT-3.5 API開放後,我們也正在測試看哪款的效果會更好。另外,我們內部也會對GPT-4進行評估,本質上還是看業務邏輯,有沒有鏈路能夠和GPT-4契合。

36氪:會產生新的挑戰嗎?比如,從市場層面來說,未來可能有更多競爭對手湧入。

Nolibox:首先,和大部分做應用的友商不太一樣,我們基本不做C端。雖然我們在C端有相應的產品,但它更像是一個廣告位,起到「招商引資」的作用。我們主要的目標客戶是B端。在B端,我們自認為做得不錯,產品形態比較獨特。很多B端客戶也看重我們的能力,而且客戶在對比了多家之後選擇了我們,所以目前我們不會過於擔心競爭的問題。

其次,市面上的競爭對手越來越多,反而是督促著我們把自己的產品做得更好。

另外,我們和國內友商也在持續交流,包括做大模型的和做產品的,大家都願意開展合作。所以對我們來說,可能並沒有太多的直接競爭對手,算是競合關係。

36氪:自研大模型的企業在商業化時,可能也會開放API調用,或推出應用程式。儘管剛剛提到大家傾向於合作,但會不會也存在競爭關係?Nolibox如何看待?

Nolibox:我們一直秉承分工的理念,大家都發揮比較優勢,才能最高效地把這件事情做大、做好。當然會有一些做大模型的企業也想做自己的產品,最後也能做出來,但可能沒有我們做得好,或者沒我們做得快,兩者兼顧的可能性較小。因此我們還是很希望和他們多合作。我們提供產品側能力,對方提供大模型,雙方合作後一起服務於B端。這也是我們與大廠談的合作方式。

另外,API對我們是附加價值,我們最重要的還是服務好特定的客戶。開放API這件事,更多是因為我們有這個能力,順手開出來的,不會像一些大模型公司用user in the loop的思想去收集用戶數據和反饋。我們自己的數據、反饋的收集更多體現在各種產品上(包括畫宇宙和一些SaaS),因為我們給到各方的畫板的數據結構都是統一的,可以很方便地回流、利用。

36氪:自研大模型的企業有沒有可能未來通過併購應用層企業來構建生態?

Nolibox:這是有可能的,但大模型企業也不會因為併購就能夠完全占據絕對優勢。應用層只是把大模型作為水電站一樣的基礎設施,各有各的發展方向。在應用層,也可能產生像移動網際網路時代的抖音、美團這樣的企業。

AIGC確實是大的趨勢,但基礎層、模型層、應用層都有機會,總需要有企業專心做應用。或者說,一個公司不太可能既把通用大模型做好,又能把足夠精力分配到應用層,所以做產品應用還是有空間、有價值的。而且我們認為,再過3-4年,可能全球做得好的超級大模型有2-3個就足夠了。但是應用層,每個領域、每個場景都有自己的機會和價值,本身也是可以建立壁壘的

02 摸著石頭過河

目前,無論是自研大模型企業,還是應用層企業,都尚在摸索過程中。

Nolibox形容,對應用層企業而言,這一摸索的過程像是「摸著石頭過河」——從可以做橫向增量的場景切入,基於自身的技術能力,以小成本快速做出最小可行產品,並在得到市場驗證後逐步加大投入。同時,判斷是否進入AIGC賽道的關鍵在於,企業能否基於生成式AI技術進行差異化,以及差異化能否創造超額收益。

36氪:應用層企業如何構建壁壘?有觀點認為應用層難以實現差異化,Nolibox怎麼看?

Nolibox:首先,我們說的應用層壁壘,主要是模型側、產品側和應用側的壁壘。具體來講,包括企業能否比競品,更快速切進某一個場景,先抓住行業know how,打磨出符合場景特定需求的模型和產品;或者能否快速整合行業資源,形成數據壁壘等。

其次,一般說難做差異化其實更主要體現在通用大模型端。比如文本生成圖片方面,大家可能都會基於Stable Diffusion做,如果要做一個大而全、所謂完全自研的大模型,確實很難做出顛覆性的或者顯著的差異化。所以我們主打的還是垂直場景大模型和產品上的差異。

我們一直致力於在模型端做出和場景結合的、有價值的差異化,同時我們也將開原始碼全部重寫,也就是之前提到的二創,包括嵌入定製的功能、降低模型的部署成本和硬體要求、提高運行速度

一般開源模型會開放代碼和模型權重兩個層面的信息。但由於開源的代碼不夠好,後續加入其他功能就比較困難,所以我們並不會直接使用開原始碼。

比如在我們重寫的過程中發現的生成四方連續圖功能,處理完成後,使用起來會很巧妙,但據我們了解目前應該沒有其他友商做出來。還有一些很細節的技術,友商還處於以很靜態的模式部署服務,只能調用數量有限的固定小模型,而我們可以動態地通過接口激活小模型。

再比如最近很火的ControlNet,在我們改寫過後,不僅降低了對硬體的要求,速度上也至少比官方開源版本快了1.5-2.5倍。這些細節還挺多的,就不逐個舉例了,落實到服務層面時就會變成我們的差異化優勢。

36氪:產品端的差異化主要是體現在功能方面?

Nolibox:對,比如在模型端通過代碼改寫後能夠支持四方連續生成等,單獨這一個改動就能切入一些行業。

比如,友商的類似產品可能更多是對單圖的編輯器。雖然這個可能已經夠用了,但對於一些專業的設計師或插畫師等對產品要求更高的客戶,我們的產品就有了一定的優勢。我們本質上是無限畫板,但可以向下兼容成單圖編輯器。同時,我們能夠更快實現產品交付。例如,我們與百度的合作案例,其他服務商可能需要2-3個月完成,但是我們的無限畫板一周就可以交付。

36氪:在做之前,怎麼去確認這個事情未來可能會成為壁壘?

Nolibox:這個確實無法事先知道,或者說我們尚未找到事先知悉的辦法,相當於「廣撒網」。因為行業完全沒有先例,甚至很多和我們合作的友商也明確表明他們也還在摸索,為未來投資。所以基本上沒有所謂的標準,大家都在摸索,只是我們剛好撒的網多些,運氣好一些,知道了一些目前只有我們能做的需求。

比如最開始的時候,我們認為只要把產品做好,就能吸引到目標客戶。我們第一版產品發布時,計劃面向的是專業的設計師或者插畫師。後來發現真正對我們產品感興趣的,並且樂意為此付費的客戶是另外一個群體。

所以這也告訴我們,需要不斷地去嘗試,不能拍腦袋說客戶一定是誰。比如現在不論是電商、服裝還是遊戲、教育,他們都有這樣的需求。但核心還是我們要把產品做好,後面的PMF都是水到渠成的事情

當時在內測的過程中,就有客戶表示很喜歡我們的產品。所以我們也嘗試站在這些客戶的角度,去嘗試,去思考我們的目標群體是哪一部分。但是長期來看,我們還是要切入專業設計師群體,算是B2B2C的模式。同時,我們希望「設計創意群體的利益」和「AI的利益」可以是一致的,而不是割裂的、對立的。

36氪:可以理解為Nolibox早期其實想做PLG(Product Lead Growth,產品引導增長)嗎?

Nolibox:剛開始有一些這樣的考慮,通過C端帶動B端,免費帶動付費,然後再到口碑裂變的傳播。但當初我們做AI繪畫時,國內有成百上千人也在做同樣的事,當幾乎所有人都在做這件事,這時候PLG是很困難的。

所以我們更多的是定點爆破,利用專業的渠道或者直播的方式進行曝光,這樣才能幫助我們更快地拿到第一批業務,而不僅僅是PLG的路線。這很容易劣幣驅逐良幣,有渠道有流量的同行會搶占市場心智。對用戶來講,就算我們做出了差異化,但也無濟於事。當然我一直都認為PLG是一個很好的方式,但不能只採用PLG的方式。

我們認為,等大眾對於AIGC的熱情褪去之後,誰能真正把客戶服務好,真正賺到錢,這些才是最本質的問題。

36氪:Nolibox如何切入市場的?是先有了技術,再通過客戶調研尋找痛點嗎?

Nolibox:這是同步進行的。我們會事先判斷做AIGC這條賽道,產品的差異化能否給我們帶來超額收益。如果這件事大家都能做,意味著產生超額收益的機率很小,那麼我們並不適合去做這件事。如果產品或功能不能切中某個痛點,那麼這條線也不值得我們去做。

目前,我們有點摸著石頭過河的感覺,或者我們判斷它是有用的。但至少目前看來,我們算是摸到了不少石頭,因為確實挺多人願意為此付費。

36氪:在摸索過程中,可能發現對某些人群來說痛點的確存在,但如何判斷這個市場是值得投入的?

Nolibox:首先,我們的第一步就是不捲C端,而是去驗證產品最核心的那一部分邏輯。

一開始我們並沒有全力推產品,而是隨著聊的客戶越來越多,才逐步投入更多人力。舉個例子,我們現在畫宇宙產品的MVP(Minimum Viable Product,最小化可行產品),是CTO一個人用一個星期寫出來的。所以,一開始我們會以小成本,小規模地嘗試,當我們發現它足以撐起足夠大的市場時,才會進一步投入。因為此時已經有很大的單子等著我們,而不是一開始就選擇all in。

其次,在這個過程中,我們也收集到了客戶反饋,並不是發現一兩個小的痛點就決定去做,而是關注可以橫向做增量的場景。

比如四方連續,可以做印花或者服裝面料生成,雖然這是一個很小的點,但它可以橫向地拓展出多個場景,還可以做背景等等。一個點能上量,解決的痛點雖然是個小點,但是市場層面的需求量卻不少。

03 成為顛覆者而非被顛覆

不同於上一代移動網際網路應用層企業的發展邏輯,AIGC表現為技術突破。

創業公司可能難以從填補市場或產品空缺的角度尋找發展方向,而更多需要將生成式AI技術與其他技術、產品結合。同時,對現有企業而言,在新技術已經顯現顛覆性能力但尚未大規模應用時,或許正是進行產品、模式創新的好時機,但需考慮新技術與業務邏輯的耦合。

36氪:中國AIGC應用層的發展是否需要經歷慢慢地找到行業落地場景和市場痛點的過程?

Nolibox:我們認為是的。因為美國企業也一樣,比如Figma也花了十年的時間成長,要一步一步走。開始的時候總要經歷一個相對摸索的過程,如果走得太快,做出來的產品可能是很虛的,或者說容易踏空。

包括美國SaaS發展的第一個階段,主流也是定製化。SaaS很講方法論,如果美國有這種經歷,那中國大概率也會有這樣的過程。定製化可能是一個正常的、自然的必經之路。但再過幾年,這種情況會好很多,但目前也不能完全依賴定製化。

就我們而言,如果定製化只需要很小的改動,那麼不會占用過多精力,毛利不錯,或者分成也比較好,這種情況下,我們就會去做。

36氪:國內在應用落地方面會不會參考美國同類企業的做法?

Nolibox:是會參考的。我們會關注美國這類AIGC的創業公司,看他們在做什麼項目。比如外國做遊戲做得還可以,我們就聯繫遊戲公司,看他們有沒有類似的興趣。

美國的企業一般會針對一個比較具體的痛點,解決相對比較垂直的問題,先解決得很好,然後再逐步做大,這也是目前我們想走的路。

36氪:像之前的移動網際網路,湧現出一批由中國企業引領的模式創新和應用層市場增長。AIGC能否有類似的情況出現?

Nolibox:之前提到比如說可能受益於人口紅利的企業,他們實際上是做了一個很好的C端產品,填補了市場空缺。但是AIGC其實是技術突破,可能很難說填補產品空缺。要麼就是找到一個產品空缺,剛好AIGC能做。

但是,單用AIGC去做產品,成功的機會可能並不大。

如果通過AIGC與其他技術/產品結合,做出一個更綜合性的產品去推廣,成功的可能性就會大很多,甚至會因此顛覆現有市場格局。比如,把AIGC與設計相結合。技術只是一個手段,重要的是能解決哪些客戶的需求,產品是否真的有價值,以及是否充分發揮了數據閉環、規模效應的壁壘

36氪:能否結合Nolibox的情況,闡釋「技術只是一個手段......」這句話?

Nolibox:從2021年到現在,我們的業務主線並沒有很大的變化,仍然關注智能設計或者智能創意這件事本身。但是因為AI技術一直在發展,變得更加強大,所以能夠和我們的技術、產品有更好的結合。

我們成立之後一直是基於自己的一些技術能力,來探索創意、設計方面的人機協創方式。圍繞主線,我們做了很多積累。然後隨著生成式AI技術的發展,比如Stable Diffusion、GPT模型API的開放,我們可以將新的技術用在新的板塊里,實現落地應用,把原有的產品做得更好。比如,我們的無限生成能力,就要優於之前。

2021年時,幾乎沒有人提AIGC這個概念。那個時候我們利用AI技術解決的是比較實際的問題,比如一些檢索技術,像文搜圖、圖搜文或者圖搜圖,包括營銷內容生成,不需要GPT也能做。當然,我們當時也用到了一些AIGC技術,比如智能海報生成,而且我們下一步要做的事情就是——融合「AI設計」和「AI創意」,打造更加強大的「AI設計創意生成工具」。

36氪:之前提到PLG模式在AIGC有大量應用層企業湧入時,可能並不適用。也有觀點認為AIGC和ChatGPT的爆火,會對Grammarly或者其他效率提升工具,甚至PLG模式產生衝擊。能否談談你們的見解?

Nolibox:影響是會有的,但不會所有產品都會被顛覆。需要關注產品主要解決的需求能否利用新技術得到更好滿足。從技術層面來講,也許新技術的爆火會對之前的技術帶來衝擊,但新技術並不能壟斷所有功能。

比如Grammarly是做英文語法矯正的,可能會有人認為未來不需要矯正了,直接用AI寫。包括有一些企業會用AI生成UI設計,可能會對現有的相關效率工具產生影響。

其次,PLG只是一個概念或方式,好比去羅馬能通過汽車、飛機在內的多種選擇,而不是只會有一種。

但同時,理論上,作為PLG公司,當新技術出現時,首先應該考慮的是能否以及如何將新技術運用到提升自己的產品上,以實現更快的增長,而不是等著被新技術顛覆

Grammarly完全可以選擇ChatGPT接口來降本增效。這個其實是選擇被顛覆,還是跟上潮流來做自己的二次增長曲線的問題。如果企業選擇牴觸,就類似於馬車夫不去學開車,對自己是沒有幫助的。不如懷著更開放的心態,又或是抱著對未來世界的憧憬,加入到這一波AIGC帶來的變化中,與模型層、應用層的公司共創,邁向下一個時代。

WISE 2023 顛覆AIGC

關鍵字: