GPT究竟是誰的機會?

混沌學園 發佈 2023-05-26T14:54:48.110953+00:00

在這波由GPT引發的AI熱潮中,創投圈迅速煥發生機,大廠全面參與,短短一個月內便推出了30多個大模型。


在這波由GPT引發的AI熱潮中,創投圈迅速煥發生機,大廠全面參與,短短一個月內便推出了30多個大模型。同時,創業天團紛紛湧現。然而,對於專注於垂直領域的AIGC方向的創業者來說,這是福音還是憂慮尚不得而知。AI的這波機遇是只有大廠、大佬們才能把玩的東西嗎?對於小團隊、初創團隊、非AI領域的團隊來說,它們的勝算又是幾何呢?讓我以一個剛剛涉足AI領域不到兩個月的初學者親身經歷來談談我的看法。


正是因為GPT帶來的變革,讓我現在敢於發表對AI領域的看法。在GPT問世之前,由於知識匱乏,我不敢稱自己了解AI項目。真正的高科技、高門檻領域,若非具備深厚的專業背景,不僅是我,幾乎任何人在談論AI時,都是道聽途說、人云亦云。國內投資圈能夠深入了解AI底層原理的人寥寥無幾。


由於之前不敢涉足,諸如神經網絡、對抗學習、無監督學習、RLHF、fine-tune和embedding等概念從未涉獵。然而,自ChatGPT發布的那一刻起,一切都發生了變化。儘管我依然不甚了解,但在那一刻,全球各大學,無論是斯坦福、MIT這樣的名校,還是中國某個偏僻地區的普通院校,都回到了同一起跑線。因為LLM的出現讓學術界重新洗牌,所有人都從零開始學習。既然所有人都是從頭學起,那我可就不困了。


現在,當別人和我談論AI時,我不再討論技術,而只關注應用。只要問一問,就能知道他們是否真正使用過:GPT-4和GPT-3.5有何區別?Langchain能實現哪些功能?如何使用AutoGPT?Midjourney(簡稱MJ)如何確保一致性?為什麼Stable Diffusion(簡稱SD)的1.5版本用戶比2.1版本多?手勢識別問題解決了嗎?是否能生成中文?如何訓練Lora?在哪裡下載chilloutmix?(停)


正因為我親自動手實踐過這些,所以有了一手的體驗,敢於討論。在GPT的幫助下,我這個編程小白都已經編寫了好幾個可運行的程序。我相信任何有想法和行動力的人,只要稍微動手嘗試,都能大幅提高產能。但這一點小小的行動,正是1%與99%之間的差距。


作為一個AI初學者、觀察者和思考者,讓我來談談在這一個多月的學習中的心得體會。不談大模型,不談技術,只談實際應用的機會。AI與普通創業者究竟有何關聯?對於普通人來說,GPT意味著什麼?


作者|韓冰 寒武創投創始合伙人 混沌創投營一期同學、文理院二期同學



GPT對什麼人的幫助最大?


首先,GPT對我的幫助非常大,但並非最大。我進行了一個簡單而有趣的思想實驗,得出了意外的結論。在這波AI浪潮中,主要受影響的是腦力勞動者。在AI所能影響的領域,我將行業從業者的能力分為兩大類:一類是思考力、創新力、戰略性、前瞻性;另一類是行業通識、執行力、基本功。基於這個分類,我將人們分為四類,思考力占20分,基本功占80分。目前,AI對前者的影響相對較小,而對後者的影響較大。根據這個分類,可以形成四個團隊:



假設目前AI僅對人類腦力勞動的基本功產生影響。


當GPT的能力不如人類團隊時,人類團隊更傾向於使用自己的能力;當GPT超越人類能力時,則可以直接利用GPT的能力。


我將GPT的能力按照0、30、50、100、200分進行比較,看看它們分別會對這四個團隊產生什麼影響?結論簡單而出人意料,頗具趣味,如下圖:



在開始階段,四個團隊的差距極大。基本功強的團隊,無論是否具備思考力,都遙遙領先。但隨著這種超級生產力工具的普及,他們的優勢逐漸減小。原本處於末尾的C和D團隊分別提高了上限和下限,變得與AB團隊一樣出色。(當然,那些不願擁抱GPT的團隊與擁抱GPT的團隊之間的差距會變得更大。)


總結起來就是:在AI浪潮中,原本只擅長動腦而不擅長動手的團隊這次機會最佳,而那些什麼都不擅長的團隊收穫最豐富。


這正是所謂的技術平權。GPT大大降低了技術壁壘,是一種普惠性技術。


雖然這個實驗相當簡陋,但它闡述了一個非常清晰的道理:AI極大地提高了人類的動手能力。對於那些基礎較差的團隊來說,他們更應該積極擁抱AI,因為這是他們少有的可以拉近與優秀團隊、卓越團隊距離的機會。


經過親身體驗,我從未覺得自己擁有如此強大的動手能力。相信我,你和GPT加起來很強大。


應用GPT的首要問題:玩具or工具?


因此,在面對GPT時,我們首先要問自己一個問題:我們是把它當作玩具還是工具?這將決定我們如何更好地利用它。


有一個簡單的判斷方法:當我們使用GPT時,是希望儘快找到答案、用完即走,還是享受使用它的過程?這兩者之間的區別體現了我們對待時間的態度。


幫助人們節省時間的具有工具屬性,而幫助人們消磨時間的具有玩具屬性。


讓我們舉幾個例子:


比如Google和百度,它們具有典型的工具屬性,從不宣傳用戶停留時間這個指標。它們希望用戶儘快找到答案並離開,花費的時間越長說明搜索結果越不準確,這個工具越難用。而視頻、文學、動漫和社交領域則強調用戶停留時間,希望讓用戶儘可能長時間停留。


再比如男女在對待電商網站的態度上,男性往往以目標為導向,使用搜索直接找到商品,了解各種數據,購買後立即離開,把電商網站當作工具。而女性可能漫無目的地逛,以逛為主,用一個滑動動作玩上一個下午。


具有玩具屬性的產品,用戶不在乎時間和效率,主要追求沉浸式體驗。例如,我們喜歡看電影時,希望它的時長更長,一個半小時不夠,要三個小時。有些人會反覆觀看同一部電影,不是因為沒看懂,而是因為喜歡。


抖音一開始就是幫助人們消磨時間的,即使現在有很多推銷產品的,也難以改變它的定位。在抖音上購物,很多時候是沒有明確目的的,效率絕對不如淘寶高。


再回想一下,我們初次接觸GPT時都是如何使用的呢?


還記得你問的第一句話是什麼嗎?有人問天氣,有人說你好。反正我在使用所有AI大模型時,第一句都問的是:「你會說中文嗎?」



有些人用各種腦筋急轉彎來考驗GPT。剩下幾隻樹上的鳥?小明排名第三的兄弟叫什麼?青蛙幾天能跳出井口?那些這樣使用GPT的人,實際上是把它當作玩具,因為我們不是真的想知道答案,而是想逗弄AI,看它犯傻。


我猜GPT-6.0也可能回答不了這個問題:



但僅僅把GPT當作玩具會大大浪費它的價值,就像火車剛傳入中國時,僅修了短短一段,成了皇親國戚們的玩具,而沒有人意識到它對生產力的巨大提升。


可能是微軟小冰給了大家習慣性的認知,或許是「聊天機器人」這個名字被媒體大肆傳播,又或者是ChatGPT名稱中的「Chat」具有強烈的誤導性。的確,「聊天」是GPT最顯而易見、最容易被大眾接受的功能,但它也是最初級、最簡單的功能。


如果你像我一樣,帶著學習的目的去提問,通過不斷追問和調整自己的問法來挖掘GPT背後龐大的知識寶庫,同時利用它強大的推理、擴展和總結能力完成原本費時費力的工作,還對GPT-4逐字逐句回答的方式感到無法忍受……那說明你是在把GPT當作工具。


如果我們明確了這一點,再來看看,究竟有多少人錯誤地使用了這個工具,或者低估了這個工具的價值。


首先,我想強調的是,GPT並不是搜尋引擎。


GPT的一個局限性在於它有時會說些不靠譜的話,因此把它當作搜尋引擎的人可能會被誤導。然後,他們就得出結論:GPT不好用,無法替代谷歌或百度。其實,這兩者本來就是不同的東西。GPT並不追求準確性,而是追求像人類一樣進行交流和思考。它在說話的同時也在思考,已經說出去的話無法收回。這導致了在需要複雜邏輯思考或稍微複雜的數學計算時,GPT容易犯錯。此外,當問到不存在的事物時,它經常能像模像樣地胡說一通,具有一定的欺騙性。


然而,如果你了解GPT的優缺點,就可以發揮其長處,避免短處。對於能在搜尋引擎中找到正確答案的問題,其實根本不需要用到GPT。與其問GPT「這是什麼?」這類問題,不如問「為什麼?」、「怎麼看?」和「怎麼做?」。這也意味著,在GPT的回答中,很可能沒有唯一正確的答案,也沒有最優解。


在吳恩達博士新推出的「prompt engineering」課程中,他簡潔明了地介紹了GPT在總結、擴展、翻譯、推理等多個方面的強大能力,這些能力在很多方面都超過了現有的搜尋引擎。任意一項都是搜尋引擎無法實現的。


作為AI的初學者,學習這門課作為入門工具再合適不過。在短短2個小時內,你就能了解基本原理。


僅以這四種基本功能為起點,就已經有無數的應用場景和排列組合可以想像。


作為一個玩具,GPT並不比原神、星穹鐵道有更多的玩法,也不比在王者榮耀峽谷中帶飛更有成就感,不比抖音里的小姐姐更賞心悅目,也並不能像大狼狗、小楊哥等人在幫你消磨時間的同時還能買到便宜貨。


所以,在嘗試了一圈腦筋急轉彎並從中獲得了智商上的優越感之後,大多數人又回歸到了原本的生活。然而,他們並未意識到,這個世界已經因為GPT的誕生而發生了變化。GPT的出現代表著生產力層面的躍遷,它帶來的影響不亞於珍妮紡織機、瓦特改良蒸汽機、電力和網際網路。


當黃仁勛說GPT-4的發布讓AI迎來了「iPhone時刻」,我是完全同意的。一個新的入口正在誕生,一個新的生產力革命正在我們眼前發生。而這個機會,屬於所有人,屬於普通人。


GPT翻譯很厲害,但我更想學英語了


在使用GPT以及MJ、SD等AI工具時,確實可以感受到一種弱勢文化的憋屈感。


從GPT訓練時使用的語料庫數據可以看出,英語占據絕對統治地位,而中文作為世界上使用人數第二多的語言,在總體語料中的占比僅為千分之一。這使得中文在全球知識傳播中面臨巨大的劣勢。



中國自己的大型AI模型尚未問世,但即使有了自己的大模型,也無法解決中英文信息不對稱的問題。在過去的100年裡,全球發表的論文中有90%以上的論文使用的是英語。這個比例在2000年曾經達到驚人的98%。在日常生活中,我們可能只關心自己人懂的內容就足夠了,但是作為未來重要的生產工具,我們仍然面臨著中英文無法對齊帶來的信息缺失。


正如我們所看到的,如果沒有明朝皇室宗親名字的生僻字撐著,我們甚至湊不齊一個元素周期表。


圖:方塊中為明皇室宗親名字用字


因此,我們應該在提高自己的英語水平的同時,加強中文在全球知識傳播和交流中的地位。這樣,我們才能更好地利用GPT等AI工具,為未來的發展創造更多機會。


不僅僅是科學術語,中英文本質上是兩種不同的語言邏輯,語法和詞彙並非一一對應。即使GPT在翻譯方面表現出色,但在翻譯過程中仍會有大量信息損失。這也解釋了為什麼用中文提問時,有時會收到英文回答,因為中文可能沒有這個詞。


當百度文心一言問世時,其自帶的繪圖功能被認為只是換了個皮的產品,例如著名的「車水馬龍圖」。是否真如此,我覺得沒必要證明,但確實存在用中文直接翻譯成英文餵給SD或MJ,導致奇怪結果的現象。在一些國內SD漢化網站上,用文生圖輸入「鶴」和「都市」,可能會得到如下圖:


By stable diffusion


當我使用MJ時,需要將看到的別人作品的英文翻譯成中文,修改後再翻譯回英文。可能是因為我的藝術修養較低,想像力不足,不懂專業術語,所以無法直接用中文輸出,但這樣的過程經常像雞同鴨講。


以「carving」為例,中文翻譯是「雕刻」,但在英文中,雕刻還可以翻譯成「engraving」,因此在翻譯過程中可能產生意外結果:


Prompt:in style of engraving artwork , 1girl, portrait


Prompt:in style of carving artwork, 1 gril, portrait


這就像玩「傳聲筒」遊戲,每經過一次轉述,都可能產生意想不到的事情。句子越長,誤差越大。


此外,許多名人和專有名詞在中文中通常採用音譯方式,記住這些音譯名字並不比原文容易,特別是較長的人名,使用起來比直接用英文更容易出錯。


在GPT中,名人是最佳的提示,無與倫比,因為每個名人都有大量信息被收錄,豐富的語料讓他們充實飽滿,無需再用文字描述。


參考微軟的GPT4報告中關於莎士比亞解答數學問題的例子,我測試了一下:



與其花費大量時間去記住那些所謂的GPT 10個最佳提示,MJ 20個最有用的提示,了解更多國外名人可能是提升你能力的快速途徑。


把GPT當作玩具的人,可以忽略我的建議。為了稍微增加可能性和趣味性而增加學習負擔並無必要。但是,對於把GPT當作工具的人來說,應該認真思考我提到的對齊問題。科學界,特別是前沿科學領域,普遍使用英語進行研究和發表論文。GPT為普通人提供了一種更簡便的方式來接近科學前沿。要像科研工作者一樣,將AI的最後一點效率挖掘出來,英語這個障礙是無法避開的。


未來被GPT傷害最大的是哪個行業——移動網際網路


一種影響來自於過去。


不久以前,儘管中國的個人電腦普及率較低,辦公自動化程度不高,但憑藉龐大的市場和人口基數,中國通過智慧型手機迅速崛起,一躍成為全球移動網際網路最發達的國家,甚至美國移動網際網路創業者都需要向中國公司借鑑學習。短短几年就誕生了像字節跳動和拼多多這樣在移動網際網路時代崛起的具有全球影響力的企業。


然而,同時也有一個困惑:為什麼中國的移動網際網路如此發達,但SaaS行業卻沒有像美國同行那樣收入和估值飆升?直到最近深入學習AI,我才更直觀地感受到,SaaS發展緩慢的很大原因可能與我們在PC端的滯後有關。


在GitHub上,huggingface里有大量不斷更新的模型。也許是我的錯覺,這些產品大多都是針對PC端的,我還沒有看到哪個模型是以手機為主進行調試的。這當然受到手機性能的影響,但在手機那么小的屏幕上編程、寫文件實在是不方便。


將AI視為效率工具,其主要應用場景在PC端,與SaaS的場景高度重合。在中國企業辦公環境中,除了少數網際網路公司外,許多企業、事業單位對辦公自動化的理解仍停留在Office三件套水平。在這其中,潛力巨大。GPT的強大能力和易用性解決了之前學習門檻高、學習動力不足的問題,有望引發中國SaaS行業的爆發式發展。


只是在這波發展中,我感覺移動網際網路並沒有獲得多少增益。


自從開始學習和使用AI,我在電腦上的使用時間明顯增加了,因為PC上的AI工具太多太好用了!我甚至想起了幾年前羅永浩推出的TNT工作站,雖然他們和現在的GPT只是形似,邏輯差異巨大,但也許那是中國距離AI智能辦公世界領先水平最近的一次嘗試。


另一種影響來自未來。


幾年前,Google眼鏡剛推出時,我非常興奮,但在試用過後,我果斷放棄了。


無法替代手機的問題主要在於輸入確認,語音和眼動都無法實現精確操作,還需藉助其他設備,如手機或PSVR那樣的手柄。但GPT讓這一切成為可能,如果AI能聽懂你的話,它可以通過追問來確認你的想法,讓每個人都擁有一個像鋼鐵俠的私人助理Jarvis。


這不僅僅是技術升級,而是可能引發交互範式的改變。不再需要手機,只需一個耳機就能完成操控。手機變成純粹的屏幕,交互價值被削弱,離邊緣化不遠。這樣,依靠移動網際網路建立龐大帝國的中國大廠可能面臨重新洗牌的機會。


GUI(Graphical User Interface,圖形用戶界面)將不復存在……


這不再是彎道超車的問題,而是車道消失了!


推薦一部多年前關於人工智慧的電影《her》,為我們思考未來提供了一個方向,技術上已經沒有障礙。


靠一幅耳機就可以征服世界,(只有寡姐可以)優雅,真的優雅。


補充一點,如果屏幕變得不那麼重要,人們獲取信息的邏輯將再次改變,從PC時代的搜索邏輯,到移動時代的推薦邏輯,到AI時代的助理總結邏輯。GPT具備總結、推理、擴展能力,可以自行處理信息,對全信息源進行匯總。信息可以極大壓縮,拓寬人們獲取信息的帶寬,普通人也能打破信息繭房。技術平權之後,信息也有望進入平權時代(希望如此)。


笨蛋,問題是教育


如果說有一個行業關乎所有人,且受到GPT巨大影響的,那就是教育。這裡包括素質教育、應試教育以及高等教育,從小學到研究生的全階段教育都將受到GPT的衝擊。


打個比方,GPT當老師就像是一個美國常春藤名校優秀本科生(且懂中文)的水平,全科通才。相較於90%的老師更專業,100%的老師更博學。GPT可24小時隨叫隨到,一對一貼身服務,不帶情緒和不滿。無論你多笨,它都不會生氣。這樣的家教費用低於一個月的手機通信費,現有教育體系如何與之競爭?


其次是學生端,有了GPT,99%需要死記硬背的內容都不再浪費時間。正常人不會背圓周率後幾十位,只有記憶力超群的人才會。公司招聘也不會要求口算兩位數乘法,因為電腦輕鬆搞定。如此一來,我們在學校學的內容還剩多少需要花時間去學?


據報導,美國大學生中有89%使用GPT寫作業。在中國的GPT用戶中,用得順暢的很大比例是中小學生。美國甚至出現了檢測論文是否使用GPT的偵測工具,可見GPT對教育的影響之大。


教育系統的結構也將發生變化。只要一個人有興趣,便能獲得頂級專家的悉心教導,甚至在小學就可以自學高等數學、理論物理和微觀經濟學。那麼,現有的以同齡人智商和學習能力中位數為參考設定的教育體系,還有意義嗎?讓學生別把大量時間花在未來不會用到、現在也不感興趣的學科上,而是讓他們充分發揮自我激勵,在最具創造力的年紀在他們最喜歡的領域創造價值,不是更好嗎?


另外,教育理念也面臨挑戰。許多人接觸AI時最深的感觸是我們仍將GPT視為一個尋求正確答案的工具。我們習慣了背誦、習慣了尋找正確答案、習慣了避免獨立思考,習慣了不求甚解。


雖然GPT是一個全方位、互動式、可改進的學習機器人,但它不能替我們提出問題。當我們熱衷於找到最佳的prompt秘籍,試圖通過一個完美的提問立即掌握正確答案時,我們只是獲得了一個解答,甚至可能不是最優解,卻失去了掌握解答此類問題方法的機會。


吳恩達博士在課程中曾說:「我不推薦學習網上那種30個精選的GPT prompt,因為每個人的情況都不同,沒有一個prompt能完全符合你的要求。使用prompt的過程不可能一次成功,如果你一次就得到了一個完美的結果,反而應感到驚訝。」


最終,我們將回到教育的本質:是為了求知還是為了競爭?如果GPT是我們無論如何也無法企及的存在,且每個人都可以輕易具備GPT賦予的能力,競爭將不再取決於個人的努力與學習成效。那麼,是什麼支撐著我們繼續學習?這是所有學生、家長以及生活在AI時代的人都需要認真思考的問題。

關鍵字: