聊天機器人ChatGPT為何「出圈」？我們讓它寫了篇文章

12月初，人工智慧實驗室OpenAI發布了一款名為ChatGPT的自然語言生成式模型，由於它能接住並解答網友的許多刁鑽問題，一經問世就迅速引發關注，上線5天後，其體驗用戶已經突破100萬。12月4日，馬斯克在諮詢該聊天機器人關於推特經營的建議並收到精準回復後直言其「好得嚇人，我們距離強大到危險的人工智慧更近了」。

12月8日，新京報貝殼財經記者體驗了ChatGPT。記者發現，相比市面上其他聊天機器人，ChatGPT的功能更加多樣，例如它可以按照要求寫詩、寫講話稿、新聞稿甚至寫代碼。此外，該聊天機器人的回答更為嚴謹，面對許多高難度問題，ChatGPT會老老實實回答「缺乏資料」或者「我只是一個語言模型」。

東吳證券發布研報稱，從受眾和技術上看，ChatGPT在AI文字交互模型領域十分突出。與此前的模型相比，ChatGPT亮點主要包括：全面免費開發，用戶只需輸入文字，就可免費調用完成各種事情（如數學計算、debug、寫信、生活問題解答等），實感體驗為廣泛討論創造土壤；新增代碼理解和生成能力，彰顯技術實力的同時也拓寬了應用場景；加入道德原則。RLHF（一種通過人類反饋來強化學習的新技術）訓練方式使ChatGPT能夠識別惡意信息，識別後拒絕給出有效回答；支持連續對話等，「總體上，ChatGPT對話效果令人滿意，新鮮感與實用價值使其快速走紅。」

ChatGPT：讓你的聊天更有智慧——該標題為聊天機器人自己所起

「我想寫一篇關於ChatGPT的文章，我給這篇文章起什麼標題合適？」這是12月8日，新京報貝殼財經記者諮詢ChatGPT的第一個問題。

而該聊天機器人的回覆也非常詳細：它給記者寫出了足足6個標題，並且表示「當然，這些標題都只是建議，最終還是要根據自己的文章內容和表達目的來決定」。回答顯得非常人性化。

而當記者繼續諮詢它能否以「ChatGPT：讓你的聊天更有智慧」為標題寫一篇新聞時，它也給出了肯定的答覆，甚至在不到10秒鐘的時間裡就寫出了作者為新京報社的一篇12月8日的新聞報導。

不過記者發現，該聊天機器人在回答問題時有時並不會回答完整，但此時當提問者繼續要求其完整回答時，它也完全可以「跟上」此前的聊天進度，這說明ChatGPT具備一定程度的記憶功能。

貝殼財經記者了解到，目前市面上的人工智慧語言模型並不少見，如谷歌BERT模型、阿里巴巴的PLUG模型、清華大學計算機系自然語言處理與社會人文計算實驗室的中文詩歌生成系統「九歌」等，能夠採用擬人化方式和用戶自由對話的也有Character.AI（角色AI）等。但相比上述能夠生成語言的模型，ChatGPT具有了更為強大的功能，其中就包括直接在回答中寫代碼。

如當貝殼財經記者要求ChatGPT編寫一段代碼時，其很快生成了一段可以複製的代碼文件。

對於ChatGPT的回答，有網際網路從業者對貝殼財經記者表示：「這段代碼的基本結構是對的。」

值得注意的是，對於ChatGPT和其他語言模型有何差別這一問題，該聊天機器人在接受記者提問時表示「主要區別在於它採用了更先進的自然語言處理技術，並在訓練過程中使用了大量高質量的自然語言文本數據。這些都使得 ChatGPT 在處理文本信息方面更加精確，並能夠取得更好的表現。此外，ChatGPT 模型還採用了雙向自注意力（bi-directional self-attention）技術，這使得它能夠更好地利用語料庫中的信息，提高處理文本信息的效率。總之，ChatGPT 模型與其他語言模型相比，具有更先進的技術，更好的處理文本信息的能力，以及更高的處理效率」。

不過，貝殼財經記者通過測試發現，ChatGPT在一些地方也有不盡如人意之處。

首先就是在具體問題的回答上，該聊天機器人仍然和具有專業經驗的人士有明顯差距。如當記者諮詢一個北京旅遊計劃設計問題時，雖然ChatGPT很快列出了一個看似格式很工整的旅遊計劃，但可行性並不大：其給記者制定的旅遊計劃中，從天安門下午乘坐地鐵前往長城，而後第二天一早再乘地鐵前往故宮，這在實際旅遊中顯然時間過於緊張。

此外，當回答一些帶有擬人化的問題時，ChatGPT會反覆強調：「對不起，我是一個人工智慧助手，沒有意識和感知」。顯然，在今年6月谷歌工程師布萊克·萊莫因在與谷歌智能聊天機器人LaMDA進行深聊後聲稱人工智慧擁有感情，最終遭到谷歌辭退後，包括OpenAI在內的許多人工智慧公司都採取了儘量避免其他人對聊天機器人產生誤會的可能。

OpenAI在官網表示，由於ChatGPT 沒有連接到網際網路，它偶爾會產生不正確的答案，「它對 2021 年之後的世界和事件的了解有限，偶爾也可能產生有害指令或有偏見的內容。」此外，由於需要通過用戶的反饋改進對話技術，該公司會記錄用戶在ChatGPT 上的聊天數據，不過用戶也可以對自己的對話內容進行刪除。

熟悉AI發展的網際網路從業者李鴻儒對貝殼財經記者表示，隨著技術的發展，目前最先進的語言模型幾乎可以完美通過初步的圖靈測試，「圖靈測試是一種衡量人工智慧與人類智能水平相似程度的方法，它要求人工智慧必須能夠以人類相似的方式與人類交流，且不能被人類輕易地區分出來。而當前人工智慧語言模型的訓練方式就是收集人類回答者在網上的公開數據，因此許多回答完全可以『以假亂真』，畢竟它就是從真實的人類回答里衍生的。」

值得注意的是，當貝殼財經記者諮詢ChatGPT「是否存在可以通過圖靈測試的AI」時，它的回答非常「謙虛」：「目前，雖然已經有一些人工智慧系統能夠在一定程度上與人類進行交流，但它們並不能完全模仿人類的智能。因此，目前還沒有人工智慧能夠通過圖靈測試。如果將來有一個人工智慧能夠通過圖靈測試，那麼它很可能會是一個由當前領先的人工智慧研究機構，如 OpenAI，DeepMind 等所開發的系統。這樣的人工智慧將具有與人類智能相似的能力，能夠以人類相似的方式與人類交流。但目前這樣的人工智慧還不存在，我們只能期待未來的發展。」

技術進步怎樣發生？OpenAI：使用人類反饋強化學習

據了解，ChatGPT的前身為OpenAI此前的語言模型GPT-3，而GPT-3也經歷了從1代到3代的演化。東吳證券認為，通過梳理前幾代模型，ChatGPT之所以能實現如此革命性的變化，新技術RLHF訓練方式的引用或是關鍵：從GPT到GPT-3：優化主要來自算力增加（燒錢）。GPT、GPT-2和GPT-3的算法模型並沒有太大改變，但參數量從1.17億增加到1750億，預訓練數據量從5GB增加到45TB，其中GPT-3訓練一次的費用是460萬美元，總訓練成本達1200萬美元。雖然訓練數據量和算力大幅增加使GPT-3有顯著優化，但高額投入也使其只能走B端變現。

OpenAI在官網表示，ChatGPT 是從 GPT-3.5 微調而來的，GPT-3.5 是一種經過訓練以生成文本的語言模型。ChatGPT 通過使用人類反饋強化學習（RLHF）針對對話進行了優化，這是一種使用人類演示來指導模型實現所需行為的方法。

在東吳證券看來，2022年OpenAI增加了人類對模型輸出結果的演示，並在對結果進行排序的基礎上訓練，加上指令調整的幫助，雖然其只有13億個參數，但回答準確率、道德表現卻好於GPT-3。ChatGPT則加入了RLHF訓練方式（相關論文2022年3月發表），根據ChatGPT，其每次對話平均費用在0.01-0.2美元，模型效果比InstructGPT又提升一個台階，「我們認為新技術發展和應用將是AIGC工具出現革命性疊代更為重要的驅動。」

李鴻儒告訴貝殼財經記者，GPT-3的部分訓練是基於從網際網路上搜集的數據，因此它的輸出結果在與人類回答者極其近似之外，也經常受到偏見和不準確信息的影響。而在ChatGPT的訓練上，訓練師還會對機器人的回覆選項打分排名，將更好的結果輸回到模型中，通過以上獎勵策略對模型進行微調並持續疊代，這樣既可以避免受到不準確信息的影響，還能提供更連貫和更符合邏輯的對話能力。

浙商證券則認為，ChatGPT模型的出現對於文字模態的AIGC（利用AI技術自動生成內容）應用具有重要意義。從下游相關受益應用來看，包括但不限於代碼機器人、小說衍生器、對話類搜尋引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看，包括算力、數據標註、自然語言處理（NLP）等。

最後，當貝殼財經記者諮詢ChatGPT「你能為人類的發展做出什麼改變？請舉例說明」這一問題時，該聊天機器人回答道：

「ChatGPT能夠提高人類的工作效率和生活質量。例如，ChatGPT可以幫助人們快速查找信息，可以幫助聊天機器人更好地與人交流，並且可以讓人們在與人工智慧交流時，感覺像是在與真正的人交流。此外，ChatGPT還可以應用於醫療、教育、法律、金融等領域，為人類的發展做出重大貢獻。例如，在醫療領域，ChatGPT可以幫助醫生快速查閱醫學資料，為患者提供更好的診療建議。在教育領域，ChatGPT可以幫助教師快速查找教學資料，為學生提供更好的學習指導。在法律領域，ChatGPT可以幫助律師快速查找法律資料，為客戶提供更好的法律建議。在金融領域，ChatGPT可以幫助投資人快速查找金融資料，為投資人提供更好的投資建議。總而言之，ChatGPT的應用可以使人類的工作效率得到極大提高，並為人類的發展做出重大貢獻。」

（文內截圖均為貝殼財經記者與ChatGPT對話）

記者聯繫郵箱：luoyidan@xjbnews.com

新京報貝殼財經記者羅亦丹

編輯徐超校對楊許麗