為何ChatGPT有時「一本正經地胡說八道」

彭敏武漢大學人工智慧系系主任、教授

李祖超武漢大學副研究員

□ 長江日報記者陳靜茹

最近，應用軟體ChatGPT在多國社交媒體「狂飆」。發布兩個月後，月活人數成功過億，成為史上用戶增速最快的消費者應用。2月20日，清華大學人工智慧國際治理研究院副院長、公共管理學院教授梁正，武漢大學人工智慧系系主任、教授彭敏和武漢大學副研究員李祖超做客長江日報《面談》，暢聊風暴眼中的ChatGPT。網友在線上同三位教授一起熱議ChatGPT，各平台觀看視頻網友達70萬。

ChatGPT能做什麼？有沒有與它聊過天？

它的回答質量依賴於用戶問題的清晰程度，問題定義越清晰，ChatGPT回答得越具體越有根據。

梁正：作為科研工作者，我最關心的是ChatGPT可以給我們提供什麼幫助。因為我是做人工智慧的治理研究，也就是人工智慧會帶來什麼樣的風險、什麼樣的問題，所以我首先問他「你會對人類產生什麼樣的影響？應該怎麼去應對？」它的回答很官方，也很全面。

彭敏：首先ChatGPT的編寫代碼能力讓我印象深刻。此外，我的研究領域是人工智慧的對話，所以在這方面比較關注，我覺得它在多意圖多輪的對話中，表現非常好。

李祖超：在和ChatGPT聊天的過程中，我發現它的回答質量依賴於用戶問題的清晰程度，問題定義越清晰，ChatGPT回答得越具體越有根據。

ChatGPT像是一個十四五歲的孩子嗎？

實際上，只要經過稍微調教，ChatGPT的回答風格則可以發生巨大的變化，遠不止十四五歲孩子的表達能力。從掌握知識的深度來說，ChatGPT應該相當於一個某專業領域的初級到中級水平。

梁正：在一般生活對話的場景方面，我認為ChatGPT已經達到了十四五歲孩子的能力，甚至在有的領域它可以達到大學本科畢業生這樣的水平，包括醫師資格考試、大學入學考試等都可以完成。它不是只在一個領域去發揮作用，它在一些專用領域的表現更好。

彭敏：我們不能籠統地來講ChatGPT的能力。它在很多領域確實是做得非常卓越，背後對應的是它所支撐的技術、數據或者是知識。但在某些領域，它又非常匱乏，不具備一定的智能。

李祖超：將ChatGPT對照十四五歲的孩子我認為是不完全確切的。這需要從幾個層面來講。從語言表達能力來說，ChatGPT看上去像一個十四五歲的孩子講的話。這主要是大眾在試用ChatGPT時都採用閒聊的方式，並且ChatGPT訓練的目的是作為助手。但是實際上，只要經過稍微調教，ChatGPT的回答風格則可以發生巨大的變化，遠不止十四五歲孩子的表達能力。從掌握知識的廣度來說，ChatGPT可以同時記憶天文、地理、物理、化學、計算機等等行業知識，而人類一般無法掌握這麼多領域的知識。從掌握知識的深度來說，ChatGPT應該相當於一個某專業領域的初級到中級水平。ChatGPT本質上是在模擬人的對話過程，它的模擬能力是利用一個神經網絡大模型，從大規模的訓練語料學習出來的，其實現基於四個要素：覆蓋廣泛的訓練語料、算力、一些算法技巧和人工調優技巧。ChatGPT在知識方面的上限取決於訓練它的語料庫。如果語料庫裡面沒有的知識，它是無法回答的，同時如果訓練語料中的知識本身就是錯的，它也會回答錯誤。此外，ChatGPT在計算方面的能力是弱於十四五歲的孩子，約等於八九歲孩子，這也是未來ChatGPT進一步進化的方向之一。

可以調教ChatGPT嗎？

它的回答都會按照你的風格進行生成。或者嚴厲的老師，或者老闆等等角色。

ChatGPT真的能取代人類的某一些職業嗎？

李祖超：我們是可以對ChatGPT進行調教的。你的性格是什麼樣的，你講什麼樣的話，比如你的表現是非常軟萌的，它的回答都會按照你的風格進行生成。或者嚴厲的老師，或者老闆等等角色。

ChatGPT真的能取代人類的某一些職業嗎？

這種職業替代形式，人工智慧發展過程中一直存在。能力更強更通用的ChatGPT將進一步加快職業形式的變化過程。

梁正：我個人的觀點，ChatGPT在給我們提供幫助上，它的潛力是巨大的。這個「替代」只是把人類不願意做的，或者人類覺得比較辛苦和繁複的工作去替代掉，但我不認為它可以把人類有創意的、創造性的這部分工作替代掉，包括對我們做科學研究做學術研究也是一樣。

彭敏：什麼工作是不能被替代的？具有創意的，或者說在我們的基礎搜索或者是生成之後，還需要去進行相應的人類智慧去給它一些指導的工作。此外，ChatGPT在某些領域提高了生產力並不代表剝奪了大家的飯碗，這一產品研發的初衷正是為了替人去做一些重複工作，讓人可以有時間和精力去做自己更擅長、更適合人類做的創新性的工作，更好地享受生活。

李祖超：這種職業替代形式，人工智慧發展過程中一直存在。如2015年，美聯社使用機器人寫作，年報導量超過15億條，領域涉及金融、房地產、體育等領域。目前，空中巴士公司使用人工智慧而不是人類工程師來設計飛機，製藥公司葛蘭素使用人工智慧進行藥物開發，工作效率和任務完成質量都比人類工程師更好。人工智慧甚至可以拍電影。2019年上演的科幻短片《走神》，就是一部劇本、導演、表演、配樂等一系列製作程序，大部分由人工智慧所完成的影片，僅用了2天時間。能力更強更通用的ChatGPT將進一步加快職業形式的變化過程。

這樣的AI意味著什麼？

我們需要去做的是：每個人都應該去使用、去探索怎麼去跟它更好地合作，利用它優越的一面。它的影響不僅僅體現在產業上，還體現在社會、教育、人際交往的變化上。能引起整個分工關係和人際關係的深刻變化。

梁正：從信息的處理、內容的生成上，ChatGPT的效率和質量都得到了一個飛躍，這是特別的、積極的一方面。所以它其實會對我們未來提供更好的選擇。但我們也不要去神話它，在很多問題上，比如說推理的能力，比如說一些常識，它還是不具備無中生有的能力。ChatGPT在效率提升這一方面是非常明顯的，特別是在內容創作上。在ChatGPT大大提高效率以後，我們需要去做的是：每個人都應該去使用、去探索怎麼去跟它更好地合作，利用它優越的一面。然後結合自己的優勢，把你原來所不擅長的一部分工作交給它去做。它能引起整個分工關係和人際關係的深刻變化。ChatGPT的影響不僅僅體現在產業上，還體現在社會、教育、人際交往的變化上。

彭敏：ChatGPT在效率提高這件事上，毋庸置疑。它並不僅僅是提高了信息檢索的能力，更重要的是在裝備製造、集成電路、大型工程設計等等方面，都可以藉助於它的能力提高效率。在將來可能會出現類似於工業5.0，推動整個社會和人類的進步。這也是為什麼現在大家都會對它有期待。另外一個角度，我們要看到會出現很多問題。比如，大家用它去寫作帶來的著作權問題，還有信息的真偽問題等。

李祖超：人類歷史的發展總體上來看就是生產效率的不斷提高的過程。人工智慧是當下資訊時代的蒸汽機，實用性很高。用戶使用ChatGPT獲取信息的效率不亞於現在已經非常成熟的搜尋引擎。它基於用戶需求為創造提供靈感，提高了效率，這將對所有的人類創作領域產生重要的影響。也許未來，人類創作中發揮的作用是作為鑑賞家對人工智慧創作進行篩選以及微調。但與此同時，ChatGPT在提高創作效率的同時，使用的大量來源廣泛的知識資源所涉及的智慧財產權如何界定？其行為表現及後果與相關自然人法人之間的法律責任如何確定？這些問題都會成為值得關注的焦點。

例如，如果醫院門診的大多數功能，像掛號候診、檢查檢驗、病情診斷、醫囑處方等都可以由人工智慧承擔，那主診醫生與人工智慧體的職能劃分和權責關係如何界定？特別是人工智慧體如果達到診斷差錯率顯著地低於主診醫生誤診率的水平，那處方權應歸誰？在更多的行業都將發生類似現象。對此，都須有新的規則來維護新的秩序。

ChatGPT會成為作業系統平台的新雛形嗎？

這是真正可能引爆整個產業智能化轉型非常重要的方向。

梁正：在產業發展當中，ChatGPT是具有類似於作業系統，或者是通用界面、主導設計的這樣一個里程碑式的進步產品，可能未來一個非常大的產業的發展空間被打開了。其實從我們研究產業創新的角度來看，一個行業它從技術的突破到真正的商業化，然後到規模化和普及化，它確實是要經歷這樣一個過程。現在，ChatGPT給大家提供了一個模板，可以在這個基礎上去考慮怎麼去為各行各業賦能。所以，這是真正可能引爆整個產業智能化轉型非常重要的方向。

彭敏：ChatGPT比以往深度學習更有優勢的是面對超大規模數據，擺脫了做大量語料標註的工作，是一種無監督學習。此外，它還擁有強化學習、指令微調、思維鏈等先進技術。從技術的角度，ChatGPT對於整個人工智慧是具有里程碑意義的。

李祖超：對於ChatGPT是否能成為作業系統的新雛形這個問題，我的答案是積極的。作業系統的作用根據用戶指令實現資源的分配以及計算的調度，那麼ChatGPT發揮的作用是充當新的人機接口，更智能地實現用戶指令的解譯，減少用戶的操作。從更長遠來看，通過賦予ChatGPT管理系統資源如硬碟、CPU、外設等能力，將ChatGPT直接作為一種作業系統，用戶只需要輸入自然語言便可以達到操作的目標，應該是新一代作業系統的雛形。

ChatGPT有時「一本正經地胡說八道」的原因是什麼？

它的能力遠遠沒有到擬人的程度。「一本正經地胡說八道」可能也是它創造性回答的部分。

梁正：ChatGPT可以無中生有，所以叫做「生成式」。背後有大量的人類的知識以及我們對它的引導和獎勵的策略。人類告訴它，什麼是對錯。它在專業領域講得頭頭是道，如果聊個人的喜好情緒等，它的能力遠遠沒有到擬人的程度。「一本正經地胡說八道」可能也是它創造性回答的部分。ChatGPT「一本正經地胡說八道」，那麼誰來判斷？只有人才能判斷。當然有一些工作不要求創造性，它可以做得很好。那麼這種條件下人去做什麼？人就是要去做創新性的、創造性的工作，包括藝術、創意這樣真正叫無中生有，也就是客觀世界裡沒有，只存在於人的這個腦海當中的東西。起碼到現在，不能夠說ChatGPT能替代人。所以這方面呢，我覺得它其實反倒會引起我們的反思，我們的優勢到底是在哪裡。也可以反過來去推動我們在這方面的研究，就是人類的這個創造性思維到底是從哪來的？是邏輯的推理、是現實的觀察，還有可能是個人的頓悟，這樣的一些思維的湧現究竟是如何發生的？所以，我覺得可能將來它反倒會打開這個空間，讓我們去研究人的思維和創意。

彭敏：「有沒有胡說八道」主要是看它的知識點和計算能力有沒有到這個層面。為什麼知道是胡說八道的話他還會講？因為他不知道是錯的，這一模型缺乏可解釋性和驗證性。這也是在這10年深度學習出現以後，許多研究者一直在努力做的工作。

李祖超：ChatGPT本質上依託於一個參數量巨大的神經網絡模型，其訓練過程是基於網上現有的語料進行的，而這些訓練數據本身良莠不齊，並不全都是優質文本，因此有可能出現事實性錯誤問題。此外，ChatGPT給出的答案只是基於其理解生成的最佳結果，然而對於某些訓練的知識盲區問題，且可能根據字面意思進行推理，從而出現了「一本正經胡說八道」的現象。此外，自然語言理解困難之一是語境問題，由於缺乏上下文可能導致的對問題本身的不理解等，也會導致ChatGPT給出錯誤的結果。對於常識偏差的問題，這是由於ChatGPT是基於對大量文本進行預訓練，而常識（比如太陽比月亮大）通常不會直接包括在這些文本中，因此缺乏對常識的理解。

多國高校出台ChatGPT禁令，專家們怎麼看？

從長期來看不能簡單地「一禁了之」，更重要的是探討怎麼去誠信、客觀、正面地使用它。

梁正：對於科學研究也好，對於內容創作也好，我們要承認他是能夠給我們帶來很大的這種幫助的。那麼，作為一個好的工具，你為什麼不去使用它呢？明明他可以給你很大的這方面的一些便利，包括在文獻、資料、信息的搜集和整理上。我個人的觀點目前高校對ChatGPT的禁令主要是基於公平性的考慮，從長期來看不能簡單地「一禁了之」，更重要的是探討怎麼去誠信、客觀、正面地使用它。

彭敏：我們要用一種開放的心態去接受新事物，而且要把它用到我們能用的極致。當然，我們不能過度地去信任這個工具，還得給它配套必要的措施。

ChatGPT給我們帶來震撼的同時還帶來了哪些思考？

隨著人工智慧不斷滲透到人類的生活中，相應的道德和法律規範也應該隨之健全。

對中國未來的人工智慧領域有何展望？

李祖超：在啟發層面，以ChatGPT為代表的人工智慧技術的發展確實是邁出了很大的一步。在未來，這樣的技術還有著無限的發展潛力，我們的日常生活也會隨之而慢慢發生改變。隨著人工智慧的發展，人工智慧可以代替人類進行各種作業，我們未來在生活中應該更好地藉助人工智慧的力量來進行發展，而不是過度依賴人工智慧的能力而喪失我們原有的能力。同時，人類作為人工智慧創意的來源，持續不斷的新的創意養料才能幫助人工智慧疊代，因此未來的高價值職業都會向高創意方向發展。最後，隨著人工智慧不斷滲透到人類的生活中，相應的道德和法律規範也應該隨之健全。

對中國未來的人工智慧領域有何展望？

未來，我們應該堅持在產業、人才、創新創業環境等持續投入，不僅僅要做突破，更要探討我們在數位化轉型中的潛力和活力。

梁正：近年來，我國在人工智慧領域基礎研究、技術平台、行業應用等多方面都有布局。人工智慧領域的創新創業活躍度很高。未來，我們應該堅持長期主義，產業、人才、創新創業環境等持續投入，不僅僅要做突破，更要探討我們在數位化轉型中的潛力和活力。

彭敏：我國人工智慧領域應該從全局角度入手進行規劃，在通用大模型基礎上再落地到下游垂直領域場景。希望未來國家關於人工智慧的規劃能有所調整，做全局性部署。

李祖超：中國未來人工智慧領域的發展目標之一是需要追平代差。此外，由於通用人工智慧技術不僅僅包含語言智能，也包含語音智能和視覺智能等，因此下一代ChatGPT技術應當是多模態的，未來人工智慧領域也將著眼於多模態ChatGPT的研發當中。

來源：長江日報