OpenAI創始人:ChatGPT推理能力將進一步提升

中國戰略新興產業 發佈 2024-02-28T15:06:12.254397+00:00

但ChatGPT-4目前的推理能力還沒有達到預期水平,如果能進一步擴大資料庫,保持目前的商業運轉模型,其推理能力將會得到進一步提升。

3月23日凌晨,英偉達創始人兼CEO黃仁勛與OpenAI聯合創始人兼首席科學家伊爾亞·蘇茨克維針對ChatGPT進行了深入探討。伊爾亞·蘇茨克維指出,和之前版本相比,ChatGPT-4最大的提升在於更強大的神經網絡功能,能通過邏輯推理對未來進行預測。但ChatGPT-4目前的推理能力還沒有達到預期水平,如果能進一步擴大資料庫,保持目前的商業運轉模型,其推理能力將會得到進一步提升。

黃仁勛認為,ChatGPT是AI界的「iPhone時刻」,但這一時刻的到來並非一蹴而就。

以下為中國電子報記者整理的本次對話內容精華:

黃仁勛:近期,ChatGPT的熱潮讓AI獲得了全世界的關注,OpenAI作為研發者備受行業關注。為什麼會決定聚焦AI深度學習領域?

伊爾亞·蘇茨克維:人工智慧通過不斷的深度學習,給世界帶來了巨大的改變。對於個人而言,主要體現在兩方面:

首先,關注AI深度學習的初心在於,人類對於各種各樣的問題都有一定的直覺性理解。人類是如何通過智力完成這樣的預判,以及人類意識、人類體驗的如何進行定義,使我非常感興趣。

其次,在2002年—2003年上大學期間,認為「學習」這項技能,只有人類才能完成,計算機無法做到。可當時突然冒出一個想法——如果讓計算機也能夠不斷學習,或許會為整個AI領域帶來改變。

我當時的專業正好是研究神經網絡學習。神經網絡是AI領域的一個非常重要的進步,人們一直在探索如何通過神經網絡去進行深度學習,如何讓神經網絡像人類的大腦一樣思考,以及如何將處理數據的能力反映到計算機的工作方式上。那時,我其實並不清楚研究這個領域的未來會怎樣,只是覺得長期來看很有前景。

黃仁勛:你曾說過,GPU將會影響接下來幾代人的生活,GPU可能會對深度學習的培訓帶來幫助。你是在何時意識到這一點的?

伊爾亞·蘇茨克維:我們在多倫多實驗室中,第一次嘗試使用了GPU來培訓深度學習,當時並不清楚如何使用GPU,以及如何讓GPU獲得真正的關注。但隨著我們獲得的數據集越來越多,我們也越來越清楚,這將會為傳統模型帶來的優勢。我們希望能夠加速數據處理的過程,培訓出過去科學家從來沒有培訓過的內容。GPU的使用,給我們帶來了一個轉變性的革命,讓我們能不斷地去培訓神經網絡,訓練神經網絡的圖像處理能力。

黃仁勛:ChatGPT和OpenAI是否已經打破了過去計算機編輯圖像的模式?

伊爾亞·蘇茨克維:我認為不是打破了計算機圖像的編輯,而是用另外一種處理方式。大部分人都是用傳統的思維模式去處理數據集,但我們的處理方式更先進,是「超越式」的。曾經,我們也認為這是一件艱難的事情,甚至覺得幾乎不可能完成,但如果我們能做好,就是讓人類生活有了一大進步。

黃仁勛:擔任Open AI的首席科學家,你認為最重要的工作是什麼?我覺得Open AI在不同的時間點,關注焦點並不相同。我認為ChatGPT是「AI界的iPhone時刻」,你是如何實現這樣的跨時代轉變的?

伊爾亞·蘇茨克維:最開始,我們也不太清楚如何開展整個項目,而且,我們現在所得出的結論,和當時使用的邏輯完全不同。無法想像現在的用戶已經有這麼好用的ChatGPT工具,來幫助大家創造出非常好的藝術效果和文本效果。但在2015年、2016年時,我們還不敢想像能達到當下的程度。

在當時,我有兩大想法:一是,想讓機器具備一種不受監督的學習能力。雖然,現在認為這是理所當然的,可以用自然語言模型培訓所有內容。但在2016年,不受監督的學習能力仍舊是沒有被解決的問題,也沒有任何科學家有過相關的經驗和研究。我當時認為「數據壓縮」是技術上的瓶頸。但實際上ChatGPT確實壓縮了我們的培訓數據集。最後,我們還是找到了數學模型,通過不斷培訓來壓縮我們的數據。

二是,希望通過培訓神經網絡來預測下一個字符。我認為,下一個神經元的單位會和我們的整個視覺神經的網絡密切相關,這和我們驗證的方法是一致的。再次重新證明了,下一個字符的預測、下一個數據的預測能夠幫助我們去發掘現有數據的邏輯,這就是ChatGPT培訓的邏輯。關鍵在於,培訓一些神經網絡去預測下一個字符,是一個值得努力的目標。

黃仁勛:擴大數據規模能夠提高AI的表現能力,更多的數據、更大的數據集能夠幫助生成式AI獲得更好的結果。你覺得GPT-1、GPT-2、GPT-3的演變過程,是否符合這樣的「摩爾定律」?

伊爾亞·蘇茨克維:OpenAI的目標之一,是解決擴大數據集的問題。剛開始面臨的問題,是如何提升數據的高精準度。因此,我們在做Open AI項目時,通過讓它做一些策略性的遊戲,來提升精準度,比如,競爭性的體育遊戲,訓練它必須足夠快、足夠聰明,還要和其它隊競賽。作為一個AI模型,它需要不斷重複個基於人類反饋的強化學習過程。

我們的工作原理,就是通過不斷培訓神經網絡體系,讓神經網絡去預測下一個單詞。預測的單詞和過去的單詞之間,能夠達成一定的邏輯上的一致。從神經網絡來看,它更像是根據方方面面來得出一個結論。但我們的模型還沒有達到這樣的效果。人類的反饋很重要,越多的反饋能使AI更可靠。

黃仁勛:你可以讓AI做一些事情,但是你能不能讓AI不做一些事情?如何讓AI知道自己的界限在哪裡?

伊爾亞·蘇茨克維:可以實現。未來,第二階段的培訓序列,就是和AI、神經網絡去進行交流,我們對AI訓練得越多,AI的精準度越高,就會越來越符合我們的意圖。我們不斷地提高AI的忠誠度和準確度,它就會變得越來越可靠、越來越精準,而且越來越符合人類社會的邏輯。

黃仁勛:相比較於以前的版本,GPT-4有怎樣的升級?未來在哪些方面、哪些領域有更多的升級?

伊爾亞·蘇茨克維:GPT-4基於ChatGPT的性能,做了很多改善。對GPT-4的訓練大概是6~8個月之前開始,GPT-4和之前GPT版本最重要的區別,是GPT-4有更強大的神經網絡預測功能,能夠更精確的去預測下一個單詞是什麼,意味著能夠對人們說的話有更精準的理解。

這與人們此前常說的直覺有很大不同,GPT-4採用的是推理能力。比如,在一篇推理小說中,小說中有各種不同的人物和情節,有密室、有謎團,人們在讀推理小說的過程中,完全不清楚接下來會發生什麼。但是能通過小說中不同的人物和情節,來預測結局。GPT-4也是如此,能夠像推理小說一樣預測結果。

黃仁勛:語言模型是如何學習到推理和邏輯的?GPT-4現在有哪些缺陷,在接下來的版本中將進一步完善?

伊爾亞·蘇茨克維:想清楚定義邏輯和推理並不容易,但是未來可通過將邏輯和推理定義的更精準,來獲得更確切的答案。

神經網絡是有一些缺陷,用神經網絡去打破之前固有的思維模式,那麼就需要考慮這個神經網絡能夠走多遠的問題

神經網絡依舊面料一些挑戰,比如,讓神經網絡去打破固有的思維模式,但這也就意味著人們要思考神經網絡到底能走多遠,也就是神經網絡到底有多大潛力。目前GPT-4的推理能力確實還沒有達到預期的水平,未來希望GPT-4的推理和邏輯能夠達到更高的水平。但未來如果能更進一步的擴大資料庫,保持過去的商業運轉模型,未來推理的能力會進一步提高,對此也很有信心。

黃仁勛:ChatGPT是否有一種自然屬性,能夠不斷地去理解新內容?

伊爾亞·蘇茨克維:是的,神經網絡確實有這些能力,但是有時候也並不準確,這也是神經網絡接下來面臨的最大挑戰。在很多情況下,神經網絡會出現很多奇怪的錯誤,甚至出一些人類根本不會犯的錯誤。針對這些「不可靠性」,需要進一步針對神經網絡來進行研究,從而未來能夠給人們一個更精準的結果,甚至能夠糾正一些錯誤,讓神經網絡變得更可靠。

現在GPT-4的模型已經被公開發布了,它其實沒有追蹤數據模型的能力,它的能力是基於文本去預測下一個單詞,根據數據調節來得出結果,所以是有局限性的。有人認為,可以讓GPT-4去找出某些數據的來源,然後會對數據來源做更深入地調查,來不斷提升能力。

總體而言,儘管GPT-4並不支持內部的數據收集,但它肯定會在持續的數據挖掘之中變得更加精準。GPT-4甚至已經能夠從圖片中進行學習,並且根據圖片和內容的輸入進行反饋。

黃仁勛:多模態學習如何能夠加深GPT-4對於的理解能力?為什麼多模態學習定義了GPT和OpenAI?

伊爾亞·蘇茨克維:多模態學習可以從兩個維度來看:

第一,多模態在視覺和圖像識別上特別有幫助。因為整個世界是由圖片形成的,人們和其他動物都是視覺動物,人腦1/3的灰質都是用來處理圖像的,GPT-4也能夠去理解這些圖像。

第二,隨著人們對於世界的認知不斷加深,通過圖片或文字對世界的理解是一樣的。對於一個人而言,一個人可能一生之中只會說10億個詞。這通過計算人一生有多少時間,以及一秒能處理多少詞,再減去睡覺的時間,就能算出一生處理了多少單詞。人和神經網絡的不同之處在於,人如果10億個詞彙無法理解,可以用其他萬億級的詞彙來理解。對於AI神經網絡而言,可以通過文本,將人們對於世界的知識和信息慢慢滲透給AI的神經網絡。外加視覺圖片等其他元素,神經網絡可以更精準地進行學習。

黃仁勛:對於文本和圖片方面的深度學習,如果我們想要人工智慧去理解其背後的邏輯,甚至是理解這個世界的基本原理——比如我們人類日常的表達方式,一個詞其實有兩種含義,聲音的高低變化,其實都代表著兩種不同的語氣。說話的語言和語調的變化,對AI去理解文本是否有一定幫助呢?

伊爾亞·蘇茨克維:是的,這類場景非常重要。對於語音和語調,包括聲音的大小和語氣,對於AI而言都是非常重要的信息來源,提供了領域中重要的解讀信息的方式。

黃仁勛:請總結一下AI正處於怎樣的發展階段?以及在不遠的將來,生成式AI能夠達到怎樣的高度?大語言模型的未來是什麼?

伊爾亞·蘇茨克維:預測未來比較困難的。目前能做的,是把現有的事情繼續做下去,讓人們看到GPT更驚艷的系統版。未來,希望通過提高數據的可靠度,讓系統更進一步獲得人們的信任。目前,生成式AI在解讀這個文本過程中,還無法完全驗證文本的真實性以及信息來源。對於未來的展望,是讓神經網絡必須要確認所有數據來源的真實性,準確地服務人們每一步的需求。

黃仁勛:在第一次使用ChatGPT-4時,有哪些性能讓你覺得很驚艷和震驚?

伊爾亞·蘇茨克維:我認為AI本身存在的意義,是可以給人類帶來幫助。之前的ChatGPT版本,神經網絡只會回答問題,甚至有時候會誤解問題,在回答方面很不理想。但是GPT-4基本沒有誤解問題的情況,甚至能夠去處理更複雜的任務。簡而言之,它的可靠性更好。例如,GPT-4能夠寫詩,可以寫押頭韻的詩,也能寫押尾韻的詩。甚至它能去理解笑話,能明白笑話背後的意思。

本網站轉載的所有的文章、圖片、音頻視頻文件等資料的版權歸版權所有人所有。如因無法聯繫到作者侵犯到您的權益,請與本網站聯繫,我們將採取適當措施。

關鍵字: