GPT-4正式發布:輕鬆考過GRE,還能看懂「梗」圖

銀柿財經 發佈 2024-03-25T00:56:14.557895+00:00

OpenAI介紹稱,GPT-4是一個大型多模態模型,雖然在許多現實場景中不如人類,但在各種專業和學術基準上表現出與人類相當的水平。

ChatGPT發布僅四個月後,北京時間3月15日,OpenAI宣布GPT-4正式發布。

OpenAI介紹稱,GPT-4是一個大型多模態模型(接受圖像和文本輸入,輸出文本輸出),雖然在許多現實場景中不如人類,但在各種專業和學術基準上表現出與人類相當的水平。GPT-4是OpenAI在擴大深度學習方面的最新里程碑。

根據OpenAI總裁和聯合創始人Greg Brockman的直播演示畫面,GPT-4的頁面相比ChatGPT功能更多,左側的「system」框可用於設定AI身份屬性,中間輸入框輸入問題,右側可根據提問者需求進行參數設置。

「我們花了6個月的時間使用我們的對抗性測試程序,以及在ChatGPT身上累積的經驗教訓來疊代調整GPT-4,從而在真實性、可操縱性和拒絕超出設定範圍方面取得了有史以來最好的結果。」OpenAI稱。

這種差異在GPT-4和GPT3.5模擬考試成績的比較中顯得更為直觀,如在一項模擬律師考試中,GPT-4的成績排名前10%左右,而GPT-3.5的分數在後10%左右;170分的GRE考試科目,GPT-4能以幾乎滿分的分數通過,比GPT-3.5高出十幾分。

不僅如此,GPT-4還解鎖了很多GPT-3.5做不到的事,如報稅、寫詩、寫代碼等。此外,GPT-4還有了質的飛躍,即能夠接受圖像作為輸入介質,並生成說明、分類和分析。如輸入一張食材圖問可以用這些食材做什麼,GPT-4能識別圖中原料並舉例可做成的食物;一秒識別手繪網站圖片,並根據要求實時生成網頁代碼,製作出幾乎與手繪版相同的網站。

除了普通圖片,gpt-4還能處理包括表格、考試題目截圖、論文截圖、漫畫等更複雜的圖像信息,如根據專業論文給出論文摘要和要點,讀懂梗圖中的槽點。

在測試的26種語言中,GPT-4已有24種語言優於GPT-3.5和其他大語言模型的英語語言性能,其中中文達到了80.1%的準確性,比GPT-3.5的英文準確性提升了10%。

由於功能更加強大,運行更加昂貴,GPT-4沒有開放免費測試權限,而需每月支付20美元成為會員。

中信證券預計,在GPT-4帶動下,未來大模型以及多模態模型的商業化應用將進一步加速,帶動行業景氣度持續向上。伴隨成本下降以及多模態的持續演進,GPT等大模型有望構築AIGC核心基石,推動AI商業化進程加速和市場天花板打開。

不過值得一提的是,OpenAI強調,GPT-4與早期的GPT模型具有相似的局限性,它仍然是基於2021年9月之前的數據訓練的,所以缺乏對現狀的有效理解,會大膽編造事實,甚至出現推理錯誤。因此,在使用時最好輔之以人工審查、附加上下文,並避免在高風險情境中使用。

關鍵字: