或於今年發布!新一代語言模型GPT-4到底有多強大?

每日經濟新聞 發佈 2024-04-30T17:27:21.610278+00:00

每經記者:李孟林 每經編輯:蘭素英ChatGPT是最近科技界最火爆的話題,帶動了全球新一輪的AI競賽熱潮。支撐這個AI對話工具的GPT-3是世界上最大的大語言模型之一,其驚人的表現也讓外界猜測:下一代的GPT-4到底有多強大?

每經記者:李孟林 每經編輯:蘭素英

ChatGPT是最近科技界最火爆的話題,帶動了全球新一輪的AI競賽熱潮。支撐這個AI對話工具的GPT-3是世界上最大的大語言模型之一,其驚人的表現也讓外界猜測:下一代的GPT-4到底有多強大?

ChatGPT的開發者OpenAI在GPT-4的研發上已經取得了不少進展,但具體情況外界仍然不得而知。各種傳聞甚囂塵上,有說其訓練參數高達100萬億的,有說微軟已經把GPT-4納入最新版本的必應中的……關於GPT-4,以下是目前我們能知道的幾點:

或於2023年發布

儘管官方尚未正式宣布,但是多家外媒紛紛報導,GPT-4可能將於2023年某個時間點推出。實際上,據《紐約時報》報導,微軟自家搜尋引擎必應所增加的聊天功能很有可能就是由GPT-4驅動的。目前,用戶需要加入申請等待名單才能體驗到有ChatGPT功能的必應。

由BuzzFeed前主編和彭博媒體集團前CEO共同創立的媒體Semafor也在2月初報導稱,微軟計劃在未來幾周內將GPT-4整合到必應中。Semafor援引知情人士稱,新版本GPT-4最大的特點就是速度更快,不會像現在這樣經常卡幾分鐘才出結果,且給出的回覆也會更加細節,更像「人」。

《福布斯》雜誌推測,假如最終證實新必應不是由GPT-4驅動的,那麼我們的等待時間就要更長一點。就GPT-3來看,一開始主要開放給部分合作夥伴、付費用戶和學術機構,然後才在2022年底開放給公眾。GPT-4也有可能採取這種逐步公開的節奏。

參數不會暴漲,提升效率才是重點

GPT-3的訓練參數有1750億個,而有人猜測GPT-4的參數量將有指數級暴漲,達到100萬億個。這一謠傳已經被OpenAI創始人Sam Altman本人斥為「完全的胡說八道」。Altman已經表示,下一代GPT的訓練參數不會比GPT-3高出太多,因為研發的重點將放在如何提升利用現有數據的能力上。

有專家指出,同為大語言模型的Megatron 3所用的參數比GPT-3多得多,但測試表現並沒有超過後者,說明在AI的領域並不是數據越多越好。此外,提升算法效率有助於降低GPT-4的運行成本,這對於想把AI融入搜尋引擎的微軟而言是一個重要考慮因素。

寫代碼或更強

ChatGPT及其背後的GPT-3寫代碼的能力已經讓人驚艷,下一代GPT的編碼能力很有可能更加強大。

今年早些時候,媒體報導稱OpenAI正在積極招聘程式設計師,要求應聘者能用日常語言來描述代碼的功能。不少人據此推測,未來的GPT在寫代碼的能力將有新的突破。目前,微軟和OpenAI共同開發的AI編程工具Github Copilot已經在使用調教後的GPT-3,用於將自然語言轉換成代碼。

不會融合圖像功能

除了GPT外,OpenAI的圖片生成AI工具Dall-E 2也是其旗艦產品之一。有人猜測,下一輪生成式AI的發展將會把文字和圖像結合起來。這個主意聽起來非常激動人心,因為用戶可以非常輕鬆地將數據轉換成圖表和圖像。但Altman本人已經否認了這種可能性,表示GPT-4仍然將是純文本模式。

每日經濟新聞

關鍵字: