GPT-4重磅發布！ChatGPT炸裂大升級，能考上哈佛，體驗後我慌了

由愛範兒發佈 2024-03-19T02:23:52.476560+00:00

據 OpenAI 介紹，GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」:類似於手機的跑分軟體，在 ChatGPT 剛出來的時候，也有不少人用它「刷題跑分」，在 GPT-3.5 版本模型下，它的 SAT 成績只能排倒數 10% 的水平，然而 GPT-4 模型可以超越 90% 考生的水平。

今天 OpenAI 宣布推出 ChatGPT 4，ChatGPT Plus 用戶在今天就能體驗到。

OpenAI 稱它是「最先進的系統，能生產更安全和更有用的回覆」。

和上一代相比，GPT-4 擁有了更廣的知識面和更強的解決問題能力，在創意、視覺輸入和長內容上表現都更好了。

用在創意項目上，它能幫助用戶一起創作歌曲、編寫劇本或者學習用戶的寫作風格。

在處理長內容上，GPT-4 能處理長至 2.5 萬字的文本。把連結丟給它，然後就能讓它根據文本分析和提取。

值得注意的是， GPT-4 可以直接讀取 3.2 萬個 token，相當於給它 25000 英文字的背景信息，就可以快速給出結論—也就是說，像律師助理這樣的職業真的要被取代了。而上一個版本只能讀取 4096 個token，相當於3000 英文字信息，這個版本的進步是跨越式的。

除了文本以外，你還能把圖片作為輸入內容給 GPT-4，它不僅能夠識別出圖中的物件，還能根據這些信息進一步處理內容。

據 OpenAI 介紹，GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」：

類似於手機的跑分軟體，在 ChatGPT 剛出來的時候，也有不少人用它「刷題跑分」，在 GPT-3.5 版本模型下，它的 SAT 成績只能排倒數 10% 的水平，然而 GPT-4 模型可以超越 90% 考生的水平。

在其他考試也呈現出類似對比效果，如果光是「跑分」，ChatGPT-4 屬於是可以考進哈佛、斯坦福的水平。

既然它考試那麼厲害，我們學生是不是可以藉助它的能力，幫助我們複習，也考上名校呢？當然用它作弊是絕對不被允許的。

更重要的是，Open AI 還說 GPT 4 比之前模型都更安全了。

在 OpenAI 的內部測試中，GPT 4 被「騙」到回復出不當答案的機率下降了 82%，聊起敏感話題時（如醫療），它的回覆合規性也提高了 29%。

不過，OpenAI 也承認，即便如此，GPT-4 在「社會偏見、幻覺和對抗性提示」上仍存在限制。

OpenAI 發布時間線回顧：

2022 年 7 月：發布 DALL·E
2022 年 8 月：API 費用降低 66％
2022 年 11 月：發布 ChatGPT
2022 年 12 月：嵌入式費用降低 500％，同時保持最先進技術（SoTA）
2023 年 3 月：發布 ChatGPT API，同時保持 SoTA 並降低費用 10 倍
2023 年 3 月：發布Whisper API
今天發布：ChatGPT 4

除了官方演示中出現的指導性用例，社交媒體上也有不少嘗鮮用戶在玩 ChatGPT-4 了，他們給出的案例對實際應用場景更有指導意義。

Twitter 用戶@skirano 用 ChatGPT-4 實現了在不到一分鐘的時間裡，完整編寫出一部桌球遊戲「Pong」。

在算力爆發的時代里，曾被我們奉為經典的事物，將被技術的車輪無情碾壓。

這個案例看得我們手痒痒，愛范兒也現用 GPT-4 模型做了「俄羅斯方塊」的小遊戲，文末我們會把下載地址放出來，歡迎小夥伴們下載體驗。

再進一步，我們還用 ChatGPT-4 模型，生成了一個可以用於計算愛范兒在 AWS 雲計算的使用率的統計程序，它還可以給出節約雲計算費用的建議。

我感覺一個「百曉專家」就站在我面前。

我們還對比了同一個問題在 GPT-4 和 GPT-3.5 版本下的不同問答。

詳細翻讀了 OpenAI 給出的技術文檔後，我們發現 GPT-4 還抓取藥物清單中的關鍵信息，包括但不限於：

找到類似類似性質的化合物；
對它們進行修改，以確保它們沒有被專利保護；
從供應商處購買（甚至包括發送帶有採購訂單的電子郵件）。

這意味著它擁有發現新藥物的能力。

Twitter 還有人直接生成了一個「一鍵起訴」功能，用於針對發送騷擾電話的自動撥號軟體起草起訴書，要求其賠償 1500 美元，將大大降低律師助理的工作量。

一夜之間，GPT-4 再度引領人工智慧實現技術爆炸增長，明天還有百度和微軟輪番登場，人工智慧領域實現了「天界一天，人間一年」的景象。

這個時代屬於擁有創造力和善於使用工具的人。