GPT-4重磅發布!ChatGPT炸裂大升級,能考上哈佛,體驗後我慌了

愛範兒 發佈 2024-03-19T02:23:52.476560+00:00

據 OpenAI 介紹,GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」:類似於手機的跑分軟體,在 ChatGPT 剛出來的時候,也有不少人用它「刷題跑分」,在 GPT-3.5 版本模型下,它的 SAT 成績只能排倒數 10% 的水平,然而 GPT-4 模型可以超越 90% 考生的水平。

今天 OpenAI 宣布推出 ChatGPT 4,ChatGPT Plus 用戶在今天就能體驗到。

OpenAI 稱它是「最先進的系統,能生產更安全和更有用的回覆」

和上一代相比,GPT-4 擁有了更廣的知識面和更強的解決問題能力,在創意、視覺輸入和長內容上表現都更好了。

用在創意項目上,它能幫助用戶一起創作歌曲、編寫劇本或者學習用戶的寫作風格。

在處理長內容上,GPT-4 能處理長至 2.5 萬字的文本。把連結丟給它,然後就能讓它根據文本分析和提取。

值得注意的是, GPT-4 可以直接讀取 3.2 萬個 token,相當於給它 25000 英文字的背景信息,就可以快速給出結論—也就是說,像律師助理這樣的職業真的要被取代了。而上一個版本只能讀取 4096 個token,相當於3000 英文字信息,這個版本的進步是跨越式的。

除了文本以外,你還能把圖片作為輸入內容給 GPT-4,它不僅能夠識別出圖中的物件,還能根據這些信息進一步處理內容。

據 OpenAI 介紹,GPT-4 展示了「在多種專業和學術指標下展現了人類水平的表現」:

類似於手機的跑分軟體,在 ChatGPT 剛出來的時候,也有不少人用它「刷題跑分」,在 GPT-3.5 版本模型下,它的 SAT 成績只能排倒數 10% 的水平,然而 GPT-4 模型可以超越 90% 考生的水平。

在其他考試也呈現出類似對比效果,如果光是「跑分」,ChatGPT-4 屬於是可以考進哈佛、斯坦福的水平。

既然它考試那麼厲害,我們學生是不是可以藉助它的能力,幫助我們複習,也考上名校呢?當然用它作弊是絕對不被允許的。

更重要的是,Open AI 還說 GPT 4 比之前模型都更安全了。

在 OpenAI 的內部測試中,GPT 4 被「騙」到回復出不當答案的機率下降了 82%,聊起敏感話題時(如醫療),它的回覆合規性也提高了 29%。

不過,OpenAI 也承認,即便如此,GPT-4 在「社會偏見、幻覺和對抗性提示」上仍存在限制。

OpenAI 發布時間線回顧:

2022 年 7 月:發布 DALL·E
2022 年 8 月:API 費用降低 66%
2022 年 11 月:發布 ChatGPT
2022 年 12 月:嵌入式費用降低 500%,同時保持最先進技術(SoTA)
2023 年 3 月:發布 ChatGPT API,同時保持 SoTA 並降低費用 10 倍
2023 年 3 月:發布Whisper API
今天發布:ChatGPT 4

除了官方演示中出現的指導性用例,社交媒體上也有不少嘗鮮用戶在玩 ChatGPT-4 了,他們給出的案例對實際應用場景更有指導意義。

Twitter 用戶@skirano 用 ChatGPT-4 實現了在不到一分鐘的時間裡,完整編寫出一部桌球遊戲「Pong」。

在算力爆發的時代里,曾被我們奉為經典的事物,將被技術的車輪無情碾壓。

這個案例看得我們手痒痒,愛范兒也現用 GPT-4 模型做了「俄羅斯方塊」的小遊戲,文末我們會把下載地址放出來,歡迎小夥伴們下載體驗。

再進一步,我們還用 ChatGPT-4 模型,生成了一個可以用於計算愛范兒在 AWS 雲計算的使用率的統計程序,它還可以給出節約雲計算費用的建議。

我感覺一個「百曉專家」就站在我面前。

我們還對比了同一個問題在 GPT-4 和 GPT-3.5 版本下的不同問答。

詳細翻讀了 OpenAI 給出的技術文檔後,我們發現 GPT-4 還抓取藥物清單中的關鍵信息,包括但不限於:

  • 找到類似類似性質的化合物;
  • 對它們進行修改,以確保它們沒有被專利保護;
  • 從供應商處購買(甚至包括發送帶有採購訂單的電子郵件)。

這意味著它擁有發現新藥物的能力。

Twitter 還有人直接生成了一個「一鍵起訴」功能,用於針對發送騷擾電話的自動撥號軟體起草起訴書,要求其賠償 1500 美元,將大大降低律師助理的工作量。

一夜之間,GPT-4 再度引領人工智慧實現技術爆炸增長,明天還有百度和微軟輪番登場,人工智慧領域實現了「天界一天,人間一年」的景象。

這個時代屬於擁有創造力和善於使用工具的人。

關鍵字: