斯坦福「草泥馬」模型驚艷亮相:500美元就能讓GPT-3.5汗顏!

科社美 發佈 2024-03-27T04:20:39.558273+00:00

最近,史丹福大學發布了一個新的人工智慧模型,名為Alpaca(羊駝),引起了廣泛關注。這個模型是基於Meta公司開源的70億參數的LLaMA大模型微調而來的,只用了不到500美元的成本,就達到了與1750億參數的GPT-3.5(text-davinci-003)相當的效果。

最近,史丹福大學發布了一個新的人工智慧模型,名為Alpaca(羊駝),引起了廣泛關注。這個模型是基於Meta公司開源的70億參數的LLaMA大模型微調而來的,只用了不到500美元的成本,就達到了與1750億參數的GPT-3.5(text-davinci-003)相當的效果。而且這個模型還非常小巧,可以在單卡甚至手機和樹莓派上運行。

Alpaca模型主要用於對話任務,可以根據用戶提出的問題或指令生成合理和流暢的回答或內容。例如,它可以回答關於羊駝和美洲駝的區別、寫一封祝賀新生被斯坦福錄取的郵件、寫一篇證明42是訓練神經網絡最優種子數值的論文摘要等等。它還可以寫代碼、繪畫、做數學題等多種任務。

斯坦福團隊在GitHub上開源了Alpaca模型微調所用到的數據集和代碼,並提供了一個在線演示網站供大家體驗。數據集包含了5.2萬個由OpenAI API生成並人工篩選過後的問題-答案對,覆蓋了多個領域和主題。代碼則基於華盛頓大學去年提出的Self-Instruct方法,讓AI自己從種子任務中組合出新任務,並生成相應答案。

Alpaca模型受到了很多人工智慧專家和愛好者們的讚譽和歡迎。著名計算機科學家Yann LeCun在Twitter上稱讚說:「這是一個非常有趣且有價值」的研究項目。「Django框架創始人Simon Willison則表示:「這是一個驚天大事件。」很多網友也紛紛嘗試使用Alpaca模型進行各種有趣和創造性的對話。

不過Alpaca模型也並非完美無缺。由於它依賴於LLaMA大模型和OpenAI API生成數據集,所以它可能會遺漏一些最新或較少見到信息,並且受限於非商業用途協議。此外,在線演示網站也因為使用人數過多而導致速度很慢。

總之,Alpaca模型是一個展示了人工智慧技術進步和成本降低可能性的重要案例。它讓我們看到了未來更多更強大更便捷更普及化語言模型出現在我們日常生活中場景。

關鍵字: