微軟:多模態大模型GPT-4就在下周,撞車百度?

機器之心pro 發佈 2024-04-01T01:21:03.969793+00:00

最新消息是,萬眾期待的 GPT-4 下周就要推出了:在 3 月 9 日舉行的一場名為「AI in Focus - Digital Kickoff」的線下活動中,四名微軟德國員工展示了 GPT 系列等大型語言模型的顛覆性力量,以及 OpenAI 技術應用於 Azure 產品的詳細信息。

機器之心報導

編輯:小舟、澤南

大家都在猜 GPT-4 發布時間,現在有人提前公布答案了,還是微軟自己的 CTO。

我們知道,引爆如今科技界軍備競賽的 ChatGPT 是在 GPT-3.5 上改進得來的,OpenAI 很早就預告 GPT-4 將會在今年發布。最近各家大廠爭相入局的行動似乎加快了這個進程。

最新消息是,萬眾期待的 GPT-4 下周就要推出了:在 3 月 9 日舉行的一場名為「AI in Focus - Digital Kickoff」的線下活動中,四名微軟德國員工展示了 GPT 系列等大型語言模型(LLM)的顛覆性力量,以及 OpenAI 技術應用於 Azure 產品的詳細信息。

在活動中,微軟德國首席技術官 Andreas Braun 表示 GPT-4 即將發布,自從 3 月初多模態模型 Kosmos-1 發布以來,微軟一直在測試和調整來自 OpenAI 的多模態模型。

GPT-4,下周就出

「我們將在下周推出 GPT-4,它是一個多模態的模型,將提供完全不同的可能性 —— 例如視頻(生成能力),」Braun 說道,他將語言大模型形容為遊戲規則改變者,因為人們在這種方法之上讓機器理解自然語言,機器就能以統計方式理解以前只能由人類閱讀和理解的內容。

與此同時,這項技術已經發展到基本上「適用於所有語言」:你可以用德語提問,然後用義大利語得到答案。藉助多模態,微軟和 OpenAI 將使「模型變得全面」。

改變業界

微軟德國公司執行長 Marianne Janik 全面談到了人工智慧對業界的顛覆性影響。Janik 強調了人工智慧的價值創造潛力,並表示,當前的人工智慧發展和 ChatGPT 是「iPhone 發布一樣的時刻」。她表示,這不是要代替人類工作,而是幫助人們以不同於以往的方式完成重複性任務。

改變並不一定意味著失業。Janik 強調說,這意味著「許多專家會開始利用 AI 實現價值增長」。傳統的工作行為正在發生變化,由於新的可能性出現,也會產生全新的職業。她建議公司成立內部「能力中心」,培訓員工使用人工智慧並將想法整合到項目中。

此外,Janik 還強調,微軟不會使用客戶的數據來訓練模型(但值得注意是,根據 ChatGPT 的政策,這不會或至少不會適用於他們的研究合作夥伴 OpenAI)。

實際用例

微軟的兩位 AI 技術專家 Clemens Sieber 和 Holger Kenn 提供了關於 AI 實際使用的一些信息。他們的團隊目前正在處理具體的用例,他們講解了用例涉及的技術。

Kenn 解釋了什麼是多模態人工智慧,它不僅可以將文本相應地翻譯成圖像,還可以翻譯成音樂和視頻。除了 GPT-3.5 模型之外,他還談到了嵌入,用於模型中文本的內部表徵。根據 Kenn 的說法,「負責任」的 AI 已經內置到微軟的產品中,並且可以通過雲將數百萬個查詢映射到 API 中。

Clemens Siebler 則用用例說明了今天已經成為可能的事情,例如可以把電話呼叫的語音直接記錄成文本。根據 Siebler 的說法,這可以為微軟在荷蘭的一家大型客戶每天節省 500 個工作小時。該項目的原型是在兩個小時內創建的,一個開發人員在兩周內完成了該項目。據他介紹,三個最常見的用例是回答只有員工才能訪問的公司信息、AI 輔助文檔處理和在呼叫中心處理口語的半自動化。

微軟表示人們很快就會與其全新的 AI 工具見面。特別是在編程領域,Codex 和 Copilot 等模型可以更輕鬆地創建代碼,令人期待。

當被問及操作可靠性和事實保真度時,Siebler 表示 AI 不會總是正確回答,因此有必要進行驗證。微軟目前正在創建置信度指標來解決此問題。通常,客戶僅在自己的數據集上使用 AI 工具,主要用於閱讀理解和查詢庫存數據,在這些情況下,模型已經相當準確。然而,模型生成的文本仍然是生成性的,因此不容易驗證。Siebler 表示微軟圍繞生成型 AI 建立了一個反饋循環,包括贊成和反對,這是一個疊代的過程。

看來在 AI 大模型的競爭中,領先的一方也加快了腳步。微軟在過去一周左右接連發布了展示多模態的語言大模型論文 Kosmos-1 和 Visual ChatGPT,這家公司顯然非常支持多模態,希望能夠做到使感知與 LLM 保持一致,如此一來就能讓單個 AI 模型看文字圖片,也能「說話」。

微軟的下次 AI 活動選在了 3 月 16 日,CEO 薩蒂亞・納德拉將親自上台演講,不知他們是否會在這次活動上發布 GPT-4。有趣的是,微軟的活動和百度推出文心一言選在了同一天。

距離 3 月 16 日百度推出類 ChatGPT 聊天機器人還有一周時間,最近有報導稱,百度正在抓緊時間趕在發布最後期限前完成任務。目前看來,百度打算分階段推出文心一言的各項功能,並首先向部分用戶開放公測。知情人士稱,在春節假期過後,李彥宏就要求包括自動駕駛部門在內的全公司 AI 研究團隊將英偉達 A100 支援給文心一言的開發。

我們期待下周各家科技公司能帶來驚喜。

參考內容:

https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html

https://news.microsoft.com/reinventing-productivity/

關鍵字: