Google 應用中的更多 AI 帶來什麼?

天籟飛雪 發佈 2023-01-28T01:53:58.486853+00:00

該公司在過去兩屆 I/O 開發者大會上公開談論自然語言理解 和大型語言模型 ,這是其每年最大的活動。在宣布裁員的同一天,紐約時報披露了谷歌計劃在今年 5 月的 I/O 2023 上展示 的 20 多種 AI 產品。


「如果我問人們他們想要什麼,他們會說更快的馬。」 這種情緒,連同「人們不知道他們想要什麼,直到你向他們展示」之類的衍生詞,使得預測技術的未來變得困難,因為它需要一項創新才能完全改變範式。對於新的和現有的谷歌應用程式即將到來的人工智慧功能浪潮來說尤其如此。


誤解

谷歌並沒有對即將發生的事情措手不及。該公司在過去兩屆 I/O 開發者大會上公開談論自然語言理解 (NLU) 和大型語言模型 (LLM),這是其每年最大的活動。2021 年的對話應用程式語言模型與 Pluto 演示進行了對話,去年的LaMDA 2能夠通過AI Test Kitchen應用程式進行演示。

還有多任務統一模型 (MUM),它可以在某一天回答「我已經爬過亞當斯山,現在想在明年秋天去爬富士山,我應該做哪些不同的準備?」 以及未來在 Google Lens 中為損壞的自行車零件拍照並獲得有關如何修復它的說明的能力。

除了詳細介紹其技術外,Sundar Pichai 更有說服力地說:「自然對話功能有可能使信息和計算從根本上更易於訪問和使用。」 搜索、助手和工作區被特別命名為谷歌希望「[整合]更好的對話功能」的產品。

然而,正如最近的言論所證明的那樣,這還不足以讓人記住。相反,谷歌沒有提供更具體的例子來讓公眾意識到這些新的 AI 功能將如何使他們日常使用的產品受益。

話又說回來,即使在 2022 年 5 月提供了更具體的示例,它也會在當年晚些時候推出 ChatGPT 時迅速被淘汰。OpenAI 演示/產品現已可供使用(並付費),沒有什麼比體驗更切實的了。它引發了許多關於直接響應如何影響谷歌基於廣告的商業模式的討論,認為如果用戶已經得到生成和總結的句子的答案,他們將不再需要點擊連結。

令谷歌措手不及的是競爭對手將這些新的人工智慧進步集成到交付應用程式中的速度。考慮到「紅色代碼」,很明顯該公司認為它不必這麼快推出演示之外的任何東西。安全和準確性問題是谷歌在其現有預覽版中明確強調的內容,高管們很快指出當今市場上的產品如何「可以編造東西」,如果它以以下規模推出,這將對聲譽造成損害谷歌搜索。

即將來臨的

在宣布裁員的同一天,紐約時報披露了谷歌計劃在今年 5 月的 I/O 2023 上展示 的 20 多種 AI 產品。

這些公告,大概是由「具有聊天機器人功能的搜尋引擎」領導的,似乎非常想與 OpenAI 針鋒相對。特別引人注目的是一個「Image Generation Studio」,它看起來像是 DALL-E、Stable Diffusion 和 Midjourney 的競爭對手,Pixel 壁紙創建器可能是其中的一個分支。當然,谷歌將直接應對生成圖像 AI 導致的藝術家的強烈反對。

  • AI Test Kitchen 添加文本到圖像演示

除了搜索(稍後會詳細介紹)之外,泄露的內容似乎都沒有從根本上改變普通用戶與谷歌產品的交互方式。當然,這從來都不是谷歌的做法,它一直是在現有產品——甚至只是其中的一部分——中加入技術可用時的小便利。

Gmail、Google Chat 和 Messages 中有 Smart Reply,而Docs和Gmail中的 Smart Compose並不能完全為你寫郵件,但自動完成建議確實很有用。

在 Pixel 上,有Call Screen、Hold for Me、Direct My Call和Clear Calling,其中 AI 用於改進手機的原始關鍵用例,而設備上的語音識別使出色的錄音機和更快的助手成為可能。當然,還有計算攝影和現在的 Magic Eraser。

這並不是說谷歌沒有使用人工智慧來創建全新的應用程式和服務。Google Assistant 是自然語言理解進步的結果,而使 Google Photos 中的搜索和分類成為可能的計算機視覺在七年後我們認為是理所當然的。

最近,有谷歌鏡頭通過拍照並附加問題進行視覺搜索,而谷歌地圖中的實時視圖提供 AR 方向。

然後是搜索和人工智慧

在 ChatGPT 之後,人們正在想像一個搜尋引擎,您的問題直接由完全為您/該查詢生成的句子回答,這與獲取連結或顯示引用相關網站的「精選片段」相比可能有答案。

放眼這個行業,感覺我屬於少數對對話體驗和直接回答缺乏熱情的人。

我預見到的一個問題是並不總是(甚至經常)想要閱讀完整的句子來獲得答案,尤其是如果只閱讀知識面板中的一行就可以找到答案;可以是日期、時間或其他簡單的事實。

同時,要相信任何公司的聊天機器人搜索的生成和總結能力都需要時間。至少精選片段讓我可以立即查看並決定我是否信任引用的出版物/來源。

在許多方面,直接的句子是智能助手一直在等待的,谷歌助手今天轉向它已經知道的事實(日期、地址等)(知識面板/圖表)和特徵片段。當您與語音交互時,可以肯定地假設您不能輕易地看著屏幕並希望立即得到答覆。

我知道技術的歷史上充斥著疊代更新,這些更新在短期內被新的改變遊戲規則的創新所踐踏,但感覺技術還沒有出現。我回想起早期的語音助手,它們明確試圖在盒子裡複製人類。即將到來的人工智慧浪潮有點像人類回答你的問題或為你完成任務,但這種新穎性能持續多久?

關鍵字: