對話系統與AI PM的發展之道

fans news 發佈 2021-11-29T15:09:10+00:00

編輯導讀:如今基本每一個品牌的手機都裝載了自己的對話系統,可以幫助用戶訂機票、記事項,甚至能夠講笑話。本文作者圍繞對話系統進行了分析,希望對你有幫助。

編輯導讀:如今基本每一個品牌的手機都裝載了自己的對話系統,可以幫助用戶訂機票、記事項,甚至能夠講笑話。本文作者圍繞對話系統進行了分析,希望對你有幫助。

本文將介紹對話系統的基本情況及局限,由此衍生出從事該領域的PM應該如何進行產品設計,以及筆者對未來的一些設想,希望能給大家一點啟示。

本文將從以下幾個方面展開:

  1. 對話系統的分類及簡介
  2. 對話系統的局限
  3. 未來的設想
  4. AI PM的設計之道

事不宜遲,我們現在開始!

一、對話系統的分類及簡介

首先,提及到對話系統,大家第一感覺是什麼?我相信在當今智能終端時代,大家都會立馬聯想到siri,小度和小愛同學等。

這類對話系統具備了任務型和閒聊型的產品功能,既能同人對話,又能提供一部分服務,讓用戶感覺到智能科技感,雖然偶爾會有些智障,但很多人都相信只要給它們足夠多的時間,有足夠的數據和訓練,未來肯定能像人一樣智能,而這真的有可能嗎?

我把手頭碰到的對話系統按領域進行整理分類:

從上面可以看出對話系統現在已經滲透到各行各業,但其實它們實現的技術方案流程參考如下:

由於不像智慧型手機的觸控交互(GUI)可視化,對話系統(VUI)看似像黑盒處理一般,只給一個輸入,就可以輸出一大段結果。

但其實整個過程其實就是將語音信號處理成文本,然後將文本整理成結構化數據,即我們常見的表格格式,接著就是按照產品經理設計的邏輯和詞槽進行對話管理,最後按照設計好的接口和話術進行結果的反饋;

舉個例子:

  • 「訂機票」
  • 「從上海出發」
  • 「下周二出發去紐約的」
  • 「商務艙的」
  • 等等

我們可以從上面的遞進邏輯可以看出,我們必須補充完一些必填信息後才能往下走,

而這類語音交互本質就是類似用手觸控訂票功能按鈕,一步一步的把你的出發地、目的地和時間等信息補充到應用上,然後給你呈現對應的結果;

看完是不是覺得並不是很智能,其實語音交互的優勢在於可以一次性補充多個不同維度的信息,

如:「找下明天去紐約的商務艙機票」

如果產品經理設計得好,都設計了對應的詞槽進行解析,那麼我們一步就可以直接檢索出我們想要的結果,而用觸控得幾步;

但其實這種表述並不遵循人性和口語化,一般也很少人能準確無誤的表達這麼一句話出來,看起來這個優勢又可有可無。

對話系統的本質在於聽人話(識別)+講人話(對話管理),其中離不開填槽\填表的操作,每個科技公司都是按照這種技術方案進行設計。

決定每個對話系統的優勢與劣勢,本質是看產品設計、工程設計和如何解決體驗和規模化的問題等方面

二、對話系統的局限

先說結論,對話系統的局限有以下幾點:

  • 局限1:缺乏實質的推理歸納能力;
  • 局限2:無常識認知和世界認知模型能力;
  • 局限3:對話範圍收斂,無法支持發散及引導對話節奏;

現市場的對話系統基本是無法通過圖靈測試,通過也不代表這個就意味著智能,我們在這裡先對AI做一個明確的定義:

  1. 通用人工智慧:即由人造出來的真正智能,即超級智能;
  2. 基於統計的機器學習,即通過現有技術,實現基礎的人機互動;

前面一種是最終實現的結果,也將是人類未來最後的一項發明,而第二種是現階段,人工堆棧出來的人工智障;

局限1:缺乏實質的推理歸納能力

舉個例子:「找飛機票,不要深圳航空的」

這個例子我相信絕大多數對話系統都會直接檢索出深圳航空的飛機票出來;

因為我們機器人處理或者說代碼處理時,都有一個步驟叫做命名實體提取,而這裡面的「不要」一般我們不會做解析,機器會直接將深圳航空作為實體,填入航空公司的詞槽中;

而這上面這個例子,在我們普通表達裡面,其實是比較常見的一種形式,我們對航空公司的售票員闡述訴求時,其實她們一般就可以理解我們的意思;

因為人的大腦具備基本的推理歸納能力,懂得「不要」這個詞指的是「排除深圳航空以外的其他航司」,而機器人只具備提取實體的功能,不存在歸納推理的能力;

而這,不是深度學習、模型訓練和標註能解決的問題,這是我們的第一個局限;

局限2:缺乏常識認知及世界認知模型能力

例子1:

「這袋蘋果好貴啊,(它)價格要幾千塊」

「這袋蘋果好貴啊,(它)價格要幾千塊」

如果從人的角度來看上面兩個例子,我們會自動將第一個例子的它認定為最新一代的iPhone,而第二個例子的蘋果認定為真正意義的蘋果;

但從機器認知來看,它並不能進行這麼複雜的認知,因為它缺乏對常識性知識的補充和對世界的認知;

例子2:

「我想喝點東西」

假設我們以siri的角度來完成這個指令,那麼我們可能會讓用戶補充想喝什麼類型的東西或者乾脆把附近的飲品店通通檢索出來;

如果要更加智能,還可以根據用戶歷史行為習慣,判斷他是否是想要繼續喝咖啡\奶茶;

但假設我們再增加一個維度,時間維度,即用戶在晚上12點說「我要喝點東西」,這時候我們的智能就顯得很智障了,大晚上請我喝咖啡,不讓人睡覺啦;

因為我們的對話系統中,缺乏了世界認知的能力,所以即使我們把推薦系統做到了千人千面,該智障的地方,還是會智障;

而這個局限,同樣是深度學習無法做到的,因為深度學習僅能處理基於明文的信息

局限3:對話範圍收斂,無法發散及引導話題

很多人會覺得小冰是閒聊型機器人的典範,可以做到對話可持續;

但個人認為這個其實也是一個比較低價值的東西,一方面是由用戶主動對話觸發的前提,一方面對話的延展本質也是人與人的對話,無非就是產品設計中做了很多追問邏輯,本質就是人造而非機器造;

而任務型或者問答型更不用說,就是一個閉環的對話模式,不存在發散的概念,因為一發散就智障;

三、未來的設想

回到開頭我們的問題:

「但很多人都相信只要給它們足夠多的時間,有足夠的數據和訓練,未來肯定能像人一樣智能,而這真的有可能嗎?」

我認為不太可能,因此筆者對未來大膽做一些猜想,未來的對話系統,腦波及腦機技術可能會對AI對話系統提高一個新的水平:

  1. 註冊腦波與語音交互聯動
  2. 基於知識圖譜進行世界模型認知
  3. 腦波檢測及世界模型導入

能超越馬車的,不是一匹更快的馬,而是一輛汽車;能創造新交互模式的,不是按起來更舒服的按鍵,而是觸控,能超越對話系統的,不是一個具備多數據和自學習的對話系統,而是一種通用人工智慧;

四、AI PM的設計之道

聊了這麼多,我們是不是說AI PM在對話系統這方面沒有什麼可以做的了?並不是,產品永遠是技術與市場之間的橋樑,我們只需找到發展之道,同樣能給對話系統帶來價值,總的來說,有以下幾點:

設計對話系統時,注意收斂及用戶引導

在設計對話系統時,多做引導,多注意引導語的設計要遵循口語化、通用化,不要有歧義,另外不要讓用戶產生發散的想法,注重問答的收斂。

設計思路的基礎:存在即感知

讓用戶知道什麼時候是機器人,什麼時候是人工服務,這方面可以管理用戶的認知,不會讓用戶覺得自己在被一個智障系統耍得團團轉,這在客服系統尤為重要。

永遠不要覺得自己在做創造,永遠記住自己是在做設計

永遠對用戶存在敬畏之心,尊重用戶和保證用戶體驗,不要個人腦部過多非必要的話術,充分利用多人泛化的理念,10個人寫100句和100人寫10句的效果是不一樣的。

以上為本文的全部內容,本文內容參考:

人工智障2:你看到的AI與智能無關—S先生

希望能給大家帶來一點感觸,謝謝~

本文由 @SiegZhong 原創發布於人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議。

關鍵字: