Chatgpt淘汰搜索?中信不信!

華爾街見聞 發佈 2023-02-06T03:53:44.949818+00:00

中信證券分析師陳俊雲等認為,ChatGPT要想取代傳統搜尋引擎,還早得很,類似的人工智慧聊天機器人,甚至都無法撼動當前全球搜尋引擎市場競爭格局,但可以推動相關技術加速落地.

就在上周,谷歌23號員工Paul Buchheit表示,像ChatGPT這樣的人工智慧聊天機器人將像搜尋引擎殺死黃頁一樣摧毀谷歌。

面對ChatGPT的威脅,谷歌已經緊張起來了。上周五,谷歌母公司Alphabet CEO桑達爾·皮查伊谷歌將在「未來幾周或幾個月」推出類似ChatGPT、基於人工智慧的大型語言模型。

曾經的屠龍者,如今要成為被屠的巨龍了嗎?

中信證券分析師陳俊雲等認為,ChatGPT要想取代傳統搜尋引擎,還早得很,類似的人工智慧聊天機器人,甚至都無法撼動當前全球搜尋引擎市場競爭格局,但可以推動相關技術加速落地.

中短期內很難取代傳統搜尋引擎

分析師在試用ChatGPT時發現,相較於傳統搜尋引擎提供內容相關頁面連結,ChatGPT可以直接生成面向問題的高完成度回答,並能夠提供回答內容的相關引用連結(目前測試版本尚未開發這一功能)。此外針對開放式問題,ChatGPT也可以通過匹配網絡中的數據生成較為完整的答案,在處理知識類以及創意類的問題時,ChatGPT提供的搜索體驗遠勝於目前的傳統搜尋引擎。

但是, 分析師認為,ChatGPT目前還存在三個致命的不足之處:

1) 數據的實時性問題。目前英文版本的ChatGPT數據截至2021年,而中文版本的ChatGPT數據截至2020年,資料庫版本滯後的主要原因是由於語言類大模型的技術限制。ChatGPT目前的在GPT大模型上加入標註數據訓練模式讓實時數據的引入非常困難,如果要重新預訓練模型,我們估計每次預訓練需要用到1000塊以上的英偉達A100顯卡工作半個月至一個月的時間,成本在百萬美元以上。而如果採用使用微調的方式專門訓練新知識,會導致新知識的在模型內的權重過高,頻繁的微調也會導致模型「遺忘」舊的知識。

2)數據的真實性仍不足可靠。在大量的測試後我們發現,雖然ChatGPT回答問題的準確性有所提高,但如果提出的問題較為模糊或者本身包含部分錯誤信息在內,模型有可能以「一本正經」的語氣生成完全錯誤甚至憑空捏造的回答。真假答案的混雜會讓用戶在需要對專業性問題尋求答案時產生嚴重的困擾,這也是目前語言類大模型普遍存在的問題。據CSDN微信公眾號報導,2022年11月幾乎同一時間上線的Meta服務科研領域的語言類大模型Galactica就因為真假答案混雜的問題,測試僅僅3天就被用戶投訴下線。

3)模型在線推理端成本高昂。根據模型的現有數據,我們假設每次生成的回答長度平均為50個詞,使用8x英偉達A100用於推理的情況下,我們估算ChatGPT每一次生成答案的成本約為1.3美分,約為谷歌搜尋引擎每次搜索成本的3倍。如果每天面對數以億計用戶的搜索請求,如此高昂的成本是公司所不能承受的,中短期內完全取代傳統搜尋引擎在商業模式上無法做到。

難以撼動現有搜索市場格局,但可以推動相關技術加速落地

除了ChatGPT背後的OpenAI,谷歌、百度等搜索大廠均在大語言模型上有深厚的積累,尤其是谷歌,其部分技術還要在ChatGPT之上。

隨著谷歌計劃將類似的AI聊天機器人融入搜尋引擎中,中信預計ChatGPT的成功不會給搜索產業帶來顛覆性的新入局者。但 ChatGPT的攪局,足以在搜尋引擎中掀起「軍備競賽」,加速大語言模型相關技術的疊代。

分析師指出,目前的搜尋引擎巨頭可以藉助ChatGPT的功能,來優化搜索時的用戶體驗,主要有三個方向:

1)考慮到ChatGPT在不同分類問題中的表現情況,限制ChatGPT搜索僅在知識類搜索場景下啟用可以有效控制成本。

2)面對時效類問題時,模型自動判斷轉向傳統搜尋引擎生成答案,並通過傳統搜尋引擎的數據返回生成ChatGPT版本的匯總新答案。

3)針對回答真實性問題,加入對答案產生來源的引用註明給用戶,讓用戶可以快速檢驗回答的可靠性。

本文來自華爾街見聞,歡迎下載APP查看更多

關鍵字: