未來人人都可以擁有「虛擬業務助手」 星環創始人孫元浩:未來數據處理將走向智能化、多模態和平民化

新民晚報 發佈 2023-06-03T02:29:06.637983+00:00

圖說:星環科技創始人、CEO孫元浩在做演講 採訪對象供圖以ChatGPT為代表的超大語言模型的迅速應用,加速了AI普及,讓AI伸手可及,並開始走進我們的工作和生活。

圖說:星環科技創始人、CEO孫元浩在做演講 採訪對象供圖

以ChatGPT為代表的超大語言模型的迅速應用,加速了AI普及,讓AI伸手可及,並開始走進我們的工作和生活。毫無疑問,AI大模型等技術已經深刻地影響到所有行業的發展,並正在重構企業核心產品,重塑用戶與企業產品和服務的交互方式。近日,「向星力·未來數據技術峰會(FDTC)」日前在上海舉辦。星環科技創始人、CEO孫元浩表示,未來各個領域都會誕生「專家型」的行業大模型,人人都可能成為數據科學家,人類與數據的交互方式將發生重大變革,語言、視頻等自然語言的交互方式將逐漸普及,這時,每個人都將需要一個「虛擬業務助手」。

行業大模型知識火候尚有「欠缺」

「當我們用大模型在行業中落地的時候,很快就發現了一個挑戰——大模型雖然在理解人類自然語言、歸納生成文本圖像上有驚人的表現,但它無法理解行業術語,也不能執行行業的特定任務,更無法針對行業做分析、推理和決策。」孫雲浩評價說,在特定領域中,大模型並沒有成為「專家」,目前的「學識水平」只相當於一個本科生或本科低年級。

「究其原因,大模型之所以還是『實習生』,主要還是因為它缺乏行業深度知識庫的學習,讓它沒辦法解決特定行業的業務問題。」孫元浩分析說,其一是因為機器學習需要時間,其二是不管是通用還是行業大模型,輸入都有限制,其三是大模型有時精準度不夠,容易出現「幻覺」,需要一個知識庫來校正結果。

給行業大模型加上知識「外掛」

「超大模型雖好,訓練、維護的技術要求高、訓練難度大,費用巨大,同時,通用大模型對於特定領域的適用性不佳。」為此,星環科技在行業內首先提出行業大模型應用創新場景,推出相應的工具,幫助企業構建自有的行業大模型,通過大模型基礎設施,形成具備「新型人機互動」且「敏捷可持續疊代」的人工智慧應用。

在峰會上,星環除了在行業中首先推出兩大行業大模型:服務於金融行業的星環金融大模型無涯,以及大數據分析大模型SoLar 「求索」外,還應對多模態的數據處理,推出了自研的向量資料庫,幫助大模型拓展大語言模型時間和空間維度,讓每個人都擁有個性化的AI助理。「這樣的『外掛』,能把實時的知識、變化的知識放到大模型中,還能校正結果的準確性,極大提升精度。」

孫元浩在現場演示這一行業大模型時介紹說:「這個是目前的70億參數的開源大模型。當問它中糧集團今年的玉米收儲價是多少?它不知道。再問它,新希望生產豬飼料的主要合作上下游企業有哪些?它也只是泛泛地回答,沒有行業知識。但是,當我們用農業知識圖譜等做完補充後,它立刻可以告訴你最新的收儲價是3元人民幣,以及這個價格帶來的影響。它還能直接回答豬飼料主要的供應商是正大集團。」

人人都可能成為數據科學家

ChatGPT主導的對話式AI開始滲透到各行各業,使人和信息結合比以往任何時候都更緊密。孫元浩認為,未來數據處理將走向智能化、多模態和平民化,其中,領域大模型讓數據處理的自動化程度更高、結果更能為我所用;數據處理將從單一模態向多模態進化,企業數據分析來到新的次元;數據處理平民化,讓普通人不再需要掌握複雜工具,就可以快速處理數據。

「未來在每一個領域,如金融、政府、能源、交通等,或許都需要誕生很多領域或行業的大模型,它們具有專家的能力,能夠在上面構造複雜的應用。」這樣的「未來」,一方面對大模型的專業性有了更高的要求,另一方面,也給普通的數據使用者提出了難題。這時候就需要創新設計,來同時滿足專業和非專業人士的需求。就比如,這次亮相峰會的星環「求索」大模型作為數據查詢和分析的智能助手,能為數據工程師、數據科學及業務人員提供服務,也希望讓非專業用戶在不需要學習和掌握資料庫程式語言的前提下,就可以通過自然語言按需查詢數據。

新民晚報記者 馬丹

關鍵字: