ChatGPT與保險：四個ChatGPT回答不出來的本質問題

為了較系統地分析ChatGPT對保險的影響，本文首先從ChatGPT的能力出發——明確其能力上限和優勢，然後介紹ChatGPT能力在保險公司應用的價值層次——明確其應用產生價值的路徑，接著介紹ChatGPT思想對於保險行業的啟示，最後闡述說明以ChatGPT為代表的AIGC技術普及的未來，保險行業可能的變化。必須聲明的是，本文並沒有使用ChatGPT——因其能力局限尚不滿足本文寫作需求。

一、ChatGPT的能力如何評價？

為了分析ChatGPT的能力可以從其內在機制和外在表現兩個視角入手。

首先看內在機制，內在機制決定了ChatGPT的上限

這裡面涉及到許多人工智慧具體技術，我這裡儘量簡化並介紹清楚。實際上迄今為止，OpenAI並沒有公開相關ChatGPT的完整技術細節，相關ChatGPT技術原理都是從ChatGPT「出生證」介紹上獲得的（圖1）。這段話說明幾個含義：

第一， ChatGPT類似於InstructGPT（sibling model），這意味著可以從公開的InstructGPT分析ChatGPT；

第二， ChatGPT通過交互對話方式訓練的；

第三， ChatGPT能夠回答問題、承認並糾正錯誤且能夠拒絕不適當的回答等（能力）。

而InstructGPT是有公開資料的（圖2），這是一個完整的三階段步驟，這是一種混合「強化學習「和」模仿學習/比較學習「的方案：類強化學習是體現在第二步構造獎勵模型（函數）並用於第三步；模仿學習一是因為其第二部訓練方式採用了排序（偏好）方法（InstructGPT原始論文），第二是其對損失函數的構造包含了一部分（權重）調整的GPT3輸出（即以GPT3作為目標，這形成了疊代升級關係）。可以設想，New Bing所使用的GPT4也是在ChatGPT（GPT3.5）上進一步提升形成了。從人工智慧視角，這又是一種系統性的增量學習過程。

GPT縮寫是Generative Pre-trAIned Transformer，大名鼎鼎的Transformer大有一統江湖的氣勢——儘管它現在被MLP阻擊中，其對模型的語義元素的相關性提取能力發揮到了極致，更重要的是構建的多層Transformer可以抽取相關性的相關性特徵，這是GPT具有我們欽佩的「寫作創作「能力的來源，但重點是它仍然本質上訓練語料的各種特徵組合後的條件分布的排序，這決定了它的能力的兩個上限：

不具有超域概念、實體和元素，例如新的理論概念和知識，需要注意的是，因為新的理論概念知識仍然表現為最小的「語素「（英文是單詞，中文是字），ChatGPT仍然可以依據」條件分布「排序生成合理的結果，是定域邏輯和語素組合結果。

不具低語料依賴的邏輯推理和分析，例如數學。但需要注意的是這裡數學能力除了數學知識外還包括推理和分析等，如果單看數學知識和概念，那是無法評價的——因為只需要訓練語料足夠廣泛（例如數學博士論文納入）就可以無限擴展。

GPT的上限非常簡單，然而基於定域概念試題元素構建的知識其實已經覆蓋了人類是生產生活的大部分場景，某些特定領域實際上是排斥超域概念試題和元素（或者不承認）如法律、大部分金融行業以及強化同行認同的論文報告生成。接下來我們看一看ChatGPT實際表現。

ChatGPT的能力表現

由於上述原理中第三步的存在，ChatGPT的能力實際上是不斷疊代升級的，這裡以本文寫作時間（2023年2月10日）的ChatGPT的能力進行說明。

首先我們看一下ChatGPT數學能力如何——畢竟其內在機制決定了應該很弱，這甚至可以直接問ChatGPT自己，它很坦誠說相當於小學六年級的水平。具體如何那？我使用了標準數學能力測試標準題庫，為了防止已經有人「教育過「它，我進行了敘述和數字的修改，大體上能夠在數學5年級水平上取得及格以上成績，確實就如我想，就解題能力來說，恐怕距離中國的小學六年級也有段距離——當然數學知識它應該要懂得多的多。

例如這道題：

一共有11個托盤，上面共有370個包裹，相鄰的托盤包裹數不能一樣。但是任意三個相鄰的包裹數合計99。問第六個托盤上的包裹數是多少？

在我的一頓啟發下，ChatGPT開始各種胡亂蒙（條件概率生成）。為了尊重ChatGPT的「人權」，咱們暫定它的數學能力（分析推理）就是小學六年級，注意區分這不是數學知識掌握程度的判斷，數學知識可以通過語料覆蓋到所有可能的級別，然而如同我們都學了實變函數，但掌握的其實不多一樣。

這個結論實際上並沒有降低多少ChatGPT在工作中替代人類的可能性——因為大多數工作其實小學五年級的數學就夠了，多少工作人士已經忘記了微積分和二次函數。

因為後面要分析它對保險的影響（注意不僅僅是保險行業），接著我們看看ChatGPT的金融保險能力，這方面確實是個優等生。我使用了不同學科的規範試卷（經濟學基礎、金融學、保險學等六門課程試題）並與學生人工作答的試卷進行了比對，最後的結論是：如果不考慮金融中的數學知識，ChatGPT基本上可以達到研究生的水平，所以國外英文評測ChatGPT通過MBA考試是毫不稀奇的——英文語料決定了其英文水平更強大，所以ChatGPT在中文生成使用了P-翻譯技術提高可用性。

以下是一些截圖，答得不好的題目：

答得相對及格的例子：

此外在其他領域ChatGPT的能力也大約在大學或研究生水平（圖）。這意味著在許多場景下，ChatGPT確實相當於一個對應專業的本科畢業生或者研究生，能夠完成對應的工作。

但必須補充兩點：

第一點基於前面機制分析，ChatGPT不具有超域概念試題以及知識能力，例如當問及我提出的生命質量理論時，它是「一臉懵」的，儘管該理論已經被AGT泰康平安等國內外公司深度應用，並在全球配置了上千億的資產影響了幾十萬人。原因是相關通用生命質量理論目前還局限在全世界高淨值人群、較少公司範圍內，我們的相關授課講座也沒有形成固定文本，所以對應的語料極少，自然也就沒有了「分析」能力——條件概率為0，哎，ChatGPT不懂我啊。

我們總結一下ChatGPT的能力表現：

強大的文字再綜合能力；

類人的語義提煉和敘述能力；

定域知識的加工和延申能力；

補充的第二點，New Bing使用GPT4要比ChatGPT（GPT3.5）效果更好，例如對於經濟學題目判斷更加準確。

我們再舉一個上面ChatGPT回答過的問題來感受GPT4的強大，這個回答幾乎可以給滿分。

二、ChatGPT的能力對保險公司價值幾何？

ChatGPT的能力很強大，自然就有各種可能的應用，這裡我們主要聚焦於保險公司，看看ChatGPT能夠產生哪些價值。分析某技術對企業的價值，當然可以羅列很多場景，但這其實不能界定它的潛力和方向，更好的方式是用知識經濟價值周期論與場景結合。

科技對保險的價值周期分為三個層次，分別是賦能、增能、產能：賦能是被動引入行業主導技術升級，網際網路其實就是這一類；增能是以價值為導向主動技術判斷和融入，一些大數據技術和隱私計算的上限屬於此類；產能是技術融合創造價值，保險里目前大多數科技或者說保險科技的上限離此都有距離。

為了分析ChatGPT對保險公司的價值上限，我們從兩個角度探討，一個角度是其當前的表現，另外一個角度是其內在機制決定的能力上限帶來的價值上限。

從當前具有的能力看：

ChatGPT可以潛在提升保險公司全流程運營效率。市場端營銷獲客、有效問答捕獲客戶當然是ChatGPT的本行；公司運營的渠道管理、產品設計、精算、封控、財務人事、監管溝通等在某些有限角度可以使用ChatGPT輔助提升效率，請注意這裡我用的詞語是「有限角度」，一會我會進行詳細解釋；在公司的理賠過程包括定損、客戶溝通、相關增值服務、關鍵性文件支持、相關文書撰寫等，ChatGPT也能夠勝任一些工作。

ChatGPT緩解保險公司「流量焦慮」和人力銷售成本壓力，特別是對壽險公司來說。代理人體系儘管正在經歷巨大變革，但仍然是保險公司重要的渠道，現有代理人專業程度、基本法體系與客戶需求升級過程中的專業需求以及服務需求的矛盾成為人身險發展的主要矛盾，ChatGPT可以緩解這一矛盾：在業務實踐中，ChatGPT可向客戶介紹公司所提供的保險產品信息；客戶有關於保險產品的問題，也可以向類ChatGPT應用尋求解答與幫助，並可以使用類ChatGPT應用提供的相關知識，幫助自身了解保險行業相關信息進行決策等；ChatGPT的光環還可以幫助普及風險管理知識、提升居民的保險意識等。

從以上可以看到，ChatGPT當前能力對保險公司的價值上限可以超越賦能，達到增能階段。但上限不代表可以做到，ChatGPT類應用如果要達到增能價值，需要解決這樣幾個關鍵性問題：

第一，ChatGPT的可信性問題，對應於上文我提到的「有限角度」，這從廣義上是人工智慧的可信性障礙。ChatGPT的對話能力實際作為流程關鍵要素嵌入，需要確保其方案、輸出以及方式符合保險公司規範和監管要求，否則其只能發揮「賦能」作用，仍然需要人員作為主要業務節點。基於人工智慧應用的經驗，這個問題其實在保險行業類公司其實相對容易解決，這是因為專業部門的可信性障礙是容易解決的，即使在機制上沒有辦法保證，也有辦法通過流程重構跨過這個門檻。

第二， ChatGPT的數學能力障礙需要跨越。保險中的精算等需要超過高中的數學能力，這使得ChatGPT（包括New Bing的GPT4）目前無法發揮實質性作用。該障礙的跨越是可能的，大約有兩種方式：第一種是目前推理機制融合方式，這是人工智慧目前新的關注點，包括我們在內的一些團隊已經將自動推理機制引入加強非語料依賴推理能力；第二種是專業軟體輸出對象重塑為ChatGPT類的產品，與ChatGPT這類應用相反，大多數流程中的專業化規則化工作已經存在對應的專業軟體，這類軟體的重新定義重塑輸出，可以與ChatGPT比較好配合，一定程度可以跨越這個障礙，我預測這類新的應用或者服務很快就會席捲市場。

第三， ChatGPT的專業適應化。在目前ChatGPT展示的能力中，其專業化能力仍然有所欠缺，例如針對保險較複雜的專業安排等，這需要ChatGPT針對保險業進行微調，這種微調更有可能基於提示學習（Prompt learning），類似於我們已經做的針對醫療和金融的調整。但通過我對New bing的GPT4研究，發現這方面進化極大，或許在GPT4發布之後，這個障礙就自然可解了。

我們再來看內在機制角度，結論是直接的，內在機制決定的ChatGPT能力上限說明其作為工具很難形成產能價值；當然GPT本身機制也會調整，並可以通過解決上述三個障礙來接近逼近上限，但即使如此其單獨作為產能工具的條件仍然是不具備的。

結論：ChatGPT為代表的AIGC技術可以為保險業提供從賦能到增能的支持，距離產能還有一段路要走。

三、ChatGPT蘊含的思想對於保險的啟示

如果只把ChatGPT看做一種工具，那麼在保險公司中應用ChatGPT的能力就夠了；但如果把ChatGPT看作一種新的生產方式，我們則應該看到ChatGPT蘊含的思想對保險的影響。

ChatGPT的思想可以從其訓練過程以及發布後的公眾反應進行總結，大體上可以按照知識經濟學可以分為三個層次：

第一個層次是數據要素創造價值的新模式的到來，即以泛數據為代表的、非監督學習/強化學習/模仿學習為主要特徵提取方式的模式。該思想來自於ChatGPT的內在機制和公眾使用的判斷。保險科技的深入已經讓保險行業意識到數據作為要素的重要性和地位，並在以監督學習為代表的框架下創造了第一類價值，例如欺詐識別、非標題定價、巨災模型等等。但ChatGPT使得要素價值創造模式發生了改變，這種改變使得人工智慧從弱人工智慧邁向通用人工智慧——一些人認為是強人工智慧的必然階段。這種思想於保險行業也非常重要，可以預見類似於合規風險、理賠定損、客戶服務等業務中可以構建類似的穩定模式，形成新的價值，這一類價值的特點是不以替代人類勞動為目標，而是創造新的價值空間為目標，但由於其自身不能直接構建價值，會需要更多的人類協作，所以，這應該很受員工歡迎——AI是朋友而不是敵人。

第二個層次是增量知識的偏好增長。該思想來自於ChatGPT訓練過程。ChatGPT所基於的InstructGPT基於偏好構建獎勵模型，並使得後續能力養成過程中泛知識有序增長。這種方法也體現在許多複製GPTf3的模型中（如APO），其產生的較好效果說明其思想的重要性。如果把保險公司產品疊代看作「增量知識「，那麼可以說保險公司其實疊代時考慮「偏好」是不足的，渠道所反饋的特徵信息收到三重謬誤影響：倖存者需求（存量客戶）、中介激勵限制（代理人激勵）以及慣性認知（固有而陳舊的市場需求分析）。現實情況是，在不同層次上，保險公司的「增量知識」與真實的需求偏差很大：公司和客戶層面上，以健康險為例，公司看到的是險（保險），客戶看到的是健康；在代理人和客戶層面上，客戶看到的是生命質量需求，代理人看到的是金融產品等等。

第三個層次是需求目標的「第一性「。該思想來自於ChatGPT的推廣及應用。它對保險行業發展以及保險公司數位化轉型有重要的啟示意義，原因在於：保險行業尚未實質性融入到生命質量經濟體系中，而生命質量經濟是保險的邏輯基礎；保險公司數位化轉型並沒有以構建三流合一機制為目標，而是局限在賦能尺度上做文章。這使得保險公司需要重新審視新的經濟特徵、新的需求特徵以及新的數字要素價值。這裡牽涉較多專業而細微的內容，這裡從略。

四、AIGC無處不在的世界，保險行業會發生怎樣的變化？

隨著包括ChatGPT在內的AIGC迅速普及——甚至是光速普及，ChatGPT的能力將無處不在，ChatGPT的思想也不斷構建新的可能，我們的世界充滿了AIGC所生成的內容、能力和思想。在這樣的世界，保險行業會發生怎樣的改變？大約有三個變化將會發生：

保險中介（經紀公司、代理人、其他渠道）等需要大幅度提升專業能力，這是因為每一個客戶都將變成專家，以代理人為例，他們需要在ChatGPT所不具備的能力上延申，構建新的使命。事實上，ChatGPT的普及最大的影響不是讓代理人變得更專業，而是讓客戶變得更專業了。

保險公司異質化將會產生更大的價值，這是因為AIGC的簡單應用方式的普及在市場競爭和趨同作用下，將快速形成保險公司同質化的服務、流程和業務，然而保險已經轉向了質量發展階段，這種同質化無法帶來高價值。那些深刻領悟此道理的保險公司將會藉助AIGC力量，採用適應化和再造真正重建自己的價值鏈條而獲得高回報。

保險科技公司將逐漸失去流量金礦，或者說流量金礦將進一步分散，保險科技公司或者升級構建新的壁壘或者走向滅亡。部分保險公司進一步轉型成為諮詢型企業，而另外一部分保險公司則更趨向科技型企業。在這個過程中知識經濟的第二類價值將逐漸統治金融和保險行業，並最終與其他行業一起邁向第三類價值生產模式。

（作者系中央財經大學金融學院教授、博士生導師，中國金融科技研究中心主任，中國人工智慧學會教工委委員，生命質量研究會理事長，家族辦公室合作發展組織理事會主席兼首席經濟學家）