逐鹿金融大模型

2023-08-11 11:21:41       來源:零壹財經(jīng)

來源 | 零壹財經(jīng)作者|沈拙言編審|趙金龍

在關于金融大模型的諸多討論中,“落地應用”成了最終關鍵詞。對金融業(yè)務而言,精準與安全合規(guī)是任何技術得以應用的最大前提。因此,金融大模型的應用便絕非簡單的“拿來主義”,需要在通用基礎上結(jié)合業(yè)務需求反復精調(diào),這也是當前金融大模型的主要發(fā)力點。

7月末,據(jù)騰訊研究院副秘書長楊望調(diào)研分析,國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已由5月末的79個增加至116個,其中金融行業(yè)大模型約18個。


【資料圖】

有觀點認為,大模型的出現(xiàn),可能會把金融機構(gòu)的數(shù)字化轉(zhuǎn)型進程拉到同一起跑線,填補金融機構(gòu)間的“轉(zhuǎn)型鴻溝”,這對中小金融機構(gòu)來講是不容錯過的機遇。在保證信息精度與安全合規(guī)的前提下,搶先獲得金融業(yè)務場景的商用突破,成為18家金融大模型研發(fā)機構(gòu)競爭的決勝點。

01各顯神通搶賽道

3月底,全球最大的財經(jīng)資訊公司彭博社發(fā)布擁有500億參數(shù)的大型語言模型——BloombergGPT,標志著全球首個金融大模型的誕生,也掀起了國內(nèi)金融大模型的浪潮。

彭博社表示,該大模型在3630tokens金融數(shù)據(jù)集、3450億tokens公共數(shù)據(jù)集之上進行訓練,可全方位支持金融領域NLP(自然語言處理)任務,表現(xiàn)明顯優(yōu)于其他類似規(guī)模的開放模型,在一般NLP基準上的表現(xiàn)也達到甚至超過平均水平。

BloombergGPT一聲炮響,給國內(nèi)帶來了實踐方向。

圖1:國內(nèi)主要金融大模型時間軸(不完全統(tǒng)計)

來源:零壹智庫

5月,大數(shù)據(jù)基礎軟件供應商星環(huán)科技推出第一款面向金融量化領域的生成式大語言模型“無涯Infinity”。據(jù)其介紹,無涯Transwarp Infinity支持股票、債券、基金、商品等市場事件的全面復盤、總結(jié)及演繹推理,以及政策研報的深度分析,為基金經(jīng)理提供決策輔助。

5月下旬,度小滿推出國內(nèi)首個千億級中文金融大模型“軒轅”,該模型是在1760億參數(shù)的Bloom大模型基礎上訓練而來,聚焦于金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務。度小滿CTO許冬亮表示,軒轅大模型基于度小滿實際業(yè)務場景積累的海量金融數(shù)據(jù)進行訓練,保證在提升金融能力的同時,不會損失通用能力。

6月,恒生電子發(fā)布金融行業(yè)大模型LightGPT。據(jù)其介紹,LightGPT使用了超4000億tokens的金融領域數(shù)據(jù)(包括資訊、公告、研報、結(jié)構(gòu)化數(shù)據(jù)等)和超過400億tokens的語種強化數(shù)據(jù)(包括金融教材、金融百科、政府報告、法規(guī)條例等),并以之作為大模型的二次預訓練語料,支持超過80+金融專屬任務指令微調(diào)。

6月29日,拓爾思發(fā)布拓天大模型,并面向媒體、金融、政務領域推出了三大行業(yè)大模型。在金融大模型上,公司基于自有的110億+金融主題數(shù)據(jù)、百億級產(chǎn)業(yè)指標數(shù)據(jù)、30億+產(chǎn)業(yè)要素明細數(shù)據(jù)、2億+產(chǎn)業(yè)動態(tài)本體、500+以上標引維度、10000+知識標引規(guī)則、10萬+產(chǎn)業(yè)標簽作為專業(yè)訓練數(shù)據(jù)。就在日前,拓爾思發(fā)布公告,計劃募資18億元用于拓天行業(yè)大模型研發(fā)及AIGC應用產(chǎn)業(yè)化項目。

7月,馬上消費透露將正式發(fā)布自主大模型,聚焦“自主動態(tài)強化學習能力的大模型(AIGC+RLHF)、多種模型組合式的AI系統(tǒng)、多模態(tài)音視頻實時人機結(jié)合”三項核心關鍵能力,致力解決金融行業(yè)大模型在落地過程中的安全可控和隱私保護、基礎設施能力建設等方面的關鍵問題。

在金融大模型浪潮中,財富管理機構(gòu)與運營商也不甘落后。海通證券、申萬宏源、廣發(fā)證券、興業(yè)證券、長江證券、西南證券、國海證券、國盛證券、華福證券、財達證券10家券商宣布成為百度“文心一言”首批生態(tài)合作伙伴,以同花順、東方財富為代表的財富管理運營商也公告稱將重點打造AI投顧平臺,深入AIGC、交互式AI等領域的研究,完善內(nèi)容生態(tài)構(gòu)建,增強智能運營能力。

騰訊云則瞄準金融安全領域,推出金融風控大模型,錨定機構(gòu)交易、信貸、營銷等場景的風控需求。騰訊云天御首席科學家李超認為,風控尤其是貸前風控環(huán)節(jié)有著最緊迫的需求,在信貸領域,因黑產(chǎn)造成的欺詐已經(jīng)占到了整個逾期規(guī)模的40%-70%。

科大訊飛發(fā)布的大模型產(chǎn)品“訊飛星火智能客服”,以幫助金融機構(gòu)提高客戶服務效率和質(zhì)量,提升用戶體驗為主旨。訊飛星火智能客服產(chǎn)品在意圖理解能力、專業(yè)知識應用能力、對話設計與交互能力、個性化表達能力四個層面取得了全面提升,未來還會進行迭代升級,探索與金融場景更貼近、更有價值的技術服務。

文因互聯(lián)公布了基于“文因大模型”聯(lián)通多個金融場景的解決方案。根據(jù)介紹,該解決方案覆蓋債權發(fā)行、IPO、ESG評級評價、智能投研、智能投顧、信貸評估、債券評級、合規(guī)審計、新聞寫作、工業(yè)維修等多個場景,定位是“為金融人提供安全高效副駕駛”。

與產(chǎn)品相對應的是,一些行業(yè)標準也初露端倪。7月末,騰訊云與中國信通院共同啟動行業(yè)大模型標準聯(lián)合推進計劃,雙方宣布聯(lián)合牽頭中國首個金融行業(yè)大模型標準的編制工作。

據(jù)介紹,該標準對金融行業(yè)大模型的評估方法覆蓋了投研、投顧、風控、營銷、客服、銀行、保險、證券等應用場景,并對大模型在數(shù)據(jù)合規(guī)性、可追溯性、私有化部署、風險控制等方面提出要求。

02應用層策略之爭

金融大模型的應用與商業(yè)化同根同源,商業(yè)化是最終目標,應用是實現(xiàn)商業(yè)化的必要路徑。

由于應用的方向不同,金融大模型所展現(xiàn)出來的能力也不同。按照模型能力輸出的方式,具體可以分為中心化和非中心化兩種方式。

中心化模式即企業(yè)調(diào)用通用大模型或第三方垂直模型的 API 去構(gòu)建業(yè)務功能;非中心化模式則是企業(yè)根據(jù)使用場景和功能,以專有數(shù)據(jù)對通用模型進行微調(diào),形成一個或多個基于實際業(yè)務的小模型。

騰訊云金融大模型的應用策略,是風控層面的從零到整。具體而言,針對金融機構(gòu)動態(tài)化風控建模的需求,把專家經(jīng)驗抽象成一系列風控策略集,進而組成風控大模型,再以風控大模型應對假人假機、假人真機、真人假機的欺詐行為。

據(jù)報道,某金融機構(gòu)的渠道和客群變化較快,基于傳統(tǒng)的專家聯(lián)合建模方式效率較低、成本較高,無法滿足風控系統(tǒng)快速迭代要求,接入騰訊云行業(yè)大模型后,模型迭代周期從17天縮短到3天,建模效率提升60%。

這一做法與交叉信息核心技術研究院常務副院長林常樂的觀點不謀而合。林常樂提出了大模型中的相關專業(yè)領域參數(shù)與專業(yè)模型相結(jié)合的技術路線,通過將專業(yè)模型的精度參數(shù)寫入大模型,實現(xiàn)專業(yè)領域模型與大模型的銜接。

恒生電子與恒生聚源共同推出的智能投研平臺WarrenQ-Chat,則是追求金融信息的精準度,用戶通過對話指令,輕松獲得金融行情、資訊和數(shù)據(jù),且每一句生成的對話均支持原文溯源,確保消息出處可追溯。

科大訊飛“星火智能客服”則更注重以AI能力提升客戶交互體驗。據(jù)科大訊飛研究院副院長、金融科技事業(yè)部CTO 趙乾介紹,星火智能客服基于泛領域開放式知識問題能力、大模型和行業(yè)知識庫及外部APP對接,可以解決新知識難更新、事實類問答容易“張冠李戴”等問題;通過情景式思維鏈邏輯推理,可為用戶推薦個性化產(chǎn)品,賦能營銷獲客。

百川智能創(chuàng)始人王小川認為,大模型80%的價值可能蘊含在非中心化的模型和服務里。

03商業(yè)化將向何處?

據(jù)極客公園報道,有消息表示,隨著監(jiān)管明確,第一批合規(guī)模型放出是值得期待的。同時目前在 To B 領域的應用上,實際上已沒有官方的合規(guī)要求,這將助推大模型落地企業(yè),也將推動工具層和應用層發(fā)展。

但面向C端,合規(guī)先行是必然趨勢。正如國家金融與發(fā)展實驗室副主任楊濤所說,當人工智能大模型在金融領域應用時,更需關注大模型的可審計性、可解釋性等難題以及參與金融活動引發(fā)的風險特征變化、數(shù)據(jù)保護、責任分擔、合規(guī)邊界等問題,并強化數(shù)據(jù)倫理、算法倫理、主體倫理、行為倫理等方面的治理。

中國工程院院士、復旦大學金融科技研究院院長柴洪峰認為,目前大模型在金融垂直領域仍未挖掘出涌現(xiàn)效應。

一方面,由于金融數(shù)據(jù)及知識的私密性導致難以共享,無法構(gòu)建一個龐大的數(shù)據(jù)集,對此可以增強產(chǎn)學研的聯(lián)動性,共同構(gòu)建更強的金融垂直領域基座模型;另一方面由于金融數(shù)據(jù)模態(tài)更多,難以進行統(tǒng)一的處理建模,而如今的大模型對此種多模態(tài)的表達能力仍有待加強。

文因互聯(lián)創(chuàng)始人鮑捷則提出了關于商業(yè)化層面的約束問題,金融客戶并沒有無限的預算,通常只有幾十萬最多幾百萬的前期投入。實際約束往往來自于分布式訓練、數(shù)據(jù)清洗過程、提示詞優(yōu)化、各種數(shù)據(jù)格式,以及為達到更好的訓練效果如何平衡全參數(shù)訓練和提示工程的比例、降低成本,這都是需要在實際項目中解決的難題。

有從業(yè)者認為,當前金融大模型在商業(yè)化上的探索,最終的客戶依然會落在中小金融機構(gòu)上。從監(jiān)管環(huán)境、市場競爭、數(shù)據(jù)安全等多個角度來看,頭部金融機構(gòu)都沒有使用外部大模型的理由和意愿。

這意味著在頭部金融機構(gòu)自研的過程中,中小金融機構(gòu)同已有的成熟大模型合作,爭取到了一定的追趕空間,是補足數(shù)字化差距的絕佳窗口期。

同時,與中小金融機構(gòu)的合作,也是考驗大模型提供方在應用層中定制化能力的絕佳戰(zhàn)場。

正如工商銀行首席技術官呂仲濤所言,綜合考慮投入和產(chǎn)出性價比,中小金融機構(gòu)可按需引入各類大模型的公有云API或私有化部署服務,直接滿足賦能訴求。

04重新定義金融科技

從定位上看,大模型對金融行業(yè)的質(zhì)效提升,是過去金融科技的延續(xù),但效果無限拔高,無異于開啟全新紀元。

度小滿CEO朱光曾表示,類似GPT這樣大模型技術的出現(xiàn),意味著所有圍繞移動互聯(lián)網(wǎng)、AI 1.0的競爭和優(yōu)勢正在告一段落。大模型技術將重塑多個行業(yè)的工作方式和格局,其中最明顯的,也許就是金融業(yè)。換言之,大模型技術重新定義了金融科技。

也正是基于過去金融科技的應用積淀,呂仲濤認為短期內(nèi)大模型與傳統(tǒng)模型會共存,同時,大模型可作為中控,將傳統(tǒng)模型作為技能進行調(diào)用。從長遠來看,若大模型計算復雜度降低、可解釋性增強,其綜合性價比優(yōu)勢就凸顯出來,大模型將逐步替代傳統(tǒng)模型。

柴洪峰認為,金融垂直領域模型構(gòu)建與金融數(shù)據(jù)的結(jié)合將成為推動金融科技創(chuàng)新和發(fā)展的重要動力,人機混合智能技術將成為推動金融領域進步的創(chuàng)新驅(qū)動技術。為了克服金融大模型應用現(xiàn)存的諸多難題,加強產(chǎn)學研的合作勢在必行。

參考資料:1、"百模大戰(zhàn)"回歸理性!騰訊云牽頭編制中國首個金融業(yè)大模型標準,力推這一業(yè)務

2、大模型百花齊放負責任的金融領域大模型應用備受期待

3、文因互聯(lián)鮑捷:數(shù)十萬級、百萬級投入,金融機構(gòu)可擁有自己的行業(yè)大模型

4、沸騰251 天,訪談近百位從業(yè)者,關于大模型世界的 5 個現(xiàn)狀

5、如何釋放大模型對金融行業(yè)的價值?

6、柴洪峰院士:大模型賦能金融科技思考與展望

原文標題:逐鹿金融大模型

關鍵詞:
x 廣告
x 廣告

Copyright @  2015-2022 海外生活網(wǎng)版權所有  備案號: 滬ICP備2020036824號-21   聯(lián)系郵箱:562 66 29@qq.com