(資料圖片)
7月2日,“2023全球數(shù)字經(jīng)濟大會-人工智能高峰論壇”在北京舉辦。度小滿CTO許冬亮等嘉賓受邀發(fā)表演講,并圍繞“AI大模型應(yīng)用的‘發(fā)展之道’”話題展開討論。
“對比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型”,許冬亮表示,“在數(shù)據(jù)層面,金融行業(yè)因為安全及隱私保護要求數(shù)據(jù)大多存儲在本地,通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù)。另外一方面,金融行業(yè)在風(fēng)控、精度等方面要求較高,系統(tǒng)又比較復(fù)雜,再加上金融相關(guān)數(shù)據(jù)實時性的要求很高,所以從這幾個維度去看,通用大模型的金融常識、生成的可控性和準確性都達不到這個行業(yè)的最低要求,需要針對金融機構(gòu)定制的行業(yè)大模型去發(fā)揮效力”。
今年五月,度小滿宣布正式開源國內(nèi)首個千億級中文金融大模型“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上,?表現(xiàn)出明顯的金融領(lǐng)域優(yōu)勢,在金融任務(wù)測試集中相較于基座模型效果提升70%以上。
許冬亮認為,“軒轅”大模型運用獨創(chuàng)的hybrid-tuning方式,基于度小滿實際業(yè)務(wù)場景積累的海量金融數(shù)據(jù)進行訓(xùn)練,保證在提升金融能力的同時,不會損失通用能力。
度小滿“軒轅”大模型在金融任務(wù)評測中,全面超越了主流的開源大模型,贏得了150次回答中63.33%的勝率。在通用能力評測中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT 3.5,?61.22%的任務(wù)表現(xiàn)與之持平,涉及數(shù)學(xué)計算、場景寫作、邏輯推理、文本摘要等13個主要維度。
金融機構(gòu)對行業(yè)大模型的應(yīng)用熱情高漲。許冬亮透露,“軒轅”大模型開源一個月的時間,已經(jīng)有上百家金融機構(gòu)在試用。他認為,行業(yè)大模型將幫助積極擁抱大模型的中小金融機構(gòu)縮小與頭部機構(gòu)的技術(shù)差距?!敖鹑谛袠I(yè)有非常多的中小機構(gòu),它們的業(yè)務(wù)規(guī)模和科技能力都和頭部機構(gòu)有明顯差距,在大模型時代,所有金融機構(gòu)都能用先進的金融大模型來解決自己的業(yè)務(wù)問題,大家重新站在同一起跑線上,這是中小機構(gòu)跨越‘?dāng)?shù)字鴻溝’和‘智能化鴻溝’的機遇”。