【資料圖】
7月2日,“2023全球數(shù)字經(jīng)濟大會-人工智能高峰論壇”在北京舉辦。度小滿CTO許冬亮等嘉賓受邀發(fā)表演講,并圍繞“AI大模型應用的‘發(fā)展之道’”話題展開討論。
“對比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型”,許冬亮表示,“在數(shù)據(jù)層面,金融行業(yè)因為安全及隱私保護要求數(shù)據(jù)大多存儲在本地,通用大模型在金融能力上缺乏必要的訓練數(shù)據(jù)。另外一方面,金融行業(yè)在風控、精度等方面要求較高,系統(tǒng)又比較復雜,再加上金融相關數(shù)據(jù)實時性的要求很高,所以從這幾個維度去看,通用大模型的金融常識、生成的可控性和準確性都達不到這個行業(yè)的最低要求,需要針對金融機構定制的行業(yè)大模型去發(fā)揮效力”。
今年五月,度小滿宣布正式開源國內首個千億級中文金融大模型“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎上訓練而來,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務上, 表現(xiàn)出明顯的金融領域優(yōu)勢,在金融任務測試集中相較于基座模型效果提升70%以上。
許冬亮認為,“軒轅”大模型運用獨創(chuàng)的hybrid-tuning方式,基于度小滿實際業(yè)務場景積累的海量金融數(shù)據(jù)進行訓練,保證在提升金融能力的同時,不會損失通用能力。
度小滿“軒轅”大模型在金融任務評測中,全面超越了主流的開源大模型,贏得了150次回答中63.33%的勝率。在通用能力評測中,軒轅有10.2%的任務表現(xiàn)超越ChatGPT 3.5, 61.22%的任務表現(xiàn)與之持平,涉及數(shù)學計算、場景寫作、邏輯推理、文本摘要等13個主要維度。
金融機構對行業(yè)大模型的應用熱情高漲。許冬亮透露,“軒轅”大模型開源一個月的時間,已經(jīng)有上百家金融機構在試用。他認為,行業(yè)大模型將幫助積極擁抱大模型的中小金融機構縮小與頭部機構的技術差距。“金融行業(yè)有非常多的中小機構,它們的業(yè)務規(guī)模和科技能力都和頭部機構有明顯差距,在大模型時代,所有金融機構都能用先進的金融大模型來解決自己的業(yè)務問題,大家重新站在同一起跑線上,這是中小機構跨越‘數(shù)字鴻溝’和‘智能化鴻溝’的機遇”。(柯巖)