大模型的浪头卷到了金融业

图片来源@视觉中国

就在由ChatGPT引爆的国内“千模大战”激战正酣之际，与AIGC有着诸多契合场景的金融领域踏上了一条探寻行业大模型的变革之路。

【资料图】

今年3月，彭博社针对金融业推出大型语言模型BloombergGPT，立即引起国内市场对金融垂直领域大模型应用的广泛关注。继各互联网巨头躬身入局后，金融科技赛道的头部玩家们也开始马不停蹄的探路大语言模型。

5月，星环科技推出第一款面向金融量化领域的生成式大语言模型“无涯Infinity”，度小满开源国内首个千亿参数金融大模型“轩辕”；6月，恒生电子发布金融行业大模型LightGPT，将于9月底开放试用接口；最近，马上消费的自研金融大模型箭在弦上即将发布……

在近百款大模型产品的激烈交锋下，通用大模型的求解能力日益趋近同质化，也让大模型在特定行业的落地奔跑成为新赛点。

那么，“金融大模型”这条路究竟如何走通？又将给金融行业带来哪些惊喜和挑战？

01 探路“金融大模型”

月初刚刚在上海落幕的WAIC上，“大模型”无疑成为今年厂商、与会者屡屡提及的热词。大会期间，来自各家厂商的30多个基础大模型、垂直大模型集中亮相，让眼下这场“千模大战”的硝烟味又重了一分。

在让人眼花缭乱的通用大模型之中，垂直于行业的大模型可谓是今年大会的亮点之一。马上消费CTO蒋宁在现场接受媒体采访时表示，大语言模型技术出世后，对金融行业的人工智能技术应用无异于“强心剂”。

在他看来，金融行业有着数据密集型、技术密集型的天然属性，一直在探索数据资产化，挖掘数据价值，同时又面临着如银行线下网点的价值传递效率问题、用户体验问题，需要机构持续创新。

基于这些行业特点，也注定了大语言模型技术将会为其带来新的赋能。3月底，BloombergGPT的发布标志着ChatGPT引爆的AI热潮已一路蔓延到了金融圈。

据彭博社发布的报告指出，这一专门训练用于金融领域的大语言模型（LLM），训练中在金融任务上的表现远超过现有模型，且在通用场景上的表现与现有模型也能一较高下。

这将意味着，LLM正在迈向结合具体行业和特定场景进行垂直落地的新阶段，不仅是其实现商业化跃迁的关键，更是整个产业大爆发的重要一步，这也引来国内金融科技厂商迅速跟进。

“对比于通用大模型的能力而言，金融行业非常需要垂直行业大模型。”在不久前召开的2023全球数字经济大会上，度小满CTO许冬亮也给出了自己的看法。

他认为，囿于金融行业在数据安全隐私、风控、精度以及实时性等方面要求较高，使得通用大模型在金融能力上缺乏必要的训练数据，从而对金融常识、生成的可控性和准确性都达不到这个行业的最低要求，因此需要针对金融机构定制的行业大模型去发挥效力。

作为抢先一步试水的头部玩家之一，度小满在5月下旬推出了国内首个垂直金融行业的开源大模型“轩辕”。该模型基于1760亿参数的Bloom（决定输入数据如何转换为输出内容的变量）大模型基础训练而来，相较于通用大模型，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等金融场景任务上的表现可圈可点。

下水的显然不止度小满一家。6月28日，恒生电子金融行业大模型LightGPT也首次对外亮相。恒生电子董事长刘曙峰表示，大模型是信息技术的最新突破，刷新了人们对机器智能的认知，同时也在刷新行业应用传统AI模型的模式。

在“千模大战”背景下，随着各路金融科技企业在大模型的不断试水，金融业数智化的发展也悄然走向了一个从量变到质变的新阶段。

02 生成式AI浪潮能力涌现

大模型时代，算力、算法、数据构成了新范式的“三驾马车”，其中，数据更可视为决定大模型质量和商业化落地的核心要素。作为一个业务流程规范、数据和知识沉淀完备的行业，金融业天然具有应用大模型的基础优势。

回顾过去十年金融业的发展浪潮，是一场涉及到整个金融产业的信息化和数字化革命，为人工智能的渗透融入奠定了基础。近年来，在智能营销、智能风控、智能投研、智能客服等领域，基于机器学习驱动的建模能力都是金融机构数智化转型翻涌的浪花。

当下以生成式AI为代表的第二波人工智能浪潮席卷至金融业，大模型所积聚的“三驾马车”也已从量变走向质变。

在近日恒生聚源主办的“大模型在金融行业的应用与展望”研讨会上，恒生电子高级副总裁、恒生聚源董事长王锋表示：“传统的AI模型，参数量少，通过大量的数据标注、大规模的模板配置来实现。换一个场景就要再重新来过一遍，泛化性不足，被诟病为有多少人工，才有多少智能。而大模型基于GPT——生成式预训练tranformer技术路线，通过预训练、微调、奖励模型、强化学习四个主要步骤和千亿级别参数规模，做到了令人惊艳的效果，也就是我们所说的能力涌现。”

这种能力涌现如今正赋能在金融云产品的方方面面。

如在AI开发层面，大模型展现出强大的代码自动化生成能力，颠覆了传统的“手工作坊式”模型，极大提升了机器学习的开发效率和生产模式；在智能交互方面，大模型的语音识别率不仅精准，还能凭借着深度语义理解与生成能力，快速解答客户复杂且专业性的问题；在分析决策方面，有着强大信息挖掘能力的大模型，能在风险决策、信用评估、反欺诈等场景，触及小模型无法覆盖到的区域。

申万宏源证券研究所所长助理刘洋认为，在算力、算法、数据“三驾马车”的推动下，工程化能力变得尤为重要，特别是在券商、基金这样的垂类大模型应用场景下，率先为客户提供服务的厂商将抢占先机。

因此，金融大模型的落地应用也成了市场当下所聚焦的关键一步。

03 落地商业化尚需时日

尽管业内普遍认为，大模型将是开启金融领域“iPhone时刻”的按钮，但摆在眼前的事实是，现下的“金融大模型”主要停留在工具层和应用层，更类似于业务流程优化助手，在核心金融业务场景的落地之路任重而道远。

作为一个受到强监管的行业，金融业首先对于技术应用的安全性、稳定性、可控性等要求远比其他行业更为严格。尤其是在考虑到数据的安全与合规问题，意味着前期的数据采集和“清洗”等工作，厂商可能需要花费更多的时间和精力。

在马上消费CTO蒋宁看来，挑战主要现有大模型难以在金融特定领域实现落地的挑战主要来自四个方面：

一是当前的大模型在面对动态且不可预期变化的金融各项业务时，还并不能做到每一份决策都稳定、精确；二是金融行业往往希望为用户提供个性化的服务体验，但这需要个人隐私数据和大模型相融合，涉及到合规和安全问题；三是金融行业一直存在的“数据孤岛”问题，大模型要求构建增强学习的网络化平台，并持续贡献数据和反馈，但目前背后市场的数据生态是割裂的，仍然需要持续性的探索；四是金融行业大模型应用对底层设备、基础架构等软硬件设施提出更高的要求。

对于上述挑战，他认为可从强化学习和持续学习技术、鲁棒性决策、组合式AI系统技术等三个大模型领域的关键技术入手。

他进一步解释道，强化和持续学习会让系统越用越聪明，这就在于大模型幕后自适应的生态能力建设，鲁棒性决策则是实现关键决策的持续稳定和合规可信的核心环节，组合式AI系统技术可以有效结合各种垂直领域的判别式模型的可用性和专业性，助其真正发挥大模型的泛化能力优势。

基于上述认知，马上消费在探路金融大模型方面制定了“三横三竖”战略。据蒋宁透露，目前公司已开发了智能生成报表的工具产品，在智能客服场景上也有所涉猎，并即将发布自研的金融大模型。

最后关于行业最受掣肘的数据质量和合规问题，奇富科技首席算法科学家费浩峻此前对《中国经营报》表示，对于数据质量问题，可以从数字化改造的源头进行标准化建设，并且设置有严格一致性的评估指标和方法。而在合规方面，商用级需要重点解决的问题是轻量级和易用性。

显然，对于刚刚迈入数智化“深水区”的金融业而言，尚需要一个适应到不断完善的过程，这也需要身处水中的厂商们拥抱合作互通，共同迎接大模型时代的到来。

关键词：