21世纪经济报道记者 陈植 上海报道
ChatGPT兴起所带火的大模型技术,正受到越来越多金融机构关注。
多位银行科技部门人士向记者透露,他们正密切关注大模型技术在金融场景的最新应用成效。
(资料图片)
“目前,业界普遍认为认知大模型技术将大幅提升银行在智能客服、智能营销与智能运营等方面的效率,但考虑到这项新技术的高成本投入与数据合规性挑战,我们更愿等待其他金融机构先取得某些实际成效,再迅速跟进研发。”一位股份制银行科技部门人士向记者透露。
科大讯飞总裁吴晓如认为,金融行业属于信息密集型行业,是大模型技术的最佳应用场景之一。
值得注意的是,众多国内金融科技平台已迅速布局大模型技术研发。
记者获悉,近日奇富科技决定组建一级战略部门——大模型部,致力于开发运用各种深度学习算法、以及生成式人工智能技术在金融领域的场景化应用。
奇富科技首席算法科学家费浩峻表示,金融大模型基座为核心的智能征信服务系统可以帮助金融机构更全面、高效地理解与判断用户信用状况,有可能替代与优化以往金融机构在智能征信解读方面上千万级变量处理与众多深度模型建设工作,从而令大模型技术成为AI模型更智能化的“替代者”。
中关村科金则尝试针对财富管理场景,基于开源基础大模型打造面向理财师的智能营销助手,它可以实时追踪行业动态,深入理解客户投资需求,通过用户画像与大模型技术解析构建投资要素,为客户自动生成专业的定制化投资建议,减少理财师手工撰写文案的工作量、提升理财师展业效能。
值得注意的是,尽管ChatGPT带火的大模型技术颇受金融机构青睐,但它能否迅速普及,仍面临诸多挑战。
“金融领域的大模型技术应用,面临较高的数据安全性与合规性挑战。目前某些金融应用场景或许已具备良好数据基础与数据质量,可以迅速通过大模型技术创造更高的AI服务效率,但多数金融应用场景仍需要大量数据合规性清洗,且需要更多时间与资金投入检验大模型技术在提升AI服务效率的具体成效。”上述股份制银行科技部门人士透露。这也是不少银行对直接引入大模型技术颇为谨慎的原因之一,他们更愿与金融科技平台合作,借助后者相对成熟的大模型技术开发AI新产品新服务,在降低成本同时提升成功率。
北京社科院研究员王鹏表示,大模型技术等AIGC技术(人工智能生成内容)若要应用在金融行业,数据合规性与安全性将是一大挑战,因为它涉及个人因素保护与数据使用合规性,需要行业共同确定具体的数据使用标准。
大模型技术引发数据应用与产品思路新变革
在多位金融科技业内人士看来,相比现有的AI技术,大模型技术可能在众多金融场景带来颠覆性的效率提升成效。
毕竟,ChatGPT在通用大模型训练的良好表现,正令人工智能进入新的发展时期。
GPT全称为Generative Pre-trained Transformer,也被称为“生成式预训练Transformer模型”,是“预训练”和“大模型”结合后的一种全新人工智能范式,当大规模数据集在模型上完成预训练后,仅需微调少量数据甚至无需微调,就可直接支撑各类应用。
一位金融科技平台负责人向记者指出,基于上述大模型技术的特点,未来金融机构的AI技术使用模式与研发路径都可能发生改变。
首先在数据应用层面,以往金融机构主要采用结构化数据,而图片、文字、视频等非结构化数据因AI深度学习模型理解效果不够好,通常需采用高效的并行分布式处理技术,借助应用自然语言处理、影像处理、社会网分析和机器学习等专业工具或模型,通过打标签与预定义等方式对数据进行搜索、过滤、计算,再将上述非结构化数据转变成结构化数据再进行处理。
在这个过程里,非结构化数据“标签化”过程难免会产生信息损失,导致可使用的有效信息减少,且可应用的范围也较窄。
但是,基于GPT的大模型技术则没有这方面的烦恼,它可以直接利用非结构化数据,无需先“加工”成结构化数据处理,直接输入进行各种大模型训练。此举导致可运用的数据范围大幅拓宽且数据使用价值更高,令金融机构可以整合更多维度的数据提升部分AI金融服务的效率。
这位金融科技平台负责人向记者透露,以往很多理财师与投资者沟通时缺乏数字化工具,但通过大模型技术训练出来的对话式智能展业助手,可以基于客户海量数据先构建更完整的用户画像,包括用户基本画像和深层画像(囊括客户投资经历、竞品分析、投资预测等数据),再基于用户画像与具体投资需求,自动生成个性化的专业投资策略,有助于理财师能以此为借鉴,向投资者推介相应的资产配置方案。
“这个智能展业助手的另一个好处,是通过大模型技术的训练,它可以回复客户很多投资问题,不仅限于投资产品本身,还有宏观经济与行业发展前景分析以及结合未来经济波动所面临的潜在投资风险提示等。”他指出。这无形间促进金融机构的产品服务研发思路发生新的变化。
记者获悉,原先金融机构在布局金融场景AI服务时,都会对所有内容先进行预先定义与梳理,即在特定金融服务场景里,金融机构先预定义大概问答内容标准后,再进行数据处理,并训练出对应的模型,这被称为一种“预设式”的AI服务方式。
但大模型技术属于一种受控的自组织化方式,即只需将对话、文本、音视频与文档等数据注入大模型里,深入学习机器就能按金融机构要求进行各种自主学习和训练,无需人工进行预先处理,便能直接使用各类结构化和非结构化数据,完成相应金融场景的人机对话内容并确保一定幅度的准确性。
记者多方了解到,为了进一步提升大模型技术所生成结果的精准性,越来越多境内外金融科技平台还尝试在大模型技术里,外挂专业金融领域的知识库与无监督学习+调参模式,即将专业知识、操作手册、业务规范、产品信息、竞品信息等领域知识先注入到大模型技术,再将客户和行业数据、宏观经济的分析等内容进行关联,就能提供更精准的自然语言处理效果,令AI金融服务的成效与精准性进一步提升。
“这也是大模型技术的一大优势。过去AI机器学习模型仍高度依赖AI专家的人工调参,但在大模型技术领域,金融机构相关研发人员只需先配置任务要素系统,注入金融专业领域知识,通过少量的对话调参与大模型节点策略调整,就能生成更精准的自然语言处理话术内容。”上述金融科技平台负责人直言,这令大模型技术与传统AI技术形成两种差异极大的业务流程与服务效率。在传统AI技术领域,无论是预先设定业务流程,还是结构化数据提炼要求,都需大量专业人员参与,导致工作量大且专业性要求高,且对AI深度学习训练的成效,往往只能在事后进行分析调整;但大模型技术将众多非结构化数据融入与相对便捷的特征工程控制(利用领域知识从原始数据中提取特征、属性的过程),不但可以大幅简化专业人员工作量,还能提供事前、事中的效果评测与及时调整优化,令金融场景AI服务的效率进一步提升。
科大讯飞金融科技事业部副总经理赵乾认为,随着大模型技术在金融场景的应用日益成熟,未来会有三个典型金融场景可能会率先普及这项新技术,一是智能客服,因为大模型技术所构建的智能客服可以彻底改变传统的人机交互过程,大模型自动生成对话流程让运营智能客服更简单,主要体现在提升复杂缠绕问题解决率、人机交互感知程度,以及意图理解、流程构建、知识生成等运营内容的效率;二是智慧营销,大模型技术能极大程度丰富客户画像,实现营销推荐精准化、客户服务个性化、营销活动智能化同时,帮助用户在标签挖掘、内容理解、意图识别、短信模板财务规划、话术生成和挖掘等方面提质增效;三是智慧运营,通过将积累的大量数据要素与金融领域知识相连接,可以实现数据的精准加工和知识的结构化构建,打造专家级数字员工,革新繁杂知识获取方式,打造门户搜索助手、培训演练助手、金融展业助手、文档审核助手等。
银行试水面临诸多挑战
尽管大模型技术颇受关注,但银行若要试水这项全新技术,仍面临诸多挑战。
记者多方了解到,从组建AIGC大模型到实际应用,需要完成多项步骤,包括数据采集清洗、模型训练、模型测试与评估、系统部署应用等。
但是,在数据采集清洗端,鉴于金融领域的数据采集安全性与合规性要求颇高,令不少银行机构对此“望而却步”。
一位对大模型技术颇有研究的银行科技部门主管向记者透露,基于大模型技术的AIGC产品需要使用大量行业数据与个人数据并进行复杂众多的训练和微调,但在这个过程,数据使用是否安全、合规性是否存在疑问,都需相关部门做出规范或制定相关标准。比如他们在智能营销、智能客服等场景使用同一个客户的个人数据,是否会遇到不同的数据使用规范要求,目前尚无明确说法,令他们担心若稍微过度使用个人数据进行大模型技术训练,可能最终会遇到数据合规性问题。
在他看来,大模型技术研发训练的高成本投入与成效不确定性,也是制约银行试水的另一大因素。
记者获悉,AIGC大模型研发技术需要深厚的人工智能相关技术沉淀、海量训练数据、持续优化算法模型与完善的生态体系等,且这项新技术从研发到商业化应用,还需较长时间与资金投入。更令银行机构揪心的是,某些自然语言处理大模型技术训练所得出的结果未必精准,内容也不一定正确,时效性可能不够强,未必能胜任对安全性、准确性要求相对较高的智能客服或智能营销等金融场景。
这背后,数据质量在其中起到巨大影响——若向大模型技术输入的数据质量不佳,就很难指望后者通过训练能反馈出“正确”结论。
多位金融科技业内人士对此直言,这需要在大模型技术基座,先对数据进行清洗和筛选,通过设置严格且一致性的评估指标和方法提升数据质量,才能解决上述问题。且基于个人金融数据安全性与合规性的考量,大模型技术训练应用应部署在私有云基础上,加之可匹配可扩展的API(应用程序编程接口),才能在妥善保护个人金融数据安全的基础上,更好地提升数据质量并得到更佳的大模型训练成果。
“大模型技术或将推动人工智能进入全新的发展阶段,并向多模态智能、运动智能扩展。”前述金融科技平台负责人向记者表示。这将进一步降低价值信息损耗,节约中低端知识型劳动,助力金融机构将更多精力用于提升AI金融服务体验与拓客。