吕仲涛:高质量数据是企业大模型应用成功的基石

经济观察网记者万敏2023年12月17日,工商银行首席技术官吕仲涛在第二届明珠湾金融论坛上发布了《明珠湾智能金融发展报告(2022)应用篇》(以下简称“应用篇”),并接受了经济观察网记者的提问。

吕仲涛介绍,金融行业智能应用2022年以来主要呈现了三个特征:应用规模稳步增长、应用质效不断提升、应用成效显著增强。“应用篇”入选典型案例共33个,按照银行、保险、证券三个主要的行业板块组织,每个板块大致细分为产品创新、客服营销、运营管理、风控合规四个应用大类。其中,银行业对智能新技术先行先试,持续提升业务水平,在智慧乡村、智能录审、数智交易等各类场景推出一大批典型应用。

吕仲涛表示:“大型银行的数字化转型和智能化应用发展较早,往往基于全技术栈面向全业务场景打造企业级平台化能力,水平在同业中较为领先。中小银行受制于资本、规模、人才等因素,其智能应用水平较大型机构总体上还有一定的差距,适合根据自己的战略定位和特色业务领域,通过专项技术产品引进和持续打磨的方式赋能业务。”

二是持续提升数据处理、知识沉淀、数据治理之“器”,降低数据处理门槛。吕仲涛表示介绍,工商银行已围绕大模型初步建立数据工程和知识工程的体系化工具,具备对相关数据资产进行整理、清洗、去重、标注、治理的数据工程化能力,有效消除数据冗余、清除数据偏见,确保数据的质量和准确性,并通过工具支撑,持续扩充金融专属数据集,以便完成企业专有模型训练。

三是加强训练数据安全管理之“术”,守牢大模型数据安全质量。通过构建专项机制和专项团队,重点加强大模型数据安全管控,在数据安全管控过程中,优先保障社会主义核心价值观、工行企业文化及金融从业要求,通过敏感词检测、非法数据过滤、安全测评、人工审核等处理安全手段,提升数据质量和安全可控能力。同时,工商银行已随大模型应用深入及实践总结,逐步在推进体系化的安全测评、管控办法和技术框架等能力建设。

四是建立大模型应用的数据运营之“道”,实现大模型的数据闭环。吕仲涛透露,一方面在业务系统中,以智能场景为单位,大模型迭代为目标,通过规范运营埋点数据、埋点数据全入湖等方式,确保大模型应用数据闭环,进而推动大模型持续迭代和优化。另一方面,加强金融大模型运营数据监控分析,按照不同业务领域预置运营指标模板,实现技术指标、业务指标的统一监控,并基于BI(BusinessIntelligence商务智能)能力,生成各类运营评价报告,给数据科学家提供大模型优化指导,保障大模型数据驱动的持续保鲜。


上一篇:玄武区东南大学社区居民学校组织“‘乐年’养生沙龙”主题活动
下一篇:金华10人入选中国最富1000人榜,大金华首富原来是他