熊伟军:资管行业的数据“治”与“智”
2022年12月13日-14日,由中关村金融科技产业发展联盟、中关村互联网金融研究院、中国互联网金融三十人论坛主办的“2023第十届中关村金融科技论坛年会暨2022‘光大杯’中关村番钛客金融科技国际创新大赛颁奖典礼”在“云端”举办。论坛年会为期两天,包含主题演讲、圆桌对话,发布优秀案例、金融科技与数字普惠报告、《web3.0》图书、中关村金融科技30强、金融科技竞争力报告等多个重要板块。50余位行业专家齐聚一堂,共谋金融科技领域的前沿热点,共克时艰、共话未来!
宽拓科技数据负责人熊伟军参加了12月14日专精特新专题论坛并发表题为“千里之行,始于足下——资管行业的数据“治”与“智””的演讲。他指出:数字化转型,其中一个核心目标就是要数据资产化,赋能业务发展。面对企业数据孤岛,混乱无序,口径不一,质量不高等数据现状,宽拓科技通过构建数据治理体系,将数据标准化,提升数据质量,让数据更快、更准、更稳,同时能够灵活扩展,支持未来新的系统和不同结构的数据接入,达到可用和能用的目标。与此同时通过数“智”化分析平台,结合智能化的技术和工具,让数据更易用和更好用,满足精准营销、智能投顾、量化投资等智能化的业务场景需求。宽拓科技通过提供数据治理和数据智能化平台两方面的服务,最终实现数据资产化、赋能业务发展的数字化转型目标。
发言内容 (以下内容根据现场速记整理)
宽拓科技成立于2014年,是一家专注为银行、资管、公募、券商、信托、保险资管等金融机构提供核心业务系统和数据中台建设的金融科技公司。截止目前,宽拓已经有30多家客户案例,客群覆盖头部券商、基金、银行理财子等各类金融机构。结合宽拓过去8年多的实践经验,分享下在金融科技创新和数字化转型浪潮下,宽拓在资管行业数据方面的一些最佳的实践。
一、数据治理体系架构
数字化转型,其中一个核心的目标就是要数据资产化,赋能业务发展。其中一个核心建设内容就是要让数据可用、易用和好用,但企业常常面临数据孤岛、混乱无序、口径不一、质量不高等数据现状。因此,首先需要通过数据治理,让数据标准化,提升数据质量,让数据更快、更准、更稳,同时能够灵活扩展,支持未来新的系统和不同结构的数据接入,达到数据可用和能用的目标。同时也需要结合一些智能化的技术和工具,让数据更易用和更好用,从而满足像精准营销、智能投顾、量化投资等智能化的业务场景需求。
实现数据智能化,数据治理是基础。如何把数据治理和数据智能恰到好处的结合起来,宽拓通过实践,设计出了一套完整的体系架构。整个架构分为三部分:资管机构的内、外部源系统数据,通过数据网关将数据进行统一采集,然后构建数据湖、数据仓库、数据集市,并对外提供统一的数据服务,满足不同形式的数据调用;数据治理模块,通过数据模型的构建,将数据标准、数据质量等数据治理的内容进行落地,确保数据可用和能用;数据智能化模块,通过AI、BI、指标计算、金融工程和数据科学等对数据进行高阶模型、算法计算,并通过聚合,统一对外提供数据服务。
如何实现数据治理,宽拓科技总结出4个方面,分别为战略愿景、体系支撑、数据治理领域支撑和技术工具落地。战略愿景,也就是数据治理的目标,可大可小,大到一个公司级的数据治理,小到一个特定领域的数据质量的提升,比如监管报送。体系支撑包括组织架构、制度办法,绩效与考核;数据治理领域包括数据标准管理、元数据管理、数据安全管理等八大治理域;最后通过数据治理技术工具,让数据治理信息化、智能化提高数据治理的效率和效果。
二、数据治理工作思路和项目建设思路
数据治理工作,可以总结为4个字“盘、规、治、用”,“盘”就是盘点公司数据资产现状,理清家底,知道有哪些数据,都分布在哪些系统;“规”就是制定数据标准、数据质量稽核规则等一系列的规范。“治”就是针对数据资产中存在的问题,采取一系列的措施进行治理。“用”就是通过一系列的工具,让用户在不同的场景下能够快速淘到自己想要的数据。
数据治理的具体内容,宽拓根据过去8年多的经验积累,总结出了一套最佳实践。
首先要明确数据架构,宽拓把数据分为贴源层、基础层、轻度汇总层、指标层和数据服务层,这套架构要充分的适配主流的Hadoop、MPP等数据平台。针对贴源层系统,要进行充分的盘点,由粗到细,从系统间、系统内、表级、字段级进行充分的探查和盘点,了解整个公司的数据资产的分布,业务含义,技术含义,数据在哪些系统里面,归属哪些部门等。
其次构建统一的数据模型,宽拓结合8年多的经验和对资管业务的深刻理解,总结出符合资管领域的通用的十大主题模型,并且针对不同的资管机构做差异化的模型设计;针对每家金融机构采购多套外部资讯数据的情况,宽拓进行了统一的资讯数据模型的构建,对金融机构多套不同的资讯数据,进行全面的、深度的数据整合和治理。通过以上的两种的模型构建,对企业所有的内部和外部数据形成了 one data、one ID和one model。在此基础之上,针对各行业和客户业务的特点进行扩展和优化,打造出了一套特色的指标体系,以更好的服务企业的上层应用。
在构建统一数据模型和统一指标体系的时候,需要遵从一系列的数据标准,这些标准包括业务标准、技术标准、主数据标准和指标标准。在构建完模型之后,在实际的数据采集和各个层次之间流转的过程中,需要通过一系列的数据质量校验和稽核规则,确保数据的准确、及时、完整、一致和高效。完成模型和指标体系设计后,通过一套可视化的数据开发工具和可视化的数据治理工具,让开发和运行统一线上管理,确保开发过程中的设计和落地完全一致,同时确保数据在运行过程中能够自动、高效、留痕,确保数据的准确、一致和完整。
最后是统一数据服务,通过统一的数据服务,同时满足实时、离线、不同形式、不同场景的数据应用和需要。
数“智”化分析平台
在完成数据治理后,对数据进行来了标准化,让数据达到了可用、能用的状态。那怎么通过智能化的技术工具让数据更易用、更好用?宽拓根据多年的一些经验和积累,打磨了一套智能化的数据分析平台。这套平台采用的是aPaas的设计理念;同时提供在线开发工具Cloud IDE,支持Excel和word插件、指标管理平台、BI工具等灵活的扩展;与此同时也提供弹性的、可扩展的、高性能的算力工具;结合统一数据建模和统一指标体系,对外提供统一的聚合数据服务。
平台内嵌了一个智能化的指标管理平台,从指标的定义到指标的运行进行了一体化的管理,多态的指标计算引擎能够适配多场景的要求。该平台内置了一套宽拓积累多年稳态的常用指标体系;同时,平台可以面向技术和业务人员,支持拖拉拽的方式进行敏态的指标开发。
该平台还内嵌了一套金融工程的开发体系,提供一个统一的SDK和统一的数据服务;平台中所有的源码对外全开放;能够像乐高积木一样的方式,在线进行组装生产;同时,能够在整个公司层面进行模型和算法的分享,有效的进行知识的积累和沉淀。
该平台还提供一套统一的聚合服务,将经过标准数据模型构建和高阶的模型、算法计算,以及指标统一加工后的数据,与常用的BI工具、Excel插件等进行对接,并提供标准的接口服务,给上层的高管驾驶舱,智能报表、智能投研、风险管理等等这种上层的应用进行供数。
经过了数据治理和数据智能化这两方面的建设,最终可以达到数据资产化赋能业务发展的数字化转型目标。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
责任编辑:邓健
波司登高德康:要坚持长期主义,企业必须要盈利但不能只为了盈利
《财经》年会2023:预测与战略于2022年12月17日-18日在北京召开。全国工商联纺织服装商会理事长、波司登集团董事局主席兼总裁高德康发表演讲。结合中国纺织服装消费品牌的发展实践和波司登的实际,高德康分析了几个明显的趋势和机遇。睿见Economy2022-12-17 18:25:300000波司登高德康:提到国货消费者的态度不一样了,现在更加信任和期待
《财经》年会2023:预测与战略于2022年12月17日-18日在北京召开。全国工商联纺织服装商会理事长、波司登集团董事局主席兼总裁高德康发表演讲。结合中国纺织服装消费品牌的发展实践和波司登的实际,高德康分析了几个明显的趋势和机遇。睿见Economy2022-12-17 18:25:290000梁建章等发布《中国教育和人口报告》:中国家庭义务教育阶段负担最重 建议取消中考缩短2年学制
近日,育娲人口研究发布《中国教育和人口报告2022版》学前和基础教育篇。该报告由梁建章、任泽平、黄文政、何亚福及白学松等专家共同完成。报告通过对我国学前教育、义务教育、高等中学教育等各阶段投入收益分析后指出,家庭教育负担过重是造成我国低生育率的最重要原因。育娲人口研究专家建议:大力兴建婴幼儿托育机构,取消中考、缩短中学学制等举措将有利改善当前现状。0000中国工程院院士孙宝国:食品工业就算到10.0时代,普通人也不会把营养胶囊当一日三餐
第七届中国制造强国论坛于2022年12月23日-26日在河北保定举办,主题为:补短板·锻长板·固底板。中国工程院院士、北京工商大学校长孙宝国发表演讲。睿见Economy2022-12-26 14:15:580000黄益平:有人建议人民币和美元将来可以搞成一个平行系统,这是一个最糟糕的结果
《财经》年会2023:预测与战略于2022年12月17日-18日在北京召开。北京大学国家发展研究院副院长黄益平出席并发表演讲。谈及2022年的国际货币体系,黄益平分享了对美联储加息产生的思考。美联储从年初开始加息一共加了425个基点的利率,现在最高已经到了4.5%,这样的变化在过去历史上是前所未有。他指出,今年年初美国的通胀压力非常高,这个问题至今没有解决。睿见Economy2022-12-17 14:42:550000