上海2017年8月24日电 /美通社/ -- 8月23日,以“塑造数据生态.引领金融科技.聚焦数据未来”为主题的大数据金融论坛BDFF2017 在上海隆重召开,数百家机构、行业专家、决策者共同聚焦,紧扣政策热点,共同探讨大数据金融科技发展趋势,探索大数据普惠金融的发展与未来。中诚信征信CTO姚明受邀出席此次峰会并深度剖析信用科技的进化,在征信路上对信用科技的探索和实践。
演讲全文如下:
信用科技的进化主要是基础IT技术的进化
中诚信征信在今年首次提出了“信用科技”这个概念,以呼应新时代背景下金融科技在信用这一板块的发展。之所以选择使用进化这个词,是这个词既能表达技术发展的主动性,又能体现外部环境变化带来的影响和选择性。纵观征信的发展历史,从一百多年前英国裁缝之间共享不守信的贵族黑名单开始,而后进化为信贷交易记录的征信,并在百年间稳步发展,在这一时期,信用科技的进化主要是IT技术的进化,直到近几年大数据技术出现,为信用科技的进化提供了更广阔的空间,可以类比人类进化史中对工具的使用,以及人工智能技术的不断成熟,为信用科技的进化提供了更多纵深,可以类比人类进化史中对火的使用。
大数据和人工智能是信用科技进化的内因,而新金融对于大数据风控的诉求,包括普惠、实时、精准、场景等一系列特点,则是外因。所以,我们定义的信用科技,即Creditech,是旨在通过大数据、人工智能等技术的进步,推动信用评估的智能化和信用价值的扩大化。
信用科技进化的一些主要方面包括:
信用数据从单体高价值到群体高价值的进化
首先是数据维度的进化。所有的信用评估,都是围绕履约意愿和履约能力而展开的。以前,对于这两方面的评估,都是围绕直接数据展开的,也就是强金融数据,比如信贷记录和资产信息。那么在大数据技术发展背景下,这两方面的信息维度也得到了进一步增强,比如信贷记录中增加了消费分期、网贷、租赁等信息维度,在资产信息中也增加了股权投资、理财信息等。除了这些强金融信息,大数据技术赋能信用评估引入了更多的次金融相关、弱金融相关数据,比如消费信息、设备行为信息、网络行为信息、甚至是社交行为信息等。这些金融次相关、弱相关数据,在大数据技术和人工智能技术的催化下,也对信用评估产生了重大的意义,是信用数据从单体高价值到群体高价值的一次重大进化。
其次是数据采集技术的进化。传统的信用评估更多的是通过用户自述、人工核验等方式对数据进行采集和确认。大数据技术的发展,赋能了更多的采集方式,例如通过API聚合方式采集三方数据;通过SDK插件预埋采集设备指纹、申请行为数据;通过物理识别包括生物识别进行人脸识别、活体检测、声纹检测、OCR证照识别、NFC读取卡信息;通过授权定向抓取技术,在用户直接授权下获取其交易记录、通信记录等。以上这些采集方式,都是信用科技在采集方式上的进化,其获取信息的方式更稳定、更实时、更可靠。当然,我们也注意到数据采集技术的进化,会带来更多关于用户隐私保护方面的难题,亟待解决。
第三,是对数据处理方式上的进化。早期的征信技术,主要是对数据的ETL,即对数据的清洗与融合。而现在,除了这些基础数据处理技术外,还广泛的采用聚类技术对人群进行分类,再利用数据的标签化处理对人进行画像,以更为生动直观的形式刻画人的信用;利用ID Mapping技术对人的更多可识别维度进行关联,例如除了姓名、身份证、手机号、银行卡等信息外,还利用照片、设备指纹、网络指纹等非机构化信息进行身份关联。在身份关联以外,知识图谱技术还提供了对数据更平面化的处理,即通过降维处理,信息被定义为“主体”与“关系”,不但能够将人与人进行关联,还能够将人与企业、人与事件、人与所有事物进行关联,进一步为更深层次的关联风险分析提供支持。所以,对于数据的处理,其进化的方向是从冰冷到生动,由表层到深层。
从“人工+智能”到“人工智能”的进化
第四是信用建模技术的进化。
在一个信贷业务场景中产生的实际案例。第一张图示真实的历史数据,星型标记为一个借贷人,区域的颜色表示的是信用情况,绿色代表健康,红色代表风险,可以看到这个借贷人的信用情况是处于绿色区域的,也就是还不错。第二幅图,是传统的统计分析视角下的情况,可以看到有两根白色的线,分别代表了两个统计分析模型,在这两个模型下,风险都能得到不同程度的控制,但是我们的目标借贷人很不幸的被排除在批准区域外了。而在第三幅图中,是在机器学习视角下的情况,我们会看到模型不再是规律的曲线,而是不规则的形状,在这样的模型下,我们的目标借贷人被准确的识别出来了。这就是信用建模从统计分析到机器学习的进化,也是模型由强解释性到弱解释性的进化。
众所周知,要建立一个信用评估模型,实际是就是对y=f(x)中的f进行求解。在求解的过程中,要经历数据抽取、特征工程、算法选择、参数调优和样本检验,如果效果未达预期,再次回到数据抽取,进而循环迭代。对于这个循环,我们一方面通过程序化处理,让整个过程自动化完成,另一方面通过人工智能算法,对于特征工程、算法选择和参数调优环节进行智能优化,更快速的达成更准确的模型。这是从“人工+智能”到“人工智能”的进化。
从征信的“个体信用”到评级的“资产信用”的进化
在信用领域,信用的类别可以归纳为个人信用、企业信用、政府信用、以及由信贷资产抽象而来的资产信用。在信用评估层面,征信和评级一直是作为两个各自独立的存在。征信服务于消费者信贷中的个体信用,评级服务于机构主体和资产包的宏观信用。在独立、客观的信用科技驱动下,从征信的“个体信用”到评级的“资产信用”路径正在被打通和连接,信用科技的价值表现,正在扩大化。
在中诚信征信,我们围绕“个体信用”和“资产信用”分别推出了“万象风云”和“AXIS资产交易智能扫描”平台,并刚刚在8月初召开了产品发布会。
在万象风云平台,我们专注于基于“数据+规则+模型”三位一体的智能风控服务,在数据层面,我们提供了刚才提及的几乎所有API聚合数据支持和其他采集插件;在规则层面,我们依托专家经验和机器学习成果,提供了包括身份认证、数据勾稽、交叉核验、黑名单、团伙反欺诈、设备反欺诈、行为反欺诈、交易反欺诈等一些的规则集,近千条原子规则,并可以通过可视化、可编辑的规则引擎自主配置;在模型层面,我们内置了针对不同场景的模型组,可以在预设的通过率和坏账率标尺下进行自主选择。除此之外,风云还内置了知识图谱工具、AI智能建模工具,让风控和建模以极为简单的操作方式展现给所有人。
在AXIS资产交易智能扫描平台,我们专注于通过独立第三方征信和信用评估,让消费金融ABS资产包的底层资产以更为透明的方式展示给投资人。我们利用基于个人信用评分和转移矩阵的创新理论,进行现金流预测分析;利用机器学习和统计分析相结合,进行资产筛选、资产重构、资产跟踪和对比。
从万象风云到AXIS,我们旨在打通从贷前、贷中、贷后的个体信用评估,到信贷资产入池、资产筛选、资产配置、资产跟踪的资产信用评估的全链条,以“征信”促“增信”。