我已授权

注册

FICO陈建:中国信用评分核心在于打破数据孤岛

2015-11-02 18:39:01 和讯网  和讯互联网金融

    和讯互联网金融消息 由融360和人民大学高礼研究院联合主办的“2015普惠金融CRO全球峰会”于2015年10月30日在中国大饭店召开。FICO中国区总裁陈建先生在本次论坛上发表主题演讲。

    陈建分享了美国征信体系的发展历程。陈建介绍,美国征信系统有两大里程碑,一是以公民信用记录为基础而形成的评分系统;二是针对缺乏信用记录的人,收集他们的美国借记卡相关数据,运营商相关数据以及水电煤相关数据等,纳入征信评分体系。如此,就可较全面的覆盖在美国所有提出信贷需求的客户,根据客户信用评分做出决策。

    关于中国普惠金融市场发展的趋势,陈建认为有两大趋势。第一,央行征信记录数据和央行征信评分在主流金融机构和可以获得央行记录的其他金融机构的大规模的运用。第二,大数据风控的技术创新。陈建认为业内目前对大数据存在误读,大数据实际上指的是规模大、覆盖面广的、很有浓度的结构化数据,而不是业界通常所说的虚无缥渺的互联网数据。中国信用评分的核心不在于议题,而在于打破数据孤岛,形成充分的用户画像。

    以下为陈建演讲实录:

  今天这个命题是在普惠金融这样一个大背景下,信用评分发展的新趋势。我对于这个话题有非常多的激情,因为我本人15年在FICO的职业经历基本上围绕这么一个话题。我职业生涯在FICO起步是在美国总部,那五年时间主要从事美国的FICO征信评估相关的技术研发工作。

  2004年底被总部派过来筹备中国公司之后,一开始几年是替中国银行(601988,股吧)业开发客户化的风险评分、信用评分,这也代表了当时中国金融行业开始采纳数据驱动的业务决策这样一个战略的转型的开始。

  后来有幸带领美国和中国团队一起给央行征信中心研发了新一代的中国征信评分,这个近期央行也在广泛测试的基础上,可能会很快向整个银行业隆重推出。

  最近这一年多,又带领FICO中国团队在中国用大数据和云计算这样一种最新的技术方式试图解决中国市场面临的这样一个问题。13亿人有8亿左右的信贷人群,如何能够有一个公平有效准确的信用评分。所以,今天这个话题对于我个人来说有很多激情的。

  今天的题目是信用评分发展的新趋势,在中国当前和接下来的未来,在信用评分方面会有什么新的发展,在我们探讨中国发展的新趋势之前,我们可以简要看看我们的前辈,比如说美国市场走过了一个什么样的历程。

  刚才平安银行(000001,股吧)的张京总谈到了他在美国的一个体会,随便一个公民提起一个信贷申请几千美元、一万美元是非常容易的,这确实是美国的情况。美国怎么做到这一点,大家知道美国有三大征信局,美国客观来说走过了一段历程。美国的人口差不多有3亿多,大概有2亿多,2.5亿多不太到,是有征信级的良好记录的,或者足够的记录的。

  在上个世纪80年代末90年代初开始,美国三大征信局成体系之后,FICO评分作为总结了征信信用数据的所有重要的规律以后,以一个简单扼要的评分方式对这2亿多美国人进行一个准确的风险评估,在过去的二三十年来,成为了美国业界的行业标准,这个就是一个普通美国人能够轻松获得普惠金融服务的最根本的条件。你要去银行申请非常简单,银行查一下你的信用评分多少,批不批,而且利率可以非常贴近你真是的风险水平。这是美国市场走过的第一个重大的里程碑。

  美国市场第二个重要的里程碑对中国市场依然有巨大的作用,美国的3亿多人的2亿人里面有非常详细的信用记录,可以对FICO评分做决策。因为美国是一个移民国家,有一个问题,就有大量的新移民,就像张京总刚到美国的时候也算新移民,我刚到美国的时候也算新移民,还有很多的老黑等等的,到美国都没有信用记录,或者信用记录非常单薄。这些人到美国的时候因为缺乏征信局的信用记录,没有一个正统的FICO评分,要获得信用服务难度就很高了。

  在美国市场怎么解决这个问题呢,这个就是FICO在前几年开始,在美国极度严格的监管体系之下,开始在传统的征信评分的基础之上,针对大概有五六千万的成年人,但是不在主流的征信体系之内,引用他们的美国借记卡相关数据,运营商相关的数据,以及水电煤相关的数据,开始纳入征信评分的体系。在美国也是这两年隆重推出,叫FICO XB评分,这是一个FICO拓展评分,把他从有征信的人群当中拓展到在主流征信局还没有征信的人群。大家有兴趣可以查一下《华尔街日报(博客,微博)》对这个有隆重报道,因为FICO XB评分一推出,即刻解决了美国五千到六千万的没有征信记录的成年人的信用评分问题,即刻可以获得普惠金融,即刻可以让他们进行金融贷款的决策。

  我们谈这个问题,对中国的征信市场有什么启发。我认为,美国走的相当长的历程很可能就是中国今天或者明天走的历程,比如今天的中国征信市场是一个什么状况,咱们13亿人,业界的共识有8亿左右潜在信贷人群,这8亿左右里面,大概有2.5亿人群是在央行有征信记录,而且能够通过央行的征信记录产生一个FICO跟央行一起研发的征信评分。这就意味着还有5到6亿人是潜在的信贷人群,他们还没有央行主流的征信记录,但是他们有信贷需求,这个可能就是几位专家刚才探讨的,普惠金融要解决的核心课题可能也是核心的难题。

  所以,如果我们要简要地说中国的普惠金融市场要发展的趋势,有两大趋势。第一,就是央行征信记录数据和央行征信评分在主流金融机构和可以获得央行记录的其他金融机构的大规模的运用。其实在今天的中国金融市场上,对央行征信报告的应用还是比较浅的,对比一下美国的银行的非银行金融机构,他们对征信局记录中银行的价值的挖掘,那是贯穿贷前、贷中、贷后的所有环节。今天中国的银行主要还是应用央行的征信信息,比如一些比较容易捕捉的来做信用风险评估的规则的一些特点,加上一定的申请评分。这是一个很好的基础,但是在如何把央行征信记录和央行的征信评分,那也是FICO开发的,用好、用深、用广,这将是业界第一个趋势。业界经常会谈现在怎么样用大数据,刚才张京总有一个观点,先把你最容易获得的最powerful的数据用好,再来谈大数据,这是第一个趋势。

  第二个趋势,就像刚才几位银行的和互联网金融的领导都谈到,我们不能光满足于这两三亿在央行有征信记录的人来开展业务,无论是银行还是互联网金融,现在都铆足劲向在央行没有信用记录的人进行信贷,大家需求非常强烈,大家也知道政府非常鼓励,因为政府希望发展普惠金融,希望拉动消费,希望拉动小微企业的投资,以这个来改造中国新一代经济发展引擎,所以国务院前一段才出了一个大数据产业发展的指引意见。对于第二个方面,我个人认为发展的新趋势就是今天这个论坛的题目,大数据风控的技术创新,应用大数据。

  它的第一个关键词是什么,大数据。这个里面我个人的体会,业界对大数据的概念谈得很多,而且有太多的误解。今天谈到大数据,很多人第一反应是什么,首先从数据上讲,互联网那些各种各样的交易、浏览痕迹、登录的很细微的东西,这是第一反应。第二反应是什么,社交媒体的,各种各样的记录、活动的痕迹。第三反应是什么,非结构性的数据,文本挖掘、影音挖掘、图象挖掘,这是业界对大数据第一的反应。

  这不是我说的大数据,我认为在未来五年之内,这些都不会成为中国的银行和互联网金融行业应用大数据或者驱动风险管理的主流,它也不会是占价值链中的前90%。就在今天美国市场上,所谓的大数据也没在大数据产生什么影响。我跟Lending Club的首席数据官陈超美女士聊过,他们投入的成本跟产出的效应不成比例。

  另外一个鲜明的例子,美国的市场上,FICO代表的所谓应用广义的大数据来驱动信用评分,我们推出基于借记卡信息、运营商信息和水电煤信息的FICO XB评分,一推出来立马解决了美国市场上的5、6亿的普惠金融。

  新的概念未必能解决一个真正的核心的问题,我们要解决的问题是什么问题,打个比方来说,就像我们要挖一个矿,我们要挖金矿,我们要挖矿的时候,这个矿产的特点是很不一样的,有些矿埋在距地表很浅的地方,而且矿的含金度非常高,再有一些矿离地表更深一些,浓度稀一些,但是不算太深,浓度足够高。那么还有一些矿埋藏在底下下深度,浓度极度稀疏。

    这个矿藏的情况就相当于大数据风控的分布情况,埋藏在地表很浅的含金量很高的矿产是什么,就是征信局的信用级,在中国就是央行的征信中心的数据。

  毫无疑问,对于银行来说,对于挖矿者来说,这是一个经济学的解释,我挖地表的矿,直接大把的金子,先把这个金子挖了,再考虑深度的问题。所以在银行,有征信信用的人,当前毫无疑问就把这部分数据用好了、用深了、用精了,对于没有央行的征信渠道的这些公司而言,也有很多办法尽量使用这些数据。就像前一阵子FICO启用的IOP云评分,也是解决了银行的征信数据问题。

  第二层次的问题,我们确实有五六亿的人没有征信记录,我还要去做,还要把这个宝藏挖出来,我要挖什么矿藏。这里的核心命题在于,你可以试图挖一些离地表略深一些,浓度还相当高的矿。这个矿在中国可能意味着什么,如果以美国经验作为借鉴,可能意味着你的借记卡的信息,你的信用卡的交易信息,运营商的信息,还有很多其他的金融帐户的信息。

  这些信息的共同特点,第一,还是结构化的数据,我把它叫大数据,因为它规模很大,量很大,覆盖面非常广。等闲一个覆盖40亿张卡的交易记录,量大,所以叫大数据。但是它是结构化的数据,它不是文本挖掘、影音挖掘、图象挖掘,不是,它是结构化的数据。所以我说它埋藏得离地表比较浅,因为它结构化的数据挖掘出来,其实技术难度没有那么难。但是它大,覆盖面非常广,可以非常有价值地、迅速地解决我们很多风控中的核心议题。

  当然,在地底的最深处肯定有些有用的信息,有些有用的矿藏,比如浏览网络的很多细微的东西,你的某些话不通过文本挖掘出来,这些有没有价值,肯定有价值。地底伸出一万米有没有矿藏,可能是有的。第一,挖掘出来成本非常高。第二,浓度非常稀疏。

  所以,今天我们讲信用评分发展的新趋势,我们讲大数据,我认为正确的观念是大数据指的是规模大,覆盖面广的,很有浓度的结构化数据,而不是业界说的通常习惯的虚无缥渺的互联网数据。这是第一点。

  第二,大数据的挖掘和技术创新,大家通常把它理解为要有更新的机器学习和算法,你有那个莫克神经网络,过时了,咱们有新的精细学习算法,这个我认为进入了第二个误区,技术创新,当然这些精细学习新的算法是有它的价值的,FICO也有很多精细学习的美国专利,但是我们不认为这是技术创新的核心,技术创新的核心在中国这个场景之下是哪里,是要打破技术的孤岛,平常的也可以继续用,评分卡也可以继续用,这些业界经典的技术,不因为它已经有20年的经典历史而过时,尽管新的精细学习算法可能在纯技术上有些提升,关键在于这些结构化的覆盖面很广的大数据的孤岛如何打破,因为要形成一个良好的信用评分,要对用户画像非常充分,主要是有运营商层面的那些特点,借记卡非常有用,反映了存款储蓄帐户的流进流出和存量,这些都是你画像的一个层面。要真正产生对一个人的准确评估,还要把这些孤岛的数据给连接起来,要打破大数据的孤岛。右手边,你还要把这些画像、这些特征跟信贷表现好坏这种风险的标志关联起来,有画像的人,运营商没有信贷表现好坏的数据,借记卡也不意味着有它的信贷表现好坏的标签,而拥有这些标签,比如银行信用中心、互联网金融公司,也未必有左手边的用户画像。

  所以面临中国的信用评分,它的核心不在于议题,在于打破数据孤岛。要打破这个数据孤岛,我个人的理解,第一,你要中立,你如果跟数据的任何所有者,不管是左手边的画像,数据特点的拥有者,还是跟右边信贷机构有任何竞争关系,你就很麻烦。就像刚才章峰总谈到的,你会非常不安,你不知道是我的合作者还是竞争者。所以,第一个要中立,第二个要权威,第三个技术高度可靠,在这种情况下,就可以打破这种大数据的孤岛,这是为什么FICO在从事这方面的工作。

  第二个关键词,我认为是云计算。云计算这个词很火,但是其实它不神秘,通过云端互联网或者移动互联网的方式,在这种创新的场景信用评分的命题之下,它是跟打破数据孤岛密切相关的。每一个数据的所有者,它都要保障它的数据的所有权和数据的安全,以及它对这背后的消费者隐私保护的义务,它都要实现。所以,传统意义来说,数据整合来做信用评分,把大家的数据都归结到一个大的数据中心,就像央行征信中心把所有数据都归集起来,这样的搜集就很难了。央行能做到,因为它是央行。脱离了政府权威机构,要有这样的做法就很难了。

    怎么做到,通过云计算。通过在云端建立一个枢纽,通过移动互联网直接跟各个数据的所有者,不管是信贷表现好坏数据的所有者,还是客户画像的数据所有者通过云端进行连接,在云端设计所有安全可靠的加密算法,保障这个数据的安全以及个人信息的通过加密以后不可识别,来解决一个打破数据孤岛,以及打破利益冲突这样一个命题,这种情况之下,才能真正地做到对央行征信之外的那5、6亿人的良好的信用评分,才能真正解决银行和互联网金融企业向那5、6亿人发放普惠金融的信贷支持这样一个核心的命题,也才能对那两三亿在央行已有征信的人,提供更好的信贷审评和授信额度的决策。

  刚才很多人在提问中,怎么制定合理的信贷额度,怎么样避免多头授信,这些议题都跟这个密切相关。

  所以,总结一句话,在普惠金融这个核心的大命题之下,它的关键词就是三个,大数据、云计算、信用评分。

  谢谢大家!

(责任编辑:王姝睿 HF059)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门新闻排行榜

和讯热销金融证券产品

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。