大数据金融及信用风险管理
2021-07-24
来源:好走旅游网
第4卷第3期 2015年5月 网络新媒体技术 V0M1.4 NO.3 av 2015 大数据金融及信用风险管理 陈 剑 王 艳 郭杰群 ( 美国安富金融工程集团美国马里兰州20850 中国华安基金上海200120 中国上海联和金融信息服务有限公司 上海 200120) 摘要:风险管理是任何金融活动的中心。在实际活动中,数据又是风险管理体系中最重要的因素之一。本文通过数据在信用 风险测算中的应用,特别是通过美国KDS公司的海量数据查询,计算的使用强调了大数据与信用风险的关系。文章最后通过 对美国2008年金融危机以及大数据公司Zestfinance的介绍论述了大数据的局限性。 关键词:信用风险,风险管理,大数据 Big Data and Its Use in Credit Risk Management CHEN Jian ,WANG Yah ,GUO Jiequn ( Integrated Financial Engineering LLC USA,Maryland,20850,USA, HuaAn Mutual Fund Co.China,Shanghai,200120,China, Shanghai Alliance Financial Services Co.Ltd.,Shanghai,200120,China) Abstract:Risk management is the core of all financial activities.In practice,data is one of key factors in risk management.This arti— cle discusses big data and its relation with credit risk management and uses KDS as an illustration.The paper also discusses the limita- tion of big data in risk management practice. Kcywords:credit risk,risk management,big data 任何金融活动都有风险,金融活动的核心就是在承担风险中得到相应的经济回报。由此,对于金融机 构来说,风险管理是机构运营中的重点所在。而对风险的测量,则是风险管理中的核心环节。如果无法有 效、准确地量度风险,即便监管流程再完全,也无法做到对风险进行有效的管理。风险的测量依赖于数据。 在实际活动中,数据是风险管理体系中最重要的因素之一。可以说有了全面、准确、及时的数据,风险控制 体系就成功了一半。近几十年来,金融活动在社会活动中的日益渗透和变化使得风险管理对数据的依赖和 要求也日益提高。随着科学技术,特别是信息收集技术以及互联网的爆发式发展,海量信息数据的产生使 得金融风险管理在模式上迫切需要改善。例如,40多年前,纽约大学的教授Edward Altman曾提出一个基于 企业资产负债表的量化模型Z—Score来度量企业违约风险,但由于企业运营杠杆逐渐增加、透明性的减弱、 以及与政府之间交往的关系等因素,同时经济发展的新常态的出现等,传统的信用风险模型Z—scoro的应 用也受到相应限制。 在常见的金融风险(市场、信用、流动性、营运)中,有着相对完善的、能够有效应用大数据分析并进行管 理的,就属于信用风险。所谓信用风险是指在商业活动中由于借款者(债务人)未能满足合同要求而给贷款 者(债权人)带来经济损失的风险。由于信用风险是以借款者还款能力和还款意愿为基础,因此,计算出借 本文于2015一叭一29收到。 10 网络新媒体技术 2015矩 上限的贷款额度,企业必须展示出商业需求和职业经验。因此,小微企业贷款大多为信用贷款。信用风险 建模和个人并无太大区别。 对于消费者个人的信用风险建模,则主要基于在大样本上的计量经济建模。其基本假设就是在相同条 件下,个体会与大样本中的相似,个人做出相似的行为选择。比如,两个相似的消费者,拥有的共同特性: ①相同的收入;②相同的教育程度;③相同的负债水平;④相同的信用分数;⑤相同的消费习惯;⑥其他 的可量测变量。 那么模型假设一般认为两个人在同样的经济环境下,比如: ①房价下跌;②失业率上升;③离婚、或其他家庭变化。 会做出相似的违约决定。当然,这只是统计意义上的相似,即观测到百分之一的对象违约,那么我们对 于一个相似消费者在类似情况下违约的可能性的预测也是百分之一。模型误差,统计误差肯定是存在的, 因此,保持大样本是统计模型的基本要求。以房屋按揭贷款为例,在建立违约模型的时候,经常要运用以下 这类维度的大数据: (1)按揭记录:①以千万,甚至以亿计的按揭贷款记录;②每个按揭贷款可能有150—200个数据项, 比如。 (2)按揭类型:包括:①贷款利率;②贷款目的(购房、再融资、提现);③固定或是浮动利率;④还本付息 年限及计划。 (3)贷款人记录,包括:①信用记录/信用分数;②家庭收入及财产记录;③其他负债;④自住或投资。 (4)抵押品记录,包括:①房价;②房租收入;③房价波动性;④房产所在地。 (5)上十亿级别的每月还款/违约观测记录。每月的观测记录,包括:①还款额度;②违约与否:③累积 违约金额;④预付记录,等等。 (6)每月的其他相关时域变量,比如:①房价变化;②利率变化;③失业率变化,等等。 当然,收集到了这些数据,只不过是信用风险分析建模的第一步。我们还需要用于以下的计量经济学、 大数据分析、计算机仿真、应用数学等技巧,比如: ①数据清洁、整理、采样、样板数据重构;②模型选择、估计、校准(Model Selection/Estimation/Calibra. tion);③预测及计算机模拟;④对于模型驱动变量的灵敏度分析。 本文特别强调数据的采样和清理。由于数据的体量很大,以及非结构化的特征,完全收集到调查群体 的每一位、每一项数据是不可能的,而且数据的准确性也不能完全保证;更为重要的是,数据并不是越大就 越好。因此,进行数据调查设计和抽取,将数据进行标准化、标签化、结构化,有利于分析其便利性和有效 性。特别是对实时跟踪的一些市场动态数据,如果跟踪的数据过于庞大和复杂,则容易产生数据不一致、维 度过高、模型无解、延时等问题。 在消费者金融业,商业银行及类似的大型金融机构(比如美国两房、三大评级机构、五大投资银行)已经 雇佣了数以千计的经济学家、统计学家、计算机科学家及数学家们,开发了多年的基于大数据的模型,如以 上所提到的按揭贷款违约模型、信用卡模型、信用评分模型。 以美国KDS(KD Scientific)公司为例。KDS是一个位于加州San Jose的金融工程公司。其主要客户为 高盛、摩根斯坦利等华尔街投资公司、富国(Wells Fargo)等大型商业银行,以及资产管理公司①(包括对冲基 金)。目前,它所拥有的消费者数据达2000TB。KDS系统为金融公司提供了证券期权和期货定价、资产抵押 债权、消费者预期、违约以及损失模型的风控的全面分析。随着计算机技术的发展,大数据的存储并不是问 题,但是对大数据的运算却面临很大的挑战。当多维的非结构化或者半结构化数据集中在关系型数据库中 时,运算、分析会耗时过长。KDS早就有了自己开发的专利(图2,图3显示其处理海量数据专利的数据排序 ①管理4万多亿美元的中国外汇管理局也是客户之一。 l8 网络新媒体技术 2015年 和数据监控。这一层面主要是实现数据的高效集中存储、数据的业务指标含义管理、数据质量管理计算任 务的及时调度和计算以及数据问题的监控和告警。 (4)在数据可视化层面有:自助报表工具、腾讯罗盘、腾讯分析和腾讯云分析等工具。自助报表工具可 以自助化的实现结构相对简单和逻辑相对简单的报表。腾讯罗盘分为内部版和外部版,内部版则是服务于 腾讯内部用户(产品经理、运营人员和技术人员等)的高效报表工具,外部版则是服务于腾讯合作伙伴如开 发商的报表工具。腾讯分析是网站分析工具,帮助网站主进行网站的全方位分析。腾讯云分析则是帮助应 用开发商决策和运营优化的分析工具。 总的来看,百度、阿里巴巴和腾讯三大互联网企业都拥有大数据,三大互联网巨头的数据都用来优化自 己业务的运营效果,从这个层面看,其数据价值应用场景比较类似。但由于其业务和商业模式的不同决定 了三者数据资产的不同,也决定了三者未来大数据策略的不同,尤其是基于大数据的开放和合作角度看,百 度的行动最早,也相对更开放,其次是阿里巴巴,最后是腾讯。对于重视大数据开放和合作的互联网企业, 他们最为期待的是借着大数据开放的策略,与更多的传统行业交换更多的数据,从而更好的丰富其在线下 数据,形成线上和线下数据的协同,从中拓展新的商业模式,如智能硬件和大数据健康。 作者简介 傅志华,男,(1981年生),硕士,研究方向为大数据与企业战略、大数据与企业运营。 (上接第12页) 随着互联网的普及,数据挖掘技术的深入,大数据分析在消费者信用风险中将会起着越来越重要的作 用。在消费者信用评估中,还款意愿与还款能力是基本。如果能够很好地把握贷款者的收入、债务,以及还 款习惯,那么个体的信用评估就会相当准确。在这个基础上,其他数据,即个人上社交网站的频度,社交群 体可信度q)等起的作用并不大。最近国内信用大数据圈里的常常谈起美国的Zestifnance。这是一家基于大 数据运用于个人信用评分的公司,成立于2009年。国内不少热衷者认为,这个公司将颠覆传统个人信用评 分方式。Zestifnance公司利用了上千个来源于不同地方的与信用相关或不相关的数据变量,从个人财务状 况到对社交网站的使用量,对个人违约风险做出评估。这些数据量远远超出传统信用模型。但对于从事过 个人信用模型开发的专业人士来说,Zestfinance公司仅仅会对传统模型有改进作用。ZestFinance创始人在 最近的中国之行中也自己说道,Zestifnance服务于无信用评分或信用评分很低的小众人群,由于美国二级数 据批发商极多,Zestfinance本身也很少在互联网上收集数据,基本上是通过购买得到这些基本数据。而Zest— ifnance所能购买的到的数据银行也可以得到,只是银行依靠自己第一手信贷数据已经能够进行对借款者的 信用评估②。由此可见,传统的个人信用评级方法并没有被撼动,更不会被Zestifnance所颠覆。但是,Zestfi— ance开启了一扇大门,促使传统评级方法不但在理念上,在方式方法上也要有相应改善。因此,了解大数据 的局限性,才能更好地发挥其在金融风控中作用。 作者简介 陈剑,男,(1973年生),博士,教授。研究方向:房贷按揭建模,风险管理。 王艳,女,(1973年生),硕士,分析师。研究方向:经济。 郭杰群,男,(1970年生),博士,教授。研究方向:固定收益风险管理及交易策略。 ①②美国历史上最大诈骗案,麦道夫骗局中,麦道夫(他本人做过纳斯达克的主席)的社交圈非贵即富。然而相信他可靠 如我们在上文中所说,个人信用风险取决于还款能力与还款意愿。而这些数据,如个人收入、负债、银行流水、还款历 的投资者损失了600亿美元,不可谓不惨重。 史、等信息都在银行体系之中。