个人信用评分模型卡模型 可以将违约率降低多少

2015数据分析师峰会之 刘时斌:P2P金融评分卡模型
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
才可以下载或查看,没有帐号?
数信互融联合创始人
& && &&&大家好!我是刘时斌,我公司数信互融创始人,在SAS风险研发,12—14年在北大联合办学,北大教三个学期统计分析和商务智能课程,去年搭上互联网金融风潮,下来创业,我们这个公司去年12月份正式成立,到今年7月份已经到A轮融到2000多万,估值两个多亿。现在我们招数据方面人才,大家有兴趣可以跟我联系。
今天在开始之前稍微说一下,我不知道大家有多少人用SAS?因为我一直在SAS工作,本身希望把SAS语言推广给大家,包括我们跟各个学校合作,实际SAS给各个学校提供免费软件使用,如果在座同学、老师感兴趣可以直接联系SAS北京研发。可能各位在用SAS的时候,只是了解SAS背景,SAS基本在统计分析领域各个模块、各个细分领域里边都有自己相应产品,为什么在美国火了?因为美国各大金融机构基本都用SAS,创造一些价值。我参加峰会的时候,就有投资人说不玩,因为收费的原因造成影响。但是前面几位老师说量化分析提到信号问题,有些固定计算,SAS在这方面可以达到秒级效果。
先说风险,我一直在SAS研发一直做投入,对风险有一些了解,在国内金融领域说到风险就认为负面的东西,其实国外定义就是波动,有可能是好的,也有可能是坏的,大家如果看英文书注意一下,不一定负面的东西,尤其在量化分析更多从波动角度说。
&&& & &&我现在从事互联网金融领域风险管理工作,在开始之前稍微讲一下为什么互联网金融这两年这么火爆?传统领域风险大概分类,现在互联网金融为什么这么火爆?这不过这两年时间,有一些宏观的原因、有一些技术上条件,促使他产生这么一个局面。以前银行你要借钱,他要必须控制坏账率,对人的资质要求比较严格,相当一部分中小企业或者个人借钱比较困难一点,这两年互联网金融非常火爆,有了中介平台以后,以各种各样形式都可以借到钱,做你想做的事情。我印象深刻的,我前几年买房,当时交首付手上不是太宽裕,我有钱存在公共账户上,中间有10万差额交不了首付,只有跟同事借。如果我知道有这样方式,就可以通过网上平台借这个钱。当时为了交这个钱,朋友亲戚问一圈,你接那么钱很尴尬的事情。
互联网金融给大家提供便利,从国家宏观角度来讲,之前传统银行机构主要几个大行,他要控制息发,完全国家给的规定,存款利率多少、放贷利率多少,人民币走出去,金融市场更加活跃、更加规范,发展更好的话首先第一步就是利率市场化,利率市场化要利率波动,传统大行本来靠吃固定息差生存,现在国家说把这一块让出去,怎么办?实际互联网金融在这个方法,利率市场化过程中起重要的贡献,余额宝刚出来,大家存款都搬到余额宝上,本来你钱放到银行里边,按照最近活期利率存很少,但是放到余额宝里边,钱立马看得到,而且年化利率比较高,很多银行也想通过各种各样互联网金融产品形式,来提高自己的竞争力。像互联网金融产品在撬动利率市场化做了很大贡献。虽然出了很多问题,很多人恶意欺诈、风险控制不好导致倒闭,即使这样国家也没有封掉,大家可以去试。
& & & & 我们认为这个是朝阳行业,促进中国金融市场繁荣,互联网金融必然发挥更大的作用。我们做这个事情,另外一个方面原因,涉及征信行业,去年中国互联网金融总体额度超过美国,为什么美国发展软件、金融、手机等占很大的份额,互联网金融市场份额占多大盘子?中国去年已经超过美国,就是因为美国征信体系非常完备,市场体系非常完备,在这个情况下,给互联网金融留下空间不多了,但是中国情况恰恰相反。
中国人不讲诚信怎么样?其实完善征信体系很长,我们做这个事情一个互联网领域,另外牵扯征信领域,去年一年或者半年时间里边,有很多公司做类似的事情。这个事情确实是朝阳产业。接下来我讲风险识别,因为我们从事风险管理是互联网金融公司,互联网金融公司多少跟传统企业有区别。信用风险就是借钱不还,我把钱借给你违约了、坏账,或者从国家或者大企业风险,我买某些国家国债,本来评级3A级别,比如希腊由于经济波动,因为系统发生问题有造成一些损失。质量风险就是你买一些金融产品或者股票、或者债券,因为市场价格发生波动,比如今天100块、明天80块、可能后天变成60块,你股票一直持有的,数量没有变化,只不过价格波动造成资产波动。市场风险就是所谓市场因子要看什么金融产品,比如外汇、债券、股票、期货都有价格因素,这是风险因子,因为风险因子波动造成市场风险。
& & & & 有几个魔鬼交易员,因为没有正确的监管,一边既当司令也当政委,没有人管他了,有些事情刻意隐瞒没有上报,他自己想干啥就干啥,没有设立职责,造成有关银行倒闭。就是因为流程不完善造成风险,我们叫操作风险。还有其他粉线。巴特尔协议要求你拿资产准备金过来,防止造成意外。比如你没钱怎么办?规定你计算各种风险的算法,什么风险怎么计算?给借款人做评估,技术风险是小小分类,违约率就是欠钱的可能性。
& & & & 我们跟客户打交道的时候,经常有人问,老板要求零风险?零风险什么概念?你要说风险的话,一定要看什么定义?站在公司来讲必须零风险,不能让公司倒闭,你要挣钱不会有坏账,我们把钱放出去就承担别人违约风险,不可能有零风险。一旦放出去没有任何抵押物,就承担风险,就没有所谓零信用风险。你放出去钱获得收益,是不是覆盖某些客户恶意赖帐不还造成的损失。收益要大于损失,你放出去多少钱,承担多少风险?这我们讲有什么风险?怎么管理信用风险?
& && &&&这个地方我举一个例子,然后是风险定价的问题,怎么管理这个风险、用于什么思路。比如我两万块钱借给两个人,假设违约率一样50%,会出现什么情况?两万借给客户A没有违约把钱还回来,借给客户B违约了,这个时候怎么办?这两个人收益我要从一个人身上出实际怎么操作?我放100笔贷款,有20个人违约,他们造成损失必须从还钱人身上收回来,这就是风险定价的思想。
&&& & &&在我例子当中,R达到什么情况?达到100%,放出去钱,我合同签了,你们两个人都把钱放给你们,一年期算上利息,我们给你们两个人签合同,到期还给我两万,本钱一万,这种情况下我才不可能不亏钱,这就是风险定价的核心思想。假设真要这样的话,实际你利率比较高,面临什么问题?监管规则的问题,我们国家规定超过多少钱不能放?放了就算高利贷,实际金融机构收的钱确实挺高,本质是高风险高回报,互联网金融客户有一个什么特点?他们跟传统银行客户来讲是次级客户,因为这些人从银行借不到钱,所以从互联网金融平台借钱,总体违约率高。如果亲戚朋友有钱想投PPT机构,一定有这个概念,为什么高?因为利息,违约率比较高的。
我为什么帮大家选这个东西?定这么高国家不会让,还有正确评估的问题,现在虽然粗放式管理,最后必然精细化。之前我们碰到一个FRL老师,有很多土豪觉得自己有钱投入这个行业,但是什么都不懂,亏了很多钱。长远来讲不行的,互联网金融发展比较火爆是前两年,从去年到今年,很多在美国大银行工作的有经验人,纷纷被请回来,这个行业整体来讲一日千里。
& & & & 信用评估领域,美国对大中型企业包括国家有几个评级机构,咱们国家没有,虽然有评估方法不太一样,国内对信用评估领域比较粗放性。以后如果想发展的话,投入信用领域、风险领域确实朝阳产业,我们现在做的主要针对个人网上消费者信用评估。这个是模型适用性的问题,我们要碰到不同程度人给他讲这个模型怎么用?首先模型回归力度的问题,IFR模型总体比较复杂,这个模型收集朋友数据,相对稳定一点数据,去相对稳定的模型。中等粒度,可以借用各个公司数据,细粒度是到产品级。粗粒度可以用到下面几模型当中作为一个参数。
我们知道刚才讲过美国个人评分来讲,发展比较长,收集数据比较多,整个美国社会业务模式、人们发展属性来讲相对稳定,但是国内情况,我们刚起步,你要用各家征信机构评分放到模型当中要慎重。芝麻信用评分,它是一个例子,第三方征信衍生的例子,我们一开始想把芝麻评分进入模型去。芝麻信用评分我评650分,没有达到750分,750分可以申请落地签各种优惠,我认为我各方面条件不错,为什么最优级?而是优呢。我看他有五个纬度,其他四个纬度非常好,其中一项收益差一点,信用卡还款历史,我之前有消费历史、朋友纬度都挺高,就是因为信用卡还款历史一下下来,为什么?
支付宝可以通过支付宝还款,你还款历史有它就知道,是不是按时还款?根据这个评分,但是我之前没有卡,他直接把这个拉到很低。这是一个问题,我为了评分高,通过他还信用卡。通过反复刷提分很高,这些都是问题。他经过很长时间,包括我也是,分涨上去至少通过小半年,通过信用卡还款才能把分数提高,这是一个问题。它稳定性达到所谓标准的状态,本来我综合性优的,他评为良,要经过不但数据刷新调整,有可能将来是优。大家用第三方评分,基本面临这些问题,稳定性不够好。这是我想说的一点。
& && &&&模型开发周期大家也很清楚,业务准备、数据准备、模型建立、变量探索、模型教研。互联网金融基本一日千里,你必须不断迭代,这个行业有什么特点?实际上放宽也好、或者得到数据周期比较长的,我放出一笔钱去,短的三个月,长的半年、一年、两年,3—24个月,整个人表现才结束,才知道这个人是不是正的把钱还完?才知道他是不是好客户还是坏客户?从行业来讲,收集一条数据时间比较长,不是你现在想做的事情马上就可以做,业务模式发展很快,今天换一个领导可能风控手段变了、业务手段变了,国家出台一个政策它又变了。
&&& & &&领导一拍脑门试新模式,导致数据质量有一些问题,这个业务模式决定迭代周期。另一个是业务准备,是业务学习的问题。在学校里边学这个东西很简单,就是照书本直接跑一个模型,但是这个里边必须清晰理解业务模式是什么?举一个例子我在一家公司做模型,他定义好客户还是坏客户,有的定义6月之内赢7.4是好客户,做模型一定跟做业务清晰的沟通,准确理解对方业务模式。为什么一开始两期,后来调三期,因为收的利息比较高,即使坏账30%也能把成本收回来,有人三期不还也能把坏账补充掉。为什么又调回两期?按照他序列看,基本单期也可以赚钱,出发点不一样。前后一变我们做的很多工作就白干了。
&&& & &&这个地方讲评估客户好坏,有监督的学习,一定要定义他是违约还是整扣贷,还款能力、还款意愿。比较火,怎么体现的问题?我们讲我有一千多个变量,我有一万个变量,有传统的方法最后模型里边可能十几个变量,怎么理解这个事情?首先我们用好基础信息变量,传统客户指标用好?比如你每个月能挣多少钱?如果每个人两个变量可以体现,一个还款能力、还款意愿,其他所有变量都不要,教育、婚姻、旅游等,只有两个变量评价这个人借钱是不是还?其他变量几乎可以不要,现在模型为什么有这么多变量?就因为没有这两个变量,所以有变量探测,最后他每个变量做了多大贡献。你用一千变量也好、一万变相也好,其中肯定有排在前面几个非常小的。还有通过组成分析、业务规避也好,最后肯定体现某几个方面。比如芝麻分析用五个纬度,某些纬度可能几个变量体现。
互联网金融模型里边,不仅限于模型,网络欺诈、这个人稳定性等问题。下面是拼接的过程,我们做模型有监督的学习,大数据更多是X,X是输入变量,很多人说社交数据、水电煤数据也好,一定要把这些信息对应变量上,否则你那些模型持续不了。
& & & & 这是产出比的问题,大数据要落地的话,互联网风控领域要落地的话,什么情况下你可以用大数据?如果你已经形成商业闭环?比如我们淘宝、京东已经有也闭环,每个人登陆进去,我知道是谁,知道谁在网站很多行为信息、消费信息,这没有问题,他网站上所有大数据都可以用,但是有一个问题,即使像微信也好、淘宝也好,有几个亿,但是很多人没有账户信息的,怎么办?针对你这个客群建立的模型没法给更多人使用,这就是问题。一定考虑商业使用和模型的关系。
& & & & 另外大数据的收集。假如租赁公司身份,我们要的客人数据不知道这个人姓名、联系方式,你想用更多这方面信息不可能的。大数据在互联网金融领域里边用的广泛是反欺诈,你如果有反欺诈情况下,必须知道这个人姓名、联系方式和其他信息,这个情况下可以拼接大数据。
识别好处就是模型稳定性,假设历史规律跟未来规律相一致,如果不一致这个东西是没法用的。我们经常跟客户交流,我用多少数据才够?举一个例子,如果有两个变量,有六条数据覆盖变量组合,换个角度,你有一万变量理论应该是指数级增长,这个人模型用一千个变量,每个变量有两个属性、三个属性,他应该需要多少数据?还有一种你不管用多少变量,最是喜欢用事情看。
& & & & 这是数据仓库的事情,平常用的数据都是交易数据,我们要建一个模型要把交易数据弄到数据仓库里边去,你针对哪一个模型,要建模型必须从交易数据库把理想数据倒出来,这就是数据仓库的概念。
& & & & 这是数据结构化的问题,很多机构手机1很多信息,但是信息没法分析,我们想要图象变成信息。文本数据结构化,他填这么一个东西,要不要一个拆分,大家讲大数据或者文本处理实际做的就是这个事情,通过舆情分析把文本数据结构化。这个地方是数据收集问题,要客观准确,举一个例子本地人、外地人,但是每个人判断标准不一样,你工作收入多少、产品信息收入多少,我们后台业务规则根据具体业务需求判断是不是一致?一致就是本地人、不一致就是外地人。比如我本人是青岛,到北京工作,申请上海信贷产品,我算本地人还是外地人?很多人定义数据字典的时候不是特别清楚,呈现客户看的时候,客户不一定知道你想要的标准是什么?这个情况下要的客观信息。
& & & & 包括工资收入,很多人在网站填的区间形式,这不是我们想要的,隐含信息损失,我们要的准确的工资,根据算法算出来区间多少多少分,但是收集是区间形式,里边包含信息损失。衍生变量,很多人用多种模型基本用原来的变量,我们根据业务理解加衍生变量,这是资产负债表,这个变量比较显著。你工资多少不一定跟违约相关性,资产负债反映一个人真是还款能力,我收入一万,我借十万还能借吗?还不起,道理是这个道理。
& & & & 算法基本用标准的评分卡,很多网络可以对它做解释教研。打分数以后,一个看P值、一个看分数。产品来讲区分度也好,同样的产品用同样的方法,但是指标出来不一样,说明什么问题?客户说你这个指标不行、你这个算法不行,实际不是。数据按照他的商业规律就是这个样子,就是怎么认识的问题。为什么把业务定义放最底层?是做这个事情的基础,如果理解这个事情就正确做,否则变量会出现偏差。
& & & & 策略就不说了,把这个人分成层次,前一段我们CEO参加会议,他们提出为什么你们干不过非法集资?就是因为没有风险量化的东西,所有投资人认为,你这个产品风险都是一样的,相当于银行存钱一样,最后一定还。事实上不是这样,P2P定义利息比银行高一点,也是自己控制范围之内,非法集资同样情况下我给你更高的利息,投资人不知道背后有什么风险。这就为什么P2P干不过非法集资?非法集资出来必然利用人的心理,很多人不知道背后的事情,谁家利息给的过他就投。如果在座各位有钱或者各位家里亲戚投钱的话,看到网上投资产品,一定考虑背后的风险,一定考虑产品违约率多少?今天讲到这里,谢谢!
168大数据的发展离不开大家的支持!
*扫码打赏作者,本网站不收取任何费用!
上一篇:下一篇:
帖子永久地址:&<button type="submit" class="pn" onclick="setCopy('2015数据分析师峰会之 刘时斌:P2P金融评分卡模型\n/thread-.html', '帖子地址已经复制到剪贴板您可以用快捷键 Ctrl + V 粘贴到 QQ、MSN 里。')">推荐给好友
BI168大数据社区()是国内首家大数据职场社交圈,大数据深度交流社区,大数据社群媒体!
width:100%">
Hadoop交流群:
大数据课堂群:
猎聘100群:
Powered by文档分类:
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,
下载前请先预览,预览内容跟原文是一样的,在线预览图片经过高度压缩,下载原文更清晰。
您的浏览器不支持进度条
淘豆网网友近日为您收集整理了关于个人信用评分模型及评分系统研究的文档,希望对您的工作和学习有所帮助。以下是文档介绍:对外经济贸易大学硕士学位论文个人信用评分模型及评分系统研究姓名:李懋申请学位级别:硕士专业:产业经济学指导教师:赵星秋摘要2007年以来,美国次贷危机使全球金融市场和世界经济进入寒冬,金融业面临的最大风险——信用风险又一次摆在我们面前。我国金融开放程度不断加深,商业银行在国内外竞争日益加剧的形势下,能否有效地识别个人信用风险,成为个人金融业务健康持续发展的前提条件,也是我国经济和金融稳健运行的重要保障。其中,个人信用评分是识别信用风险的主流方法。个人信用评分是预测贷款申请人违约可能性的一种统计方法,它利用定量方法对贷款申请人的不同特征、对申请人拖欠和违约行为的影响进行分析。个人信用评分对不同的申请人产生不同的“分数”,商业银行可以利用这一分数对贷款申请人的违约风险进行评估。一个设计较好的信用评分模型使得那些表现好的客户得到高分数,而使得那些表现不好的客户得到低分数。本文便是在对信用风险,个人信用评分管理,神经网络和Lo#stic回归深入研究的基础上,针对我国商业银行信用风险管理的实际情况,构建个人信用评分模型,为商业银行和信用评估机构对个人的信用评估提供更加准确、科学的决策信息,本文的主要研究工作有:1. 基于真实的历史客户数据,抽象出客观科学的信用评分指标体系,并与实际金融业务结合起来分析。2. 采用多种建模方法,对比研究,结合模型的优势,建立基于神经网络和Lo#stic回归的单一模型和混合模型,在预测准确率和解释性上更进一步。3. 采用多种检验方法,保证模型的稳定性,并为进一步改进模型提出方向。4. 参考某银行的信用风险管理系统,进行信用评分卡设计和信用评分系统的研究。针对上述研究内容,本文进行了严密的解释和论证,结果表明,本文的理论,方法和结论正确有效,具有实际应用的前景。关键词:信用评分,评分系统,神经网络,Logistic回归AbstractSince 2007,U.S.subprime mortgage crisis brought global financial market intowinter.Credit risk,again embarrasses US.China’S financial openness deepenedceaselessly,under the circumstance of petition of banking.Whetherwe can effectively identify credit risk is a prerequisite of banking and sustainablefinance development.Credit Scoring is mainstream method to solve credit risk.Credit Scoring is a statistical method which could predict the loan default rate.Ituses quantitative methods toanalyze the different characteristics of loan applicant.Credit Scoring will give different score for different mercial Bankscould use this score to evaluate default rate of customers.A good model makes hiighmark for good performance clients and a low mark for poor performance clients.Based on in.depth study of credit risk,customer credit scoring,Logisticregression and work,in the light of actual situation of credit riskmanagemI proposed a Credit Scoring model which is acombination of work and Logistic regression, for more accurate andscientific decision.making of banks and agencies.Below is my main work:1、Through real historical data of clients,abstracts the objective scientific creditscoring index system,bining with actual financial business to analysis&#183;2、Using a variety of modeling parative bined with theadvantages of Logistic regression and work model,which can uracy in the further.3、Using various test methods,guarantee of the stability of the model,propose forthe further improvement of model.4、Reference of credit risk management system of a bank,do the design of thescoring card and analysis of scoring system..Based Oil the above research contents,I did strict interoperation and argumentation,in conclusion,the theory,method and result of this paper are correct and it haseffective and practical application prospect.Keywords:Credit Scoring,Scoring System,Logistic Regression,work2学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文所涉及的研究工作做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律责任由本人承担。特此声明学位论文作者签名:秀謦≯讳 S月≯l Et学位论文版权使用授权书本人完全了解对外经济贸易大学关于收集、保存、使用学位论文的规定,同意如下各1播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表个人信用评分模型及评分系统研究.pdf
文档介绍:
对外经济贸易大学硕士学位论文个人信用评分模型及评分系统研究姓名:李懋申请学位级别:硕士专业:产业经济学指导教师:赵星秋摘要2007年以来,美国次贷危机使全球金融市场和世界经济进入寒冬,金融业面临的最大风险——信用风险又一次摆在我们面前。我国金融开放程度不断加深,商业银行在国内外竞争日益加剧的形势下,能否有效地识别个人信用风险,成为个人金融业务健康持续发展的前提条件,也是我国经济和金融稳健运行的重要保障。其中,个人信用评分是识别信用风险的主流方法。个人信用评分是预测贷款申请人违约可能性的一种统计方法,它利用定量方法对贷款申请人的不同特征、对申请人拖欠和违约行为的影响进行分析。个人信用评分对不同的申请人产生不同的“分数”,商业银行可以利用这一分数对贷款申请人的违约风险进行评估。一个设计较好的信用评分模型使得那些表现好的客户得到高分数,而使得那些表现不好的客户得到低分数。本文便是在对信用风险,个人信用评分管理,神经网络和Lo#stic回归深入研究的基础上,针对我国商业银行信用风险管理的实际情况,构建个人信用评分模型,为商业银行和信用评估机构对个人的信用评估提供更加准确、科学的决策信息,本文的主要研究工作有:1. 基于真...
内容来自淘豆网转载请标明出处.
浏览:15次用别人设计不用给钱的吗?
别动手吃,先叫人来画下来,拿去秀一圈!
你是否早已笃定就这样度过你的生活,你是否一边在意别人的眼光一边心中不屑的嘶吼
尽管眼下距离“双11”还有足足三个月时间,但上海家化已经提前盯上了今年的“天猫双11狂欢夜”,并且,豪掷亿元
前两天有小白粉跟我说~小白哥最近你是不是死啦?都不直播了啊。OK,其实前一段时间,或者说最近一段时间~身体不
作者:爱上天蝎座地址:.cn/work/ZMTc3NDE2MzI=/
点线面是这么用的!
从生活的紧张和烦琐中抽身出来,放慢脚步,和自己的心灵对话。不攀附、不将就,把生活过成你想要的样子。
阿尔法工场股票大赛扫描文末二维码,参与比赛赢取大奖。}

我要回帖

更多关于 信用评分模型 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信