【论文以Prosper平台的交易数据为样本,采用多种统计方法研究发现:初始利率、借款金额、信用等级、负债收入比和当前违约次数是影响P2P借贷的最主要因素。文章从三个方面展开:第一,确定影响竞拍结果的主要因素;第二,确定可由借款人决定且能影响竞拍结果的主要因素;第三,开发一种框架和方案从量化的角度比较不同借款决策的优劣。最大的亮点在于为借款人开发出了一种适用于网络拍卖机制的决策系统,以帮助他们在第一次借款时就能提供对投资者具有吸引力的借款申请信息。】
作者以Prosper网络借贷平台上2006年5月至2008年7月的真实交易数据为样本,运用成对相关性检验(Pairwise correlation tests)、线性回归(OLS回归和Logistic回归)和查询法(Query method)等多种统计分析方法,创新性地站在需向平台提供借款申请的借款人的视角进行实证分析,为借款人在竞拍机制下科学地做出与借款成功率和最终借款利率相关的策略性决策提供一种全新的量化系统。文章与现有文献相比最大的创新之处在于以现有的理论和实证分析为基础,开发出适用于P2P借贷交易中的借款人合理选择其借款金额、起始借款利率的辅助决策系统,该系统囊括了对借款最终结果产生影响的诸多重要因素。
初始利率、借款金额、信用等级、负债收入比和当前违约次数是影响P2P借贷的最主要因素
之所以要建立此辅助决策系统,主要是因为在传统竞拍中,发标人和拍卖商的角色是一致的,且竞拍模式一般由发标人自主决定,而在新型的互联网竞拍中,发标人和拍卖商的角色往往是不同的,拍卖商就是促成交易的P2P借贷平台,且发标人只能服从拍卖商选用的竞拍模式,即借款人的决策会被P2P平台选定的竞拍机制所限制,借款人提交的借款申请中的信息,尤其是那些由借款人自行决定的变量信息(如初始利率、借款金额等),将会直接影响借款成功率和借款利率。然而,现有的关于此类变量对P2P网络借贷行为的影响的研究结论存在较大的差异,对借款人发布标的信息的指导作用较小。此外,根据描述性统计可知,在样本期间高达48%的借款人都同时发布多个借款申请,且在同一时间段内拥有多个借款申请的人中,有77%的借款人至少有过一次借款失败的经历,所以很有必要为借款人开发出一种适用于网络拍卖机制的决策系统,以帮助他们在第一次借款时就能提供对投资者具有吸引力的借款申请信息。基于此,文章从以下三个方面展开:第一,确定影响竞拍结果(即借款人获得贷款的可能性)的最为重要的因素;第二,确定最重要的可由借款人支配的且能影响竞拍结果的因素;第三,开发一种框架和方案从量化的角度比较不同借款决策的优劣。
具体而言,文章首先运用成对相关性检验来确定对借款成功率影响较大的因素,即分别在全样本和信用等级为A、信用等级为D的两组子样本中计算借款人可影响的变量(即决策变量,包括借款金额、初始利率、筹资方式和竞拍期限)和借款人不可影响变量(即信用变量,包括信用等级、负债收入比、是否有房产权、当前违约次数、近7年的违约次数、违约金额和收入)与借款成功率的相关系数,并检验系数的显著性以及两组分样本之间相关系数的差异性,结果表明:初始利率、借款金额、信用等级、负债收入比和当前违约次数是影响借款成功率的最主要因素。因此,借款人辅助决策系统将根据这组变量来设计。
其次,文章以借款成功率为被解释变量,以初始利率、借款金额、负债收入比和当前违约次数为解释变量,分别对以信用等级为划分标准的子样本进行Logistic回归,结果表明:初始利率与借款成功率成正比,而其他三个解释变量与借款成功率表现出显著的负相关性。此外,文章还依次将借款金额、初始利率、负债收入比和当前违约次数加入Logistic模型中进行逐步回归,通过观察Pseudo-R2的变化发现,在增加这四个变量的过程中,模型的拟合度大幅度增加,但在回归中加入其他变量却无法显著改善模型。
接着,文章采用查询法展开分析,查询法是一种直观的决定借款成功率的数据驱动方法,通过事先设定变量取值及其变化范围,在现有的数据库中寻找相似的借款标的,并对比查询法和Logistic回归的统计结果,研究表明:在设定信用等级为A、负债收入比为40、当前违约次数为0和借款金额为5000美元时,若起始利率在9%至17%之间,则查询法和Logistic回归的估计结果相似;若起始利率小于7%,则两种方法均不可信;若起始利率大于17%,则真实借款成功率介于两种方法给出的估计值之间。此外,若将初始利率固定为15%,保持借款金额在1000美元至25000美元之间变动,则仍发现查询法和回归法得到的估计值相似,并且分别给出了真实借款成功率估的上界和下界。
再者,文章筛选出成功获得贷款的样本,将上述回归中的被解释变量换为最终利率,解释变量不变,并对各个信用等级的子样本进行OLS回归,实证发现除了信用等级为C时的借款金额和信用等级为HR时的负债收入比这两个变量外,其他变量在各个子样本中均显著。根据回归系数计算出不同信用等级下最终利率的估计值,对比可知借款人的信用等级越差,最终利率的估计值增加的越快。
最后,基于上述实证分析可知,借款人必须在最终借款利率和借款成功率之间做权衡,故文章开发并建立了借款人决策帮助网站(Borrower Decision Aid website),以帮助借款人在借款成本和成功率之间做出最优决策。借款人只需在该网站上输入信用等级、负债收入比、当前违约次数、借款金额和初始利率这五个显著影响借款成功率的变量值,即可估算出其获得借款的概率和最终借款利率,而借款成功率和最终借款利率的计算原理就是实证过程中运用到的OLS回归、Losistic回归和查询法。
本文转自微信公众号“互联网金融前沿研究速递”精选推送国内外互联网金融学顶级期刊最新论文。属于“武汉大学互联网金融团队(WHUITFIN)”,由武汉大学经济与管理学院金融系彭红枫教授及其研究团队负责。扫码即可关注。
未经允许不得转载:武大金融网 » 【学术动态】《Decision Support Systems》:Borrower decision aid for people-to-people lending