银行贷款发放信用评价问题数学模型 第3页
(1) 利用 算子的思想,构建缺省信息均值
, (4)
其中, 为申请贷款企业的总数,本文取600
为第 个属性的权值系数
为第 个申请贷款企业的第 个属性值
(2)缺省信息均值运算法则
定义: 运算 (5)
其中, 为第 个未知属性值表示符号
(3)修正Logistic回归模型
将所求得的缺省信息均值 ,按照其运算法则,建立了修正Logistic回归模型:
(6)
其中, 属性变量总个数,本文取15
第 个待申请贷款企业第 个属性的值
第 个待申请贷款企业的违约概率
第 个待申请贷款企业的信用值
五、模型求解
5.1 Logistic回归模型的求解与问题求解
5.1.1 模型求解
通过SPSS统计软件对Logistic回归模型求解,得到个属性的权值系数 为
通过求解Logistic回归模型,得到判别准则:
(7)
5.1.2 问题求解及分析
利用该判别准则对600个申请贷款企业进行打分和吻合度分析:
(1)对剔除64个奇异点外,所剩的536个企业进行重新打分和吻合度分析
利用C++编程(见附表三)求得打分结果(见附表四),并对打分结果进行统(见表三)
表三 打分吻合度统计
重新打分
+ - 吻合度 总 计
原始打分 + 253 2 99.2% 98.5%
- 6 175 96.7%
从表三中看出,与原始打分情况相比,共有8个数据不符。通过回代检验,可以看出判别准则的吻合度达到98.5%,证明判别准则吻合度很高,可以对银行的高层管理者提供极具价值的决策手段和依据。
(2)对64个奇异点单独进行重新打分和吻合度分析
利用C++编程求得打分结果(见附表五 ),并对打分结果进行统(见表四)
表四 奇异点打分统计
重新打分
+ -
原始打分 + 0 48
- 16 0
从表四中看出,对奇异点重新打分的结果与原始打分的结果恰好完全相反,更进一步验证了4.13对数据进行深挖掘的合理性和正确性,也验证了此64个申请贷款企业资料的真实性置信度差。因此,对向银行提供的背景资料必须进行数据预处理,这样可以有效减少银行的金融风险。
5.1.3 对待申请企业中的前53名打分和吻合度分析
利用C++编程求得打分结果(见附表六),在附表六中y值打‘+’的不予贷款,打 ‘-’的可以给予贷款。由于该预测是通过Logistic回归模型求得的评判准则进行预测的,而由表三知道该准则具有极高的吻合度。因此,对53名申请贷款企业的打分值具有极高的置信度,能够很好的确定是否为其提供贷款,有效的减少了银行金融风险。
5.2修正Logistic回归模型的求解与分析
5.2.1修正Logistic回归模型的求解
利用C++编程(见附表七),求得缺省信息均值 。
通过求解修正Logistic回归模型,得到修正判别准则: (8)
5.2.2对待申请企业中的后37名信息不全的申请贷款企业打分和吻合度分析
利用该修正判别准则,通过C++编程(见附录八)对(题目表3中)后37名信息不全的申请贷款企业进行打分,结果见附表九 。在附表九中y值打‘+’的不予贷款,打 ‘-’可以给予贷款。
为了验证该修正准则的吻合度,首先,本文从600个申请贷款企业随机抽取75个样本,其中打分值为‘+’的有43个,打分值为‘-’的有32个。然后,随机丢失若干属性信息,造成信息不全的假象。最后,通过该修正准则进行回代检验。打分结果见附表十,统计结果见表五。
表五 打分吻合度统计
重新打分
+ - 吻合度 总计
原始打分 + 43 0 100% 86.7%
- 10 22 68.75%
由表五得出:
(1)对打分为‘+’的企业,该修正准则具有100%吻合度,但是对打分为‘-’的企业有68.75%吻合度,综合平均吻合度达到86.7%。因此,即使在申请贷款企业信息不全的情况下,该修正准则仍有比较高的吻合度(86.7%),尤其是对打分为‘+’的预测效果达到100%。
(2)对不发放贷款的企业的原始打分与重新打分完全相同,同时对可以发放贷款的企业却不发放的企业占可以发放贷款企业总数的31.25%。这就是说为了尽可能的减少银行贷款的金融风险,以牺牲一部分可以发放贷款的企业为代价,采取了风险最小化原则,而这一点在实际贷款中体现出其发放贷款的严格性。
六、模型的改进及评价
6.1模型的改进
模型改进一:Logistic回归模型的改进
在4.2.1 Logistic回归模型中,若要取得更高的吻合度,应该对模型的算法进行改进,选择更优秀的软件,进一步简化模型,可减少模型的求解规模,提高权值系数的精度。
模型改进二:修正Logistic回归模型
在4.2.2修正Logistic回归模型中,本模型仅采用了 算子的思想。因此,还可以利用其他 、 、 、 算子的思想,分别构建出缺省信息均值 。然后,对各个 对应的修正Logistic回归模型重新求解,得到相应的修正判别准则。最后,从600个样本中随机抽取若干个样本,再通过随机丢失若干属性信息,造成信息不全的假象,通过回代检验,选择其中吻合度最高的那种算子思想。这样可以提高吻合度,有效减少银行的金融风险。
6.2模型的评价
优点:
第一,巧妙地构建字符型取值数值化公式,合理的将离散型变量(取值均为字符型)取值数值化。
第二,巧妙地利用Logistic函数 的性质(如图二),建立了Logistic回归模型。
第三,判别准则打分直观、简易和有效,一般的计算器工具就可以很容易实现。
第四,通过判别准则对打分值预测的综合平均吻合度高达98.5%,解决了使打分与原打分尽可能相吻合的目的。
第五,利用 算子的思想,创造性的构建了缺省信息值 ,对缺省信息进行了有效地处理。从而合理的对判别准则Logistic回归模型进行了修正,有效的解决了即使在申请贷款企业信息不全的情况下也可以确定是否对该类企业提供贷款。
第六,由表五可以得出,修正判别准则以优先考虑金融风险最小化原则对企业资料信息不全进行打分,确定是否提供贷款。
缺点:
第一, 背景资料的筛选方法有待进一步优化和改进。
第二, 发现的64个奇异点,可能存在误判的情况。
第三, 缺省信息均值 的方法有待进一步优化和改进,或者通过其他方式以达到提高吻合度的目的。
上一页 [1] [2] [3] [4] [5] [6] [7] 下一页