Advertisement

小象学院金融数据分析第二期

阅读量:

课程大纲:

第一课:数据分析基本知识复习(2课时)

1. 数据分析的基本概念

a. 目的

b. 数据获取和清理

c. 数据的描述性统计与可视化

2. 数据分析的常用模型

a. 监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络

b. 非监督式模型:聚类分析,因子分析,主成分分析

第二课:银行信贷客户的聚类分析-非监督式聚类(2课时)

1. 数值型变量的归一化

2. 类别型变量的编码

3. 距离的概念和种类

4. 闵可夫斯基距离

5. VDM(Value Difference Metric)距离

6. 聚类的性能度量

a. Davies-Bouldin Index

b. Dunn Index

7. K-均值算法的难题:如何选取k

第三课:银行信贷客户的聚类分析-非监督式聚类(续)(2课时)

1. 数据描述

2. 数据预处理的实操:归一化与编码

3. K-均值算法用于信贷客户的聚类分析

4. 层次聚类法用于信贷客户的聚类分析

第四课:银行信贷客户的聚类分析-半监督式聚类(2课时)

1. 半监督聚类

a. 约束K-均值算法

2. 带有少量标签的K-均值算法

第五课:行为评分卡模型的简介(2课时)

1. 个人信贷产品的简介及其中的各类风险

2. 什么是评分卡模型

3. 信用风险领域的评分卡模型

a. 申请评分卡

b. 行为评分卡

c. 催收评分卡

4. 评分卡模型的时间窗口概念

a. 表现期

b. 观察期

5. 拓展:PD模型与巴塞尔协议

第六课:行为评分卡模型的特征构造(2课时)

1. 训练集和测试集的划分

2. 特征构造

a. 逾期类型特征

b. 还款率类型特征

c. 使用率类型特征

d. 消费类型特征

e. 其他类型特征

3. 变量的分箱和WOE计算

第七课:行为评分卡模型的特征挑选(2课时)

1. IV的概念

2. 单变量分析

3. 多变量分析

4. 线性相关性

5. 多重共线性

第八课:行为评分卡模型的逻辑回归模型(2课时)

1. 逻辑回归模型的基本概念

a. 什么是逻辑回归

b. 逻辑回归中的参数估计

c. 逻辑回归的正则化:LASSO(L1约束) & Ridge(L2约束)

2. 用逻辑回归构造行为评分卡模型

3. 从概率到分数

第九课:行为评分卡模型的验证、监控和调优(2课时)

1. 评分卡模型常用的评价指标

a. KS

b. AR

c. PSI

d. Kendal’s Tau

2. Assigned PD & Actual PD

3. 模型监控的概念

a. 模型监控的频率

b. 模型监控的解读

4. 模型的调优

第十课:组合评分卡模型(2课时)

1. 组合模型概述

2. 串行结构的评分组合模型

3. 异态并行结构的评分组合模型

4. 同态并行结构的评分组合模型

全部评论 (0)

还没有任何评论哟~