基于深度学习的金融风控模型实践

发布于 2 天前
12,000 次阅读
机器学习金融风控

关联数据集

A股上市公司季度财报

查看详情
数据的质量直接决定了模型效果的上限。在特征工程阶段,我们从原始数据中提取了超过200个特征,涵盖了财务指标、交易行为、关联网络等多个维度。

关键特征包括:

**财务比率衍生特征**: 如流动比率、速动比率、资产负债率等,反映企业短期偿债能力和长期财务结构。

**交易行为序列特征**: 利用LSTM网络捕捉用户近期交易金额、频率、时间的序列模式。

**社交网络关联特征**: 基于Graph Embedding技术,将用户的社交关系网络转化为向量表示,用于识别团伙欺诈。

3. 模型选择与构建

我们对比了多种模型,包括逻辑回归、XGBoost以及一个定制的深度神经网络(DNN)。

python
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Dropout, BatchNormalization
from tensorflow.keras.models import Model

def create_fraud_detection_model(input_shape):
    inputs = Input(shape=(input_shape,))
    x = BatchNormalization()(inputs)
    x = Dense(256, activation='relu')(x)
    x = Dropout(0.4)(x)
    x = Dense(128, activation='relu')(x)
    x = Dropout(0.4)(x)
    x = Dense(64, activation='relu')(x)
    outputs = Dense(1, activation='sigmoid')(x)
    
    model = Model(inputs=inputs, outputs=outputs)
    
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=1e-4),
                  loss='binary_crossentropy',
                  metrics=['accuracy', tf.keras.metrics.Precision(), tf.keras.metrics.Recall()])
    return model

# 使用模型
# model = create_fraud_detection_model(input_shape=X_train.shape[1])
# history = model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=50, batch_size=1024)

关联模型

ResNet-50 图像分类模型

查看详情

评论 (45)

张嘉然已采纳
昨天

文章中提到的将ResNet用于表格数据的思路非常新颖,能详细讲讲特征表示方法吗?期待作者的下一篇文章!

2天前

写得非常深入,特别是关于特征工程的部分,对我启发很大!

陈思宇作者
2天前

谢谢!特征工程确实是关键,我们花了很多时间打磨。

1天前

请问你们在处理缺失值时有什么特别的技巧吗?我们通常用均值或中位数填充,但效果不太理想。

3小时前

很棒的分享,已收藏!准备在我们自己的风控项目里试试这个思路。