利用生成式 AI 减少信用评分的偏差

Wei You Pan, Ashwin Gangadhar, and Jack Yallop

信用评分在确定谁获得信贷以及以何种条件获得信贷方面发挥着关键作用。然而,尽管这一点很重要,但传统的信用评分系统长期以来一直受到一系列关键问题的困扰 — 从偏见和歧视到有限的数据考虑和可扩展性挑战。例如,一项针对美国贷款的研究表明,与来自特权群体的借款人相比,少数族裔借款人被收取的利率更高 (+8%),被拒绝贷款的频率也更高 (+14%)。

僵化的信贷系统反应迟缓,无法快速适应不断变化的经济形势和消费者行为,这会导致一些人得不到充分服务并被忽视。为了解决这一问题,银行和其他贷款机构正在寻求采用人工智能来开发日益复杂的信用风险评分模型。'

在本文中,我们将了解信用评分的基础知识、当前系统面临的挑战,并深入探讨如何利用人工智能 (AI),特别是生成式 AI (genAI) 来减少偏差并提高准确性。从替代数据源的整合到机器学习 (ML) 模型的开发,我们将揭示 AI 在重塑信用评分未来方面的变革潜力。

请查看我们的 AI 资源页面,了解有关使用 MongoDB 构建 AI 驱动的应用的更多信息。

什么是信用评分?

信用评分是金融领域不可或缺的一个方面,是衡量个人信用状况的一个数字标准。贷方利用这一重要指标来评估与向个人或企业提供信贷或贷款相关的潜在风险。

传统上,银行依赖于通常使用线性回归或逻辑回归构建的预定义规则和统计模型。这些模型以历史信用数据为基础,重点关注支付历史、信用利用率和信用历史长度等因素。

但是,评估新的信用申请人是一项挑战,因此需要更准确的分析评估。为了满足传统上受到歧视的、得不到充分服务或服务不足的群体的需求,金融科技公司和数字银行正越来越多地将传统信用记录以外的信息与其他数据结合起来,以便更全面地了解个人的金融行为。

传统信用评分面临的挑战

信用评分是现代生活中不可或缺的一部分,因为它在各种金融交易(包括获得贷款、租房、购买保险,甚至是就业筛选)中起着至关重要的决定性作用。追求信用可能是一段迷宫般的旅程,传统信用评分模型存在一些挑战或限制,这些挑战或限制通常会阻碍信用申请的批准。

  • 有限的信用记录:许多人,尤其是那些刚接触信用游戏的人,都会遇到一个重大障碍 — 信用记录有限或根本不存在。传统的信用评分模型严重依赖于过去的信用行为,这使得没有良好信用记录的个人很难证明自己的信用度。大约有 4,500 万美国人缺乏信用评分,仅仅是因为他们没有这些数据点。

  • 收入不稳定:非经常性收入(这在兼职工作或自由职业中很常见)对传统的信用评分模型提出了挑战,可能会给个人贴上更高风险的标签,并导致其申请被拒绝或信用额度受到限制。关于 2023 年美国有多少人从事个体经营,数据来源各不相同。一个数据来源显示,有超过 2,700 万美国人提交了附表 C 纳税文件,其中涵盖了来自一项业务的净收入或损失 — 这突显了那些个体经营者对于不同信用评分方法的需求。

  • 现有信用利用率高:对现有信用的严重依赖往往被视为潜在财务压力的信号,从而影响信用决策。信用申请可能会面临拒绝或以不太有利的条件获得批准,这反映出对申请人明智地管理额外信用能力的担忧。

  • 拒绝原因不明确:即使了解申请被拒的原因也无法让申请人从根本上解决问题 — 在英国,2022 年 4 月至 2023 年 4 月期间的一项研究显示,申请被拒的主要原因包括“信用记录不良”(38%)、“无力偿还贷款”(38%)、“有太多其他信贷”(19%),还有 10% 的人表示没有被告知原因。即使给出了原因,往往也太模糊,让申请人一筹莫展,难以解决根本问题并提高他们未来申请的信用度。缺乏透明度不仅会给客户带来麻烦,还可能导致银行受到处罚。例如,2023 年,柏林一家银行因在拒绝信用卡申请时缺乏透明度而被罚款 30 万欧元。

  • 缺乏灵活性:消费者行为的转变,尤其是年轻一代对数字交易的青睐,对传统模式提出了挑战。零工经济的兴起、非传统就业、学生贷款债务和高昂的生活成本等因素使评估收入稳定性和财务健康状况变得更加复杂。在像新冠疫情这样前所未有的破坏事件中,传统的信用风险预测是有限的,在评分模型中没有考虑到这一点。

认识到这些挑战,就需要有替代的信用评分模型,以适应不断变化的金融行为,处理非传统的数据来源,并在当今动态变化的金融环境中提供更具包容性和更准确的信用度评估。

使用替代数据进行信用评分

替代信用评分是指使用非传统数据源(又名替代数据)和方法来评估个人信用度。传统的信用评分在很大程度上依赖于主要征信机构的信用记录,而替代信用评分则纳入了更广泛的因素,以更全面地反映个人的金融行为。以下是一些常用的替代数据源:

  • 公用事业付款:除信用记录外,持续支付水电等公用事业费用也是衡量财务责任的有力指标,显示了履行财务义务的决心,提供了传统指标之外的重要见解。

  • 租赁记录:对于没有抵押贷款的人来说,租金支付历史记录是一个重要的替代数据来源。持续、及时支付租金的表现全面反映了对财务纪律的遵守和可靠性。

  • 手机使用模式:手机的普及解锁了大量的替代数据。通过分析通话和短信模式,可以深入了解个人的网络、稳定性和社交关系,为信用评估提供有价值的信息。

  • 网上购物行为:对网购的频率、类型和金额进行研究,为了解消费行为提供了宝贵的信息,有助于对财务习惯有更细致的了解。

  • 教育和就业背景:替代信用评分考虑了个人的教育和就业经历。教育成就和稳定就业等积极指标在评估金融稳定性方面发挥着至关重要的作用。

这些替代数据源代表着向更具包容性、更细致入微、更全面的信用评估方法的转变。随着金融技术的不断进步,利用这些替代数据集可确保对信用度进行更全面的评估,标志着信用评分模型的发展迈出了变革性的一步。

使用人工智能进行替代信用评分

除了使用替代数据外,作为一种替代方法,人工智能已成为应对传统信用评分挑战的变革力量,原因有很多:

  • 减少偏见的能力:与传统的统计模型一样,人工智能模型(包括大型语言模型)在有偏见的历史数据上进行训练后,也会继承这些数据中存在的偏见,从而导致歧视性的结果。大型语言模型可能更关注某些特征而忽略其他一些特征,或者不能从更广泛的背景去理解个人财务状况,从而导致决策存在偏见。但是,有多种技术可以减少 AI 模型的偏见:
    • 缓解策略:从使用多样化和有代表性的培训数据开始,避免强化现有的偏见。不充分或无效的缓解策略可能会导致 AI 信用评分模型中持续出现有偏见的结果。细心关注收集的数据和模型开发对于减少这种偏见至关重要。将替代数据纳入信用评分在减少偏见方面发挥着关键作用。
    • 在训练过程中,严格的偏见检测工具、公平性约束和正则化技术可增强模型的问责性:平衡特征表示并采用后处理技术和专门算法有助于减少偏见。对模型进行全面评估、持续监控和迭代改进,同时结合对道德准则和管理规范的遵守,可以从多个层面减少人工智能模型中的偏见。这对于解决与历史信用数据中可能存在的人口或社会经济偏见有关的问题尤为重要。
    • 定期进行偏见审查:定期进行审查以识别并减少大型语言模型中的偏见。这可能涉及分析模型输出结果,以发现不同人口群体之间的差异,并相应调整算法。
    • 透明度和可解释性:提高大型语言模型的透明度和可解释性,以了解决策是如何做出的。这可以帮助识别和解决有偏见的决策过程。Trade Ledger 是一种贷款软件即服务 (SaaS) 工具,它使用数据驱动的方法,通过将具有不同模式的多个来源的数据整合到单个数据源中,以更高的透明度和可追溯性做出明智的决策。
  • 能够分析海量且多样化的数据集:与依赖预定义规则和历史信用数据的传统模型不同,AI 模型可以处理大量信息,包括非传统数据源,以对个人信用度进行更全面的评估,确保考虑到更广泛的金融行为。
  • AI 带来了无与伦比的适应性:随着经济条件的变化和消费者行为的演变,AI 驱动的模型可以快速调整并从新数据中学习。持续学习可确保信用评分在瞬息万变的金融环境中保持相关性和有效性。

对于在信用评分中使用 AI,银行最常见的反对意见与信用决策的透明度和可解释性相关。一些 AI 模型,尤其是深度学习算法,其本身的复杂性可能会导致难以为信用决策提供清晰的解释。幸运的是,AI 模型的透明度和可解释性已经取得了显著的进步。现在,SHAPley Additive exPlanations (SHAP) 值和 Local Interpretable Model-Agnostic Explanations (LIME) 图等技术以及可解释 AI (XAI) 领域的其他一些进步,让我们能够了解模型是如何做出具体信用决策的。这不仅增强了对信用评分过程的信任,还解决了 AI 模型是“黑匣子”的普遍批评。

了解利用通常以半结构化或非结构化格式出现的替代数据的重要性后,金融机构与 MongoDB 合作,以更快、更简单、更灵活的方式进行付款和提供信用,以增强其信用申请流程:

  • 作为印度尼西亚领先的一家数字银行,阿马尔银行正在为无法从传统银行获得金融服务(无银行账户和服务支持不足)的人群提供小额贷款,从而消除偏见。由于传统的承保流程不足以涵盖缺乏信用记录或抵押品的客户,因此该银行利用非结构化数据简化了贷款决策。该银行利用 MongoDB Atlas 开发了一个集成结构化和非结构化数据的预测性分析模型,用于评估借款人的信用水平。MongoDB 具备强大的可扩展性和多样化数据类型的管理能力,从而助力该银行扩展和优化贷款业务。

  • 对于绝大多数印度人来说,由于严格的监管和缺乏信用数据,获得信贷批准通常困难重重。通过使用现代承保系统,印度金融科技生态系统的领先创新者 Slice 正在简化其 KYC 流程,以提供更顺畅的信贷体验,从而拓宽印度人获得信贷的渠道。通过在不同的使用案例中使用 MongoDB Atlas(包括作为实时 ML 特征存储),slice 改变了他们的引导流程,将处理时间缩短至不到一分钟。slice 使用具有 MongoDB 和 ML 模型的实时功能存储来即时计算 100 多个变量,从而可以在不到 30 秒的时间内确定信贷资格。

使用生成式 AI 改变信用评分

在信用评分中除了使用替代数据和 AI 外,还有 GenAI,GenAI 具有创建合成数据和理解复杂模式的能力,提供更细致、更具适应性和预测性的方法,因此有可能彻底改变信用评分和评估。

GenAI 综合不同数据集的能力解决了传统信用评分的主要限制之一 — 对历史信用数据的依赖。通过创建反映现实世界金融行为的合成数据,GenAI 模型可以对信用度进行更具包容性的评估。这一变革性转变促进了金融包容性,为更广泛的人群获得信贷机会打开了大门。

适应性在驾驭动态发展的经济条件和不断变化的消费行为方面发挥着举足轻重的作用。传统模型难以适应不可预见的干扰,与之不同的是,GenAI 的持续学习和适应能力可确保信用评分保持实时有效,提供了一个更具弹性和响应能力的信用风险评估工具。除了预测能力之外,GenAI 还可以提高信用评分的透明度和可解释性。模型可以为其决策提供解释,为信用评估提供更清晰的见解,并增强消费者、监管机构和金融机构之间的信任。

然而,在使用 GenAI 的过程中,一个关键问题是幻觉问题,即模型提供的信息可能是毫无意义或完全错误的。有几种技术可以降低这种风险,其中一种是使用检索增强生成 (RAG) 方法。RAG 通过将模型的响应建立在最新来源的事实信息基础上,确保模型的响应反映最新、最准确的信息,从而最大限度地减少幻觉。

例如,Patronus AI 利用 RAG 和 MongoDB Atlas,使工程师能够在现实场景中对大型语言模型 (LLM) 性能进行评分和基准测试,大规模生成对抗性测试用例,并监控幻觉及其他意外和不安全的行为。这有助于大规模检测 LLM 错误,并安全、自信地部署 AI 产品。

MongoDB 的另一个技术合作伙伴是 Robust Intelligence。该公司的 AI 防火墙通过实时验证输入和输出来保护生产中的 LLM。它可以评估并降低幻觉等操作风险、包括模型偏见和有毒输出在内的道德风险,以及提示词注入和个人身份信息 (PII) 提取等安全风险。

随着生成式 AI 的不断成熟,将其融入信用评分和更广泛的信贷申请系统有望带来的不仅仅是技术进步,而是我们评估和发放信贷方式的根本性转变。

信贷史上的关键时刻

替代数据、人工智能和生成式 AI 的融合正在重塑信用评分的基础,标志着金融业进入了一个关键时刻。通过采用替代信用评分方法,提供更具包容性和更细致的评估,传统模式所面临的挑战正在被克服。生成式 AI 虽然会带来幻觉的潜在挑战,但它站在创新的前沿,不仅彻底改变了技术能力,而且从根本上重新定义了信用评估方式,开创了具有金融包容性、效率和公平的新时代。