Reduzindo o viés na pontuação de crédito com IA generativa

Wei You Pan, Ashwin Gangadhar, and Jack Yallop

A pontuação de crédito desempenha um papel fundamental na determinação de quem tem acesso ao crédito e em quais condições. No entanto, apesar de sua importância, os sistemas tradicionais de pontuação de crédito há muito tempo são afetados por uma série de problemas críticos, desde vieses e discriminação até a consideração limitada de dados e desafios de escalabilidade. Por exemplo, um estudo sobre empréstimos nos EUA mostrou que as minorias cobraram taxas de juros mais altas (+8%) e rejeitaram empréstimos com mais frequência (+14%) do que os mutuários de grupos mais privilegiados.

A natureza rígida dos sistemas de crédito significa que eles podem ser lentos para se adaptar às mudanças nos cenários econômicos e à evolução dos comportamentos dos consumidores, deixando algumas pessoas desassistidas e negligenciadas. Para superar esse problema, os bancos e outros credores estão procurando adotar a inteligência artificial para desenvolver modelos cada vez mais sofisticados para avaliar o risco de crédito.

Neste artigo, exploraremos os fundamentos da pontuação de crédito, os desafios que os sistemas atuais apresentam e nos aprofundaremos em como a inteligência artificial (IA), em especial a IA generativa (genAI), pode ser aproveitada para mitigar vieses e melhorar a precisão. Desde a incorporação de fontes de dados alternativas até o desenvolvimento de modelos de aprendizado de máquina (ML), descobriremos o potencial transformador da IA para remodelar o futuro da pontuação de crédito.

Confira nossa página de recursos de IA para saber mais sobre como criar aplicativos baseados em IA com o MongoDB.

O que é pontuação de crédito?

A pontuação de crédito é um aspecto integral do cenário financeiro, servindo como um indicador numérico da capacidade de crédito de um indivíduo. Essa métrica vital é empregada pelos credores para avaliar o risco potencial associado à concessão de crédito e aos empréstimos a pessoas ou empresas.

Tradicionalmente, os bancos se baseiam em regras predefinidas e modelos estatísticos, geralmente construídos por meio de regressão linear ou regressão logística. Os modelos são baseados em dados históricos de crédito, concentrando-se em fatores como histórico de pagamentos, utilização de crédito e duração do histórico de crédito.

No entanto, a avaliação de novos solicitantes de crédito representa um desafio, levando à necessidade de um perfil mais preciso. Para atender aos segmentos carentes ou não atendidos, tradicionalmente discriminados, as fintechs e os bancos digitais estão incorporando cada vez mais informações além do histórico de crédito tradicional, com dados alternativos para criar uma visão mais abrangente do comportamento financeiro de um indivíduo.

Desafios da pontuação de crédito tradicional

As pontuações de crédito são parte integrante da vida moderna porque servem como um determinante crucial em várias transações financeiras, incluindo a obtenção de empréstimos, o aluguel de um apartamento, a obtenção de seguros e, às vezes, até mesmo em exames de emprego. Como a busca de crédito pode ser uma jornada labiríntica, aqui estão alguns dos desafios ou limitações dos modelos tradicionais de pontuação de crédito que, muitas vezes, obscurecem o caminho para a aprovação da solicitação de crédito.

  • Histórico de crédito limitado: muitas pessoas, especialmente aquelas que são novas no jogo do crédito, encontram um obstáculo significativo – histórico de crédito limitado ou inexistente. Os modelos tradicionais de pontuação de crédito dependem muito do comportamento de crédito anterior, o que torna difícil para indivíduos sem um histórico de crédito sólido comprovar sua capacidade de crédito. Cerca de 45 milhões de americanos não têm pontuação de crédito simplesmente porque esses dados não existem para eles.

  • Renda inconsistente: a renda irregular, típica do trabalho de meio período ou freelancer, representa um desafio para os modelos tradicionais de pontuação de crédito, rotulando potencialmente os indivíduos como de maior risco e levando a recusas de aplicação ou limites de crédito restritivos. Em 2023, nos Estados Unidos, as fontes de dados divergem sobre a quantidade de pessoas autônomas. Uma fonte mostra que mais de 27 milhões de americanos apresentaram documentos fiscais do Schedule C, que cobrem a renda líquida ou a perda de um negócio – destacando a necessidade de métodos diferentes de pontuação de crédito para os autônomos.

  • Alta utilização do crédito existente: a forte dependência do crédito existente é frequentemente percebida como um sinal de possível tensão financeira, influenciando as decisões de crédito. As solicitações de crédito podem ser rejeitadas ou aprovadas com termos menos favoráveis, refletindo preocupações sobre a capacidade do solicitante de obter crédito adicional de forma criteriosa.

  • Falta de clareza nos motivos da rejeição: a compreensão dos motivos por trás das rejeições impede que candidatos abordem as causas principais – no Reino Unido, um estudo entre abril de 2022 e abril de 2023 mostrou que os principais motivos para a rejeição incluíam "histórico de crédito ruim" (38%), "não podia arcar com os pagamentos" (28%), "ter muitos outros créditos" (19%) e 10% disseram que não foram informados do motivo. Os motivos, mesmo quando apresentados, costumam ser muito vagos, o que deixa os solicitantes no escuro, dificultando a solução da causa principal e o aprimoramento de sua capacidade de crédito para futuras aplicações. A falta de transparência não é apenas um problema para os clientes, mas também pode levar a uma penalidade para os bancos. Por exemplo, um banco de Berlim foi multado em 300 mil euros em 2023 por falta de transparência ao recusar uma aplicação de cartão de crédito.

  • Falta de flexibilidade: as mudanças no comportamento do consumidor, especialmente entre as gerações mais jovens que preferem as transações digitais, desafiam os modelos tradicionais. Fatores como o aumento da economia do bico, empregos não tradicionais, dívidas de empréstimos estudantis e altos custos de vida complicam a avaliação da estabilidade da renda e da saúde financeira. As previsões tradicionais de risco de crédito são limitadas durante interrupções sem precedentes, como a COVID-19, não levando isso em consideração nos modelos de pontuação.

O reconhecimento desses desafios destaca a necessidade de modelos alternativos de pontuação de crédito que possam se adaptar à evolução dos comportamentos financeiros, lidar com fontes de dados não tradicionais e fornecer uma avaliação mais inclusiva e precisa da capacidade de crédito no dinâmico cenário financeiro atual.

Pontuação de crédito com dados alternativos

A pontuação de crédito alternativa se refere ao uso de fontes de dados não tradicionais (também conhecidos como dados alternativos) e métodos para avaliar a capacidade de crédito de um indivíduo. Embora a pontuação de crédito tradicional dependa muito do histórico de crédito das principais agências de crédito, a pontuação de crédito alternativa incorpora uma gama mais ampla de fatores para criar um quadro mais abrangente do comportamento financeiro de uma pessoa. Abaixo estão algumas das fontes de dados alternativas populares:

  • Pagamentos de serviços públicos: Além do histórico de crédito, os pagamentos consistentes de serviços públicos, como eletricidade e água, oferecem um indicador poderoso de responsabilidade financeira e revelam um compromisso com o cumprimento das obrigações financeiras, fornecendo insights cruciais além das métricas tradicionais.

  • Histórico de aluguel: para aqueles que não têm uma hipoteca, o histórico de pagamento de aluguel surge como uma fonte de dados alternativa importante. A demonstração de pagamentos consistentes e pontuais de aluguéis mostra um quadro abrangente de disciplina e confiabilidade financeira.

  • Padrões de uso de celulares: a onipresença dos telefones celulares revela uma grande variedade de dados alternativos. A análise dos padrões de chamadas e mensagens de texto fornece insights sobre a rede, a estabilidade e as conexões sociais de um indivíduo, contribuindo com informações valiosas para avaliações de crédito.

  • Comportamento de compras on-line: o exame da frequência, do tipo e do valor gasto em compras on-line oferece informações valiosas sobre o comportamento de gastos, contribuindo para uma compreensão mais detalhada dos hábitos financeiros.

  • Histórico educacional e profissional: a pontuação de crédito alternativa considera o histórico educacional e de emprego de um indivíduo. Indicadores positivos, como histórico escolar e emprego estável, desempenham um papel fundamental na avaliação da estabilidade financeira.

Essas fontes de dados alternativas representam uma mudança em direção a uma abordagem mais inclusiva, matizada e holística das avaliações de crédito. À medida que a tecnologia financeira continua avançando, a utilização desses conjuntos de dados alternativos garante uma avaliação mais abrangente da capacidade de crédito, marcando uma etapa transformadora na evolução dos modelos de pontuação de crédito.

Pontuação de crédito alternativa com inteligência artificial

Além do uso de dados alternativos, o uso de IA como um método alternativo surgiu como uma força transformadora para enfrentar os desafios da pontuação de crédito tradicional, por vários motivos:

  • Capacidade de atenuar a parcialidade: assim como os modelos estatísticos tradicionais, os modelos de IA, inclusive os LLMs, treinados em dados históricos enviesados herdarão as tendências presentes nesses dados, levando a resultados discriminatórios. Os LLMs podem se concentrar mais em determinados recursos do que em outros ou podem não ter a capacidade de entender o contexto mais amplo da situação financeira de um indivíduo, o que leva a uma tomada de decisão tendenciosa. No entanto, existem várias técnicas para mitigar o viés dos modelos de IA:
    • Estratégias de mitigação: as iniciativas começam com o uso de dados de treinamento diversificados e representativos para evitar o reforço de vieses existentes. Estratégias de mitigação inadequadas ou ineficazes podem resultar em resultados tendenciosos que persistem nos modelos de pontuação de crédito de IA. A atenção cuidadosa aos dados coletados e ao desenvolvimento do modelo é fundamental para mitigar esse viés. A incorporação de dados alternativos para pontuação de crédito desempenha um papel crucial na redução de vieses.
    • Ferramentas rigorosas de detecção de vieses, restrições de equidade e técnicas de regularização durante o treinamento aprimoram a responsabilidade do modelo: o equilíbrio da representação de recursos e o emprego de técnicas de pós-processamento e algoritmos especializados contribuem para a mitigação de vieses. Avaliação de modelos inclusivos, monitoramento contínuo e melhoria iterativa, juntamente com a aderência a diretrizes éticas e práticas de governança, completam uma abordagem multifacetada para reduzir o viés em modelos de IA. Isso é particularmente importante para tratar de preocupações relacionadas a vieses demográficos ou socioeconômicos que possam estar presentes em dados históricos de crédito.
    • Auditorias regulares de viés: realize auditorias regulares para identificar e mitigar vieses em LLMs. Isso pode envolver a análise dos resultados do modelo quanto a disparidades entre grupos demográficos e o ajuste adequado dos algoritmos.
    • Transparência e explicabilidade: aumente a transparência e a explicabilidade nos LLMs para entender como as decisões são tomadas. Isso pode ajudar a identificar e abordar processos decisórios enviesados. O Trade Ledger, uma ferramenta de software como serviço (SaaS) para empréstimos, usa uma abordagem orientada por dados para tomar decisões informadas com maior transparência e rastreabilidade, reunindo dados de várias fontes com diferentes esquemas em uma única fonte de dados.
  • Capacidade de analisar conjuntos de dados vastos e diversificados: ao contrário dos modelos tradicionais que se baseiam em regras predefinidas e dados históricos de crédito, os modelos de IA podem processar uma infinidade de informações, inclusive fontes de dados não tradicionais, para criar uma avaliação mais abrangente da capacidade de crédito de um indivíduo, garantindo que uma gama mais ampla de comportamentos financeiros seja considerada.
  • A IA traz uma adaptabilidade inigualável: à medida que as condições econômicas mudam e os comportamentos dos consumidores evoluem, os modelos alimentados por IA podem se ajustar rapidamente e aprender com novos dados. O aspecto do aprendizado contínuo garante que a pontuação de crédito permaneça relevante e eficaz diante de cenários financeiros em constante mudança.

As objeções mais comuns dos bancos para não usar IA na pontuação de crédito são a transparência e a explicabilidade nas decisões de crédito. A complexidade inerente de alguns modelos de IA, especialmente os algoritmos de aprendizagem profunda, pode levar a desafios no fornecimento de explicações claras para as decisões de crédito. Felizmente, a transparência e a interpretabilidade dos modelos de IA têm visto avanços significativos. Técnicas como os valores SHAP (SHapley Additive exPlanations) e os gráficos LIME (Local Interpretable Model-Agnostic Explanations) e vários outros avanços no domínio da XAI (Explainable AI) agora nos permitem entender como o modelo chega a decisões de crédito específicas. Isso não apenas aumenta a confiança no processo de pontuação de crédito, mas também aborda a crítica comum de que os modelos de IA são "caixas pretas."

Compreendendo a importância de aproveitar dados alternativos que geralmente vêm em um formato semi ou não estruturado, as instituições financeiras trabalham com o MongoDB para aprimorar seus processos de aplicação de crédito com uma maneira mais rápida, simples e flexível de fazer pagamentos e oferecer crédito:

  • O Amar Bank, principal banco digital da Indonésia, está combatendo vieses através do fornecimento de microempréstimos para pessoas que não seriam capazes de obter serviços financeiros de bancos tradicionais (desbancarizados e mal servidos). Os processos tradicionais de subscrição eram inadequados para clientes sem histórico de crédito ou garantias, portanto, eles simplificaram as decisões de empréstimo aproveitando dados não estruturados. Utilizando o MongoDB Atlas, eles desenvolveram um modelo de análise preditiva integrando dados estruturados e não estruturados para avaliar a capacidade de crédito do mutuário. A escalabilidade e a capacidade do MongoDB de gerenciar diversos tipos de dados foram fundamentais para expandir e otimizar suas operações de empréstimo.

  • Para a grande maioria dos indianos, a obtenção de crédito é normalmente um desafio devido a regulamentações rigorosas e à falta de dados de crédito. Por meio do uso de sistemas modernos de subscrição, a Slice, uma inovadora líder no ecossistema de fintech da Índia, está ajudando a ampliar a acessibilidade ao crédito na Índia, simplificando o processo de KYC para uma experiência de crédito mais tranquila. Ao utilizar o MongoDB Atlas em diferentes casos de uso, inclusive como um armazenamento de recursos de ML em tempo real, a slice transformou seu processo de integração, reduzindo o tempo de processamento para menos de um minuto. O slice usa o armazenamento de recursos em tempo real com MongoDB e modelos de ML para calcular mais de 100 variáveis instantaneamente, permitindo a determinação da elegibilidade de crédito em menos de 30 segundos.

Transformando a pontuação de crédito com IA generativa

Além do uso de dados alternativos e IA na pontuação de crédito, a GenAI tem o potencial de revolucionar a pontuação e a avaliação de crédito com sua capacidade de criar dados sintéticos e entender padrões complexos, oferecendo uma abordagem mais matizada, adaptativa e preditiva.

A capacidade da GenAI de sintetizar diversos conjuntos de dados aborda uma das principais limitações da pontuação de crédito tradicional – a dependência de dados históricos de crédito. Ao criar dados sintéticos que espelham os comportamentos financeiros do mundo real, os modelos GenAI permitem uma avaliação mais inclusiva da capacidade de crédito. Essa mudança transformadora promove a inclusão financeira, abrindo portas para que um grupo demográfico mais amplo tenha acesso a oportunidades de crédito.

A adaptabilidade desempenha um papel crucial na navegação pela natureza dinâmica das condições econômicas e na mudança dos comportamentos do consumidor. Ao contrário dos modelos tradicionais, que lutam para se ajustar a interrupções imprevistas, a capacidade da GenAI de aprender e se adaptar continuamente garante que a pontuação de crédito permaneça eficaz em tempo real, oferecendo uma ferramenta mais resiliente e responsiva para avaliar o risco de crédito. Além de sua capacidade de previsão, a GenAI pode contribuir para a transparência e a interpretabilidade da pontuação de crédito. Os modelos podem gerar explicações para suas decisões, fornecendo percepções mais claras sobre as avaliações de crédito e aumentando a confiança entre consumidores, órgãos reguladores e instituições financeiras.

No entanto, uma das principais preocupações ao usar a GenAI é o problema da alucinação, em que o modelo pode apresentar informações sem sentido ou totalmente falsas. Há várias técnicas para mitigar esse risco, e uma delas é usar a abordagem RAG (Retrieval Augment Generation). O RAG minimiza as alucinações ao fundamentar as respostas do modelo em informações factuais de fontes atualizadas, garantindo que as respostas do modelo reflitam as informações mais atuais e precisas disponíveis.

A Patronus AI, por exemplo, utiliza o RAG com o MongoDB Atlas para permitir que os engenheiros pontuem e avaliem o desempenho de grandes modelos de linguagem (LLMs) em cenários do mundo real, gerem casos de teste adversários em escala e monitorem alucinações e outros comportamentos inesperados e inseguros. Isso pode ajudar a detectar erros de LLM em escala e implementar produtos de IA com segurança e confiança.

Outro parceiro de tecnologia do MongoDB é o Robust Intelligence. O AI Firewall da empresa protege os LLMs em produção, validando entradas e saídas em tempo real. Ele avalia e mitiga riscos operacionais, como alucinações, riscos éticos, incluindo viés de modelo e resultados tóxicos, e riscos de segurança, como injeções imediatas e extrações de informações de identificação pessoal (PII).

À medida que a IA generativa continua a amadurecer, sua integração à pontuação de crédito e aos sistemas mais amplos de aplicação de crédito promete não apenas um avanço tecnológico, mas uma transformação fundamental na forma como avaliamos e concedemos crédito.

Um momento crucial na história do crédito

A convergência de dados alternativos, inteligência artificial e IA generativa está reformulando os fundamentos da pontuação de crédito, marcando um momento crucial no setor financeiro. Os desafios dos modelos tradicionais estão sendo superados com a adoção de métodos alternativos de pontuação de crédito, oferecendo uma avaliação mais inclusiva e diferenciada. A IA generativa, embora apresente o possível desafio da alucinação, representa a vanguarda da inovação, não apenas revolucionando os recursos tecnológicos, mas redefinindo fundamentalmente a forma como o crédito é avaliado, promovendo uma nova era de inclusão financeira, eficiência e justiça.