생성형 인공지능으로 신용 평점 편향성 줄이기

Wei You Pan, Ashwin Gangadhar, and Jack Yallop

신용 대출 대상과 조건을 결정하는 과정에서 신용 평점(credit scoring)의 역할이 중요합니다. 그러나 그 중요성에도 불구하고 기존의 신용 평점 시스템은 편견과 차별, 데이터 제한, 확장성 등 여러 가지 중대한 문제를 겪었습니다. 예를 들어, 미국 대출에 대한 한 연구에 따르면 대출 신청인이 소수 집단에 속한 경우 특권층일 경우보다 이자율이 +8% 높았으며, 대출 승인이 거부되는 빈도도 14% 높았습니다.

신용 시스템의 경직된 특성으로 인해 경제 환경의 변화와 소비자 행동의 진화에 적응하는 속도가 느려 일부 개인이 소외되고 간과될 수 있습니다. 이를 극복하기 위해 은행과 기타 대출 기관은 인공 지능을 채택하여 더욱 정교한 신용 위험 평점 모델을 개발하고자 합니다.

이 문서에서는 신용 평점의 기초와 현재 시스템이 직면하고 있는 문제를 살펴보고 인공 지능(AI), 특히 생성형 인공지능(GenAI)을 활용하여 편향을 줄이고 정확도를 개선할 수 있는 방법을 자세히 다루겠습니다. 대안적인 데이터 소스의 통합부터 머신 러닝(ML) 모델 개발에 이르기까지 신용 평점의 미래를 재편할 수 있는 AI의 혁신적인 잠재력을 발견할 것입니다.

신용 평점이란?

신용 평점은 금융 환경의 필수 양상으로서 개인의 신용도를 수치적으로 측정하는 척도 역할을 합니다. 이 중요한 지표는 대출 기관이 개인이나 기업의 대출 기간을 연장하거나 대출을 승인하는 등의 과정과 관련된 잠재적 위험을 평가하기 위해 사용됩니다.

전통적으로 은행은 선형 회귀 또는 로지스틱 회귀를 사용하여 구축된 사전 정의된 법칙과 통계 모델에 의존합니다. 이러한 모델은 과거의 신용 데이터를 기반으로 지불 내역, 신용 활용률, 신용 이력과 같은 요소를 중점적으로 다룹니다.

그러나 새로운 신용 대출 신청인을 평가하는 것은 어려운 일이므로 보다 정확한 프로파일링이 필요합니다. 핀테크와 디지털 은행은 전통적으로 차별 받던 금융 소외 계층의 필요에 부응하기 위해 기존의 신용 이력을 넘어서는 대안적인 데이터를 통합하여 개인의 금융 행동을 보다 종합적으로 평가하고자 합니다.

기존 신용 평점의 과제

신용 점수는 대출, 아파트 임대, 보험 가입, 때로는 고용 심사를 포함한 다양한 금융 거래를 결정하는 중요한 요인이기 때문에 현대 생활에서 없어서는 안 될 필수 요소입니다. 신용 획득 과정은 미로와 같이 복잡할 수 있으므로, 기존의 신용 평가 모델에는 신용 거래 신청 승인을 혼란스럽게 만들 수 있는 몇 가지 문제 또는 한계가 있습니다.

  • 제한된 신용 이력: 많은 개인, 특히 신용 평가를 처음 시도하는 사람들은 신용 이력이 제한적이거나 존재하지 않는다는 심각한 장애물에 직면합니다. 전통적인 신용 평점 모델은 과거의 신용 행위에 크게 의존하므로 탄탄한 신용 이력이 없는 개인은 자신의 신용도를 입증하기가 어렵습니다. 미국인 중 약 4천5백만명은 단순히 해당 데이터 포인트가 존재하지 않는다는 이유로 낮은 신용 점수를 보유하고 있습니다.

  • 불규칙한 소득: 파트타임 근무자나 프리랜서들의 소득은 불규칙한 경우가 많은데, 기존의 신용 평점 모델에서는 이들을 고위험으로 분류하여 신용 거래 신청 거부나 제한적인 신용 한도 설정으로 이어질 우려가 있습니다. 데이터 출처에 따라 2023년 미국의 자영업자 수는 다르게 나타납니다. 한 자료에 따르면 2천칠백만명 이상의 미국인이 사업에서 발생한 순이익 또는 손실에 해당하는 스케줄C(Schedule C) 세금 서류를 제출했으며, 이러한 배경은 자영업자를 위한 다양한 신용 평가 방법이 필요하다는 사실을 강조합니다.

  • 높은 기존 신용 활용도: 기존 신용 의존도가 높으면 종종 잠재적인 금융 부담의 신호로 인식되어 신용 관련 결정에 영향을 미칩니다. 신용 거래 신청인이 추가 신용 거래를 신중하게 관리할 수 있는 능력에 관한 우려를 반영하여 신청 거절 또는 유리하지 않은 대출 조건으로 이어질 수 있습니다.

  • 불명확한 거절 사유: 거절 사유가 신청인의 근본 원인을 해결하는 데 방해가 되고 있습니다. 2022년 4월부터 2023년 4월까지 영국에서 진행된 연구에 따르면 신용 대출 거절의 주요 이유로는 '신용 이력 미흡'(38%), '상환 능력 부족'(28%), '과도한 다른 신용 거래"(19%)' 등이 있었으며, 10%는 거절 이유를 듣지 못했다고 답했습니다. 이유를 제시하더라도 너무 모호한 경우가 많아 신청인이 근본 원인을 해결하고 향후 신청을 위해 신용도를 높이는 데 어려움을 느낄 수 있습니다. 투명성 부족은 고객에게 문제가 되며 은행에도 불이익을 초래할 수 있습니다. 예를 들어, 신용카드 신청을 거부하는 과정에서 투명성이 부족했다는 이유로 2023년 베를린의 한 은행에 30만 유로의 벌금이 부과되었습니다.

  • 유연성 부족: 특히 디지털 거래를 선호하는 젊은 세대의 소비자 행동 변화는 기존 모델의 교체를 요구하고 있습니다. 일시적인 고용 경향이 커지는 긱 경제(gig economy)의 부상, 비전통적 고용, 학자금 대출, 높은 생활비 등의 요인으로 인해 소득 안정성과 재정 건전성 평가가 복잡해졌습니다. 코로나19와 같은 전례 없는 혼란이 발생하는 기간에는 전통적인 신용 리스크 예측이 제한되며 이를 평점 모델에 고려하지 않습니다.

이러한 과제를 인식하면 진화하는 금융 행동에 적응하고, 비전통적인 데이터 출처를 다루며, 역동적인 오늘날의 금융 환경에서 보다 포괄적이고 정확한 신용도 평가를 제공할 수 있는 대안적인 신용 평점 모델이 필요하다는 사실을 명확히 알 수 있습니다.

대안적인 데이터를 사용한 신용 평점

대안적인 신용 평점이란 개인의 신용도 평가를 위해 비전통적 데이터 출처(즉, 대안적인 데이터) 및 방법을 사용하는 것을 의미합니다. 전통적인 신용 평점은 주요 신용 기관에서 제시하는 신용 이력에 크게 의존하는 반면, 대안적인 신용 평점은 개인의 금융 행동을 더욱 종합적으로 평가하기 위해 더 광범위한 요인을 포함합니다. 다음은 인기 있는 대안 데이터 출처 중 일부를 소개합니다.

  • 공공요금 납부: 신용 이력 외에도 전기 및 수도 등 공공요금을 일관적으로 납부했다는 사실은 재정적 책임 이행에 관한 강력한 지표를 제공하고 재정적 의무를 이행하려는 의지를 드러내며, 기존 지표를 넘어서는 핵심적인 인사이트를 제공합니다.

  • 주택 임차 이력: 주택 담보 대출이 없는 신청인의 경우 임대료 납부 내역을 핵심적인 대체 데이터 출처로 간주할 수 있습니다. 임대료를 일관적으로 기한 내에 지불했다는 사실을 통해 재정적 규율과 신뢰성에 대한 종합적인 인상을 얻을 수 있습니다.

  • 휴대폰 사용 패턴: 휴대폰을 어느 곳에서든 사용한다면 풍부한 대체 데이터를 제공할 수 있습니다. 통화 및 문자 패턴을 분석하면 개인의 네트워크, 안정성 및 사회적 관계에 대한 인사이트를 제공하여 신용 평점을 위한 귀중한 정보를 얻을 수 있습니다.

  • 온라인 쇼핑 행동: 온라인 구매 빈도, 유형 및 지출 금액을 조사하면 지출 행동에 대한 귀중한 인사이트를 얻을 수 있어 더욱 미묘한 재정 습관을 보다 이해하는 데 도움이 됩니다.

  • 교육 및 고용 배경: 대안적인 신용 평점은 개인의 교육 및 고용 이력을 고려합니다. 교육적 성취, 안정적인 고용 상태 등 긍정적인 지표는 재정 안정성을 평가하는 데 중요한 역할을 합니다.

이러한 대안적인 데이터 출처를 이용하면 신용 평가에 더욱 포괄적이고 미묘하며, 총체적인 방향으로 접근할 수 있습니다. 금융 기술이 계속 발전하면서, 이러한 대안적인 데이터 세트를 활용하면 신용도를 더욱 종합적으로 평가할 수 있으며, 이는 신용 평점 모델의 진화를 위한 혁신적인 단계가 될 것입니다.

인공 지능을 이용한 대안적인 신용 평점

AI를 대안적인 방법으로 사용하는 방식은 대안적인 데이터 사용 외에도 여러 가지 이유로 전통적인 신용 평점의 문제를 해결할 수 있는 혁신적 방법으로 부상했습니다.

  • 편향성 완화 가능: 기존 통계 모델과 마찬가지로, 편향된 과거 데이터를 학습한 LLM 등 AI 모델은 해당 데이터에 존재하는 편향을 상속하여 차별적인 결과를 초래할 수 있습니다. LLM은 다른 것보다 특정한 특징을 집중적으로 다루거나 개인의 재무 상황에 대한 광범위한 맥락을 이해하는 능력이 부족하여 편향된 의사 결정을 내릴 수 있습니다. 그러나 AI 모델의 편향을 완화할 수 있는 다양한 기술이 있습니다.
    • 완화 전략: 기존 편향의 강화를 방지하기 위해 다양하고 대표적인 교육 데이터를 사용하는 것부터 계획이 시작됩니다. 완화 전략이 부적절하거나 비효율적인 경우 AI 신용 평점 모델에 편향된 결과가 지속될 수 있습니다. 이러한 편향을 완화하려면 수집된 데이터와 모델 개발에 세심한 주의를 기울이는 것이 핵심적입니다. 신용 평점을 위한 대안적인 데이터를 통합하는 과정은 편향을 줄이기 위한 중요한 역할을 합니다.
    • 교육 중 엄격한 편향 감지 도구, 공정성 제약 조건, 정규화 기법을 적용하면 모델의 책임성이 강화됩니다. 특징 표현의 균형을 맞추고 후처리 기법과 특수 알고리즘을 사용하면 편향성을 완화에 도움이 됩니다. 포괄적인 모델 평가, 지속적인 모니터링, 반복적인 개선과 더불어 윤리 가이드라인 및 거버넌스 관행을 준수함으로써 AI 모델의 편향성을 줄이기 위한 다각적인 접근 방식을 완성할 수 있습니다. 이는 과거 신용 데이터에 존재할 수 있는 인구통계학적 또는 사회경제적 편향과 관련된 문제를 해결하는 과정에서 특히 중요한 역할을 합니다.
    • 정기 편향 감사: LLM의 편향을 식별하고 완화하기 위해 정기적인 감사를 수행합니다. 여기에는 인구통계학적 집단 사이의 차이에 대한 모델 성과를 분석하고 그에 따라 알고리즘을 조정하는 작업이 포함될 수 있습니다.
    • 투명성 및 설명 가능성: LLM의 투명성과 설명 가능성을 높여 의사 결정 방법을 이해합니다. 이는 편향된 의사 결정 프로세스를 식별하고 해결하는 데 도움이 될 수 있습니다. 서비스형 소프트웨어(SaaS) 대출 도구인 Trade Ledger는 데이터 기반 접근 방식을 사용하여 서로 다른 스키마를 보유한 여러 출처의 데이터를 단일 데이터 출처로 가져와 투명성과 추적성을 높이는 과정을 통해 정보에 기반한 의사 결정을 내릴 수 있습니다.
  • 방대하고 다양한 데이터 세트 분석 능력: 사전 정의된 법칙과 과거 신용 데이터에 의존하는 기존 모델과 달리, AI 모델은 비전통적 데이터 출처를 포함한 무수한 정보를 처리하여 개인의 신용도를 보다 포괄적으로 평가하므로 더욱 광범위한 재정 행동을 고려할 수 있습니다.
  • 타의 추종을 불허하는 AI의 적응성: 경제 여건의 변화의 소비자 행동의 진화에 따라 AI 기반 모델은 새로운 데이터를 빠르게 조정하고 학습할 수 있습니다. 지속적인 학습 양상을 통해 끊임없이 변화하는 금융 환경에서도 신용 평점을 적절하고 효과적으로 평가할 수 있습니다.

신용 평점 평가 과정에서 AI 사용에 반대하는 은행들은 대부분 신용 결정의 투명성과 설명 가능성을 이유로 이 기술에 반대하고 있습니다. 일부 AI 모델, 특히 딥러닝 알고리즘의 경우 내재된 복잡성으로 인해 신용 결정에 대한 명확한 설명을 제공하는 데 어려움을 겪을 수 있습니다. 다행히 AI 모델의 투명성과 해석 가능성이 크게 향상되었습니다. 설명 가능한 AI(XAI) 영역에서 SHAP(SHapley Additive exPlanations) 값, LIME(Local Interpretable Model-Agnostic Explanations) 플롯 및 기타 여러 발전된 기술을 통해 모델이 특정 신용 결정에 어떻게 도달하는지 이해할 수 있게 되었습니다. 이는 신용 평점 프로세스에 대한 신뢰를 향상시킬 뿐만 아니라 AI 모델이 블랙박스( ")라는 일반적인 비판도 해결합니다."

금융 기관은 반정형 또는 비정형 형식의 대안적인 데이터를 활용하는 것이 얼마나 중요한지 잘 알고 있으며, MongoDB와 협력하여 더 빠르고 간단하며 유연한 방식으로 결제 및 신용을 제공하기 위해 신용 거래 신청 프로세스를 개선하고 있습니다:

  • 인도네시아의 선도적인 디지털 은행인 Amar Bank는 기존 은행에서 금융 서비스를 받을 수 없는 사람들(은행 계좌가 없거나 금융 소외계층)에게 소액 대출을 제공하여 편견에 맞서고 있습니다. 기존의 언더라이팅(underwriting) 프로세스는 신용 이력이나 담보가 부족한 고객에게는 적절하지 않았기 때문에 비정형 데이터를 활용하여 대출 결정을 간소화했습니다. MongoDB Atlas를 활용하여 구조화된 데이터와 구조화되지 않은 데이터를 통합하여 대출 신청인의 신용도를 평가하는 예측 분석 모델을 개발했습니다. MongoDB의 확장성과 다양한 데이터 유형을 관리하는 기능은 대출 운영을 확장하고 최적화하는 과정에서 중요한 역할을 담당했습니다.

  • 대다수의 인도인들은 일반적으로 엄격한 규정과 신용 데이터 부족으로 인해 신용 거래를 승인 받기 어렵습니다. 인도의 핀테크 생태계를 선도하는 혁신 기업 Slice는 최신 언더라이팅(underwriting) 시스템을 사용하여 보다 원활한 신용 경험을 위한 KYC 프로세스를 간소화함으로써 인도 내 신용 거래 접근성을 확장하는 데 기여하고 있습니다. Slice는 실시간 머신러닝(ML) 기능 저장소 등 다양한 사용 사례 전반에 MongoDB Atlas를 활용하여 온보딩 과정의 혁신을 진행하여 처리 시간을 1분 내로 단축했습니다. Slice는 MongoDB 및 ML 모델과 함께 실시간 특성 저장소를 사용하여 100개 이상의 변수를 즉시 계산하므로 30초 이내에 신용 자격 여부를 판단할 수 있습니다.

생성형 AI 이용한 신용 평점 혁신

신용 평점에 대안적인 데이터와 AI를 사용하는 것 외에도, GenAI는 합성 데이터를 생성하고 복잡한 패턴을 이해하여 보다 미묘하고 변화에 적응할 수 있으며, 예측적인 접근 방식을 제공하는 능력으로 신용 평점 및 평가에 혁신을 불러올 잠재력을 가지고 있습니다.

다양한 데이터세트를 합성하는 GenAI의 기능은 기존 신용 평점의 주요 한계인 과거 신용 데이터에 의존하는 문제를 해결합니다. GenAI 모델은 실제 금융 행동을 반영하는 합성 데이터를 생성함으로써 더욱 포괄적인 신용도 평가를 실현합니다. 이러한 혁신적인 변화는 금융 포용성을 촉진하여 더 넓은 인구층이 신용 기회에 접근할 수 있는 기회를 창출합니다.

적응성은 경제 여건의 역동적인 특성을 파악하고 변화하는 소비자 행동을 파악하는 데 중요한 역할을 합니다. 예상치 못한 혼란에 적응하는 데 어려움을 겪는 기존 모델과는 달리, GenAI의 지속적인 학습 및 적응 능력은 실시간으로 신용 평점을 효과적으로 유지하여 신용 리스크 평가에 적합한 탄력적이고 반응적인 도구를 제공합니다. 예측 능력 외에도 GenAi는 신용 평점의 투명성과 해석 가능성에 기여할 수 있습니다. 모델은 의사 결정에 대한 설명을 생성하여 신용 평가에 대한 보다 명확한 통찰력을 제공하고 소비자, 규제 당국 및 금융 기관 사이의 신뢰를 강화할 수 있습니다.

그러나 GenAI를 사용할 때 모델이 무의미하거나 완전한 거짓 정보를 제공할 수 있는 할루시네이션(hallucination) 문제가 가장 큰 우려사항입니다. 이러한 리스크를 완화하기 위한 여러 기술이 있으며 검색 증강 생성(Retrieval Augment Generation, RAG)을 사용하는 것이 한 가지 방법입니다. RAG는 최신 출처의 사실 정보를 모델 응답의 근거로 삼아 할루시네이션을 최소화함으로써 모델의 응답이 가장 정확한 최신 정보를 반영하도록 보장합니다.

예를 들어, Patronus AIMongoDB Atlas와 함께 RAG를 활용하여 엔지니어가 실제 시나리오에서 대규모 언어 모델(LLM)의 성능을 평가 및 벤치마킹하고, 대규모로 적대적 테스트 케이스를 생성하며, 할루시네이션 및 기타 예기치 않은 안전하지 않은 동작을 모니터링할 수 있도록 합니다. 이를 통해 LLM 실수를 대규모로 감지하고 AI 제품을 안전하고 신뢰할 수 있는 방식으로 배포할 수 있습니다.

MongoDB의 또 다른 기술 파트너는 Robust Intelligence입니다. 이 회사의 AI 방화벽은 입력과 출력을 실시간으로 검증하여 프로덕션의 LLM을 보호합니다. 할루시네이션과 같은 운영 리스크, 모델 편향 및 악성 출력 등 윤리적 리스크, 프롬프트 주입(prompt injetion) 및 개인 식별 정보(PII) 추출과 같은 보안 리스크를 평가하고 완화합니다.

생성형AI가 계속 발전하면서, 신용 평점 및 더 넓은 신용 거래 신청 시스템에 통합되면 기술 발전은 물론 신용을 평가하고 연장하는 방식에 근본적인 변화가 일어날 것입니다.

신용 역사에서 중요한 순간

대안적인 데이터, 인공지능, 생성형AI의 융합은 신용 평점의 기초를 재형성하며 금융 산업에 중요한 순간을 나타내고 있습니다. 보다 포괄적이고 미묘한 평가를 제공하는 대안적인 신용 평가 방법이 채택되면서 기존 모델의 과제가 극복되고 있습니다. 생성형AI는 할루시네이션이라는 잠재적 문제를 초래하는 한편 기술 역량의 혁신은 물론 신용 평가 방식을 근본적으로 재정의하여 금융 포용성, 효율성, 공정성의 새로운 시대를 촉진하는 혁신의 최전선에 서 있습니다.