Decyzje kredytowe oparte o Machine Learning

Moduł wspierający generowanie indywidualnych ofert kredytowych z wykorzystaniem Machine Learning

Długie oczekiwanie na decyzję kredytową jest bolączką, na którą wskazuje duża część klientów banków. Sformułowanie wniosku, ocena zdolności kredytowej, zabezpieczenia, ryzyk, analiza, opiniowanie i akceptacja to kroki procesowe niezbędne dla przyznania kredytu z punktu widzenia banku. Proces decyzyjny może wyglądać nieco inaczej jeżeli pożyczkobiorcą jest klient obsługiwany przez instytucję finansową od dłuższego czasu. W takich przypadkach kredytodawca dysponuje dużą wiedzą o historii współpracy - można nie tylko przyspieszyć proces weryfikacji wniosku, ale nawet przygotować ofertę kredytową bez wniosku ze strony klienta. Artykuł przedstawia realizację modułu wspierającego generowanie indywidualnych ofert kredytowych z wykorzystaniem Machine Learning.

Wyzwanie

Zadanie, jakie postawiono Whiteaster polegało na przygotowaniu automatyzacji oceny zdolności kredytowej klienta firmy finansowej. Klientami tej firmy są handlowcy prowadzący swoją sprzedaż poprzez jedną z największych na świecie Internetowych platform sprzedażowych. Oferta kredytowa miała być oparta na analizie zdolności kredytowej oraz ryzyka. Założono, że kredyt powinien być możliwy do spłacenia dzięki wynikom sprzedaży w tej firmie. Przedmiotowe kredyty nowym produktem – firma nie dysponowała danymi opisującymi historię ich przyznawania i spłacania.

Zadanie podzielono na kilka kroków:

  • Kolekcja i ocena kompletności, wiarygodności oraz przydatności dostępnych danych
  • Analiza danych, wstępna klasyfikacja klientów
  • Przygotowanie modelu analitycznego, testy i weryfikacja wyników
  • Budowa rozwiązania na bazie modułów Machine Learning
  • Testy, tuning
  • Implementacja w zintegrowanym środowisku IT klienta

Ponieważ w pierwszym etapie oferta kierowana jest do aktualnych klientów (korzystających z innych produktów finansowych) firma dysponuje sporą ilością danych. Podzielono je na dwie główne grupy:

  • dane historyczne
  • dane bieżące

Dane historyczne dotyczą sprzedaży, jakości obsługi klientów oraz statusów na platformie sprzedażowej. Dostępne zbiory informacji oprócz tego, że różnią się merytorycznie, obejmują różne okresy czasu (od dwuletnich do półrocznych).

Drugi zbiór to dane bieżące, opisujące działalność sprzedawców w firmie klienta - aktualne informacje statusowe, informacje o sprzedaży, oferowanych produktach, finansowo - rozliczeniowe, informacje o udzielonych (aktualnie spłacanych) pożyczkach itp.

Analiza danych

Analiza dostępnych informacji oraz wypracowanie modelu decyzyjnego to kluczowy element projektu. W praktyce jest zadaniem ciągłym wykonywanym cały czas w trakcie realizacji projektu. Uzyskiwane wyniki pośrednie, wnioski, diagnozowane przypadki szczególne, ujawniające się w trakcie prac oraz rosnąca wiedza w zespole skutkują ewolucją modeli, metod oraz listy zbiorów danych wejściowych. W efekcie prowadzą do doskonalenia systemu. Intensywnie wykorzystywane są metody klasyfikacji danych, które ułatwiają odkrycie prawidłowości i zależności. Nie do przecenienia jest wiedza oraz doświadczenie specjalistów klienta. Dobra współpraca, wspólnie wypracowywane rozwiązania i na bieżąco dokonywana ocena wyników pozwalają na szybkie postępy prac.

Model analityczny oparty został na wnioskach z analizy danych oraz ich wpływu na decyzje kredytowe. Ostateczna oferta pożyczki wynika z wielu czynników, zarówno o charakterze historycznym, jak i bieżącym. Można zaryzykować stwierdzenie, że obserwowany wzrost ich ilości jest dobrym zobrazowaniem dojrzewania systemu decyzyjnego. Na architekturę rozwiązania ma wpływ także sposób pozyskiwania danych, częstotliwość ich aktualizacji oraz merytoryczne znaczenie – sposób wpływu na końcową rekomendację. Ponieważ wyniki analityki zmienia się – ewoluują w trakcie trwania projektu, podobnie za jej zmianami podążają zmiany modelu. W efekcie realizacji projektu powstało rozwiązanie składające się z siedmiu modeli Machine Learning oraz modułu kalkulacyjnego, opartego na zaprojektowanych algorytmach.

Decyzje kredytowe oparte o machine learning

System decyzyjny generuje dla każdego klienta ranking (Scoring behawioralny, odpowiadający stopniowi ryzyka kredytowego) oraz propozycję kwoty pożyczki. Udostępnia także szereg informacji pomocniczych, ułatwiających weryfikację ale także uzasadnienie decyzji. Architektura składa się łącznie z siedmiu modułów Machine Learning – pięć z nich dokonuje analizy danych historycznych. Zastosowano różne modele dostępne w pakiecie H2O.ai. Dodatkowo zaimplementowano szereg reguł i algorytmów stanowiących moduł kalkulacyjny. Uczenie modułów ML oraz doskonalenie algorytmów to proces czasochłonny. Wymaga wielu testów, zmian, powtórzeń, analiz wyników, diagnoz przypadków szczególnych itp. Rozwiązanie zaakceptowane do produkcyjnego wykorzystania - oparcia na jego rekomendacjach decyzji kredytowych - powstało w niecałe 1,5 miesiąca. Integracja z systemem zintegrowanym klienta zajęła kolejny miesiąc.

Realizacja projektu wymagała poznania modelu informacji, modelu danych i modelu biznesowego Firmy Klienta (nie tylko w odniesieniu do produktu, który był przedmiotem prac). Dobra współpraca i wysoko ocenione wyniki pozwoliły na określenie kolejnych celów i kontynuację współpracy.