RUS

Горячая линия +7 (495) 268-09-63

Аналитика

Результаты тестирования алгоритма оценки заемщика на 85 000 кредитных историях

20.01.2014
Выполнено: пресс-службой СКОРИСТА

Основной деятельностью ООО Аналитическое агентство «Скориста», далее Компания, является предоставление услуг по экспертизе платежеспособности заемщика, оценке благонадёжности пользователя, «прогнозированию его кредитного поведения» для микрофинансовых институтов (таких как МФИ и КПК), банков, представителей ритейл-сегмента, сервисов по продаже товаров в рассрочку.

 

Компания разработала SaaS-сервис экспертизы заемщика «Scorista.ru», который позволяет в режиме реального времени производить качественную оценку платежеспособности заемщика и выдавать однозначное (да-нет) решение о выдаче займа на сумму до 50 000 рублей сроком не более 1 года.

 

Под качественной оценкой заявляются следующие параметры работы:

Параметры работы оценки заемщика

Достижение заявленных параметров обеспечивает Алгоритм оценки заемщика. Алгоритм состоит 6 взаимосвязанных частей. Каждая часть представляет собой набор правил и условий, выведенных путем статистического анализа и математического моделирования. Базисом Алгоритма является экспертиза кредитной истории заемщика.

 

Алгоритм был построен на данных о 30 000 заемщиков, полученных от нескольких действующих МФО. В результате внедрения алгоритма организации получили заявленные параметры работы и значительное улучшение кредитного портфеля.

 

Однако успешная апробация не гарантирует заявленных параметров в условиях рыночной эксплуатации, так как ограничивается 5 000 займов в месяц для одного МФО. Во избежание возможных неприятных последствий было принято решение о проведении тестирования на более крупном объеме данных превышающий, как минимум, в 2,5 раза базовый объем.

 

Описание тестирования

 

Тестирование Алгоритма проводилось на основе выборки кредитных историй, далее КИ, из базы одного из крупнейших Российских Кредитных Бюро, далее БКИ, в 3 этапа:

1.      Формирование выборки

Компания получила 85 697 КИ из общего массива, сформированного по правилу:

«В массив попадают кредитные истории субъектов, которые содержат хотя бы 1 кредит до 50 000 рублей. (<RUR50К>). Дата открытия этого кредита должна быть между 01.01.2013 и 01.10.2013. По данному кредиту должна быть история платежей (в поле paymtPat есть записи о погашении). Официальная дата закрытия кредита (поле closedDt) должна быть меньше даты выгрузки. Тип кредита любой. Микрокредит считается просроченным, если у него есть текущая просрочка даже на один день. Кроме вышеописанного микрокредита в КИ субъекта должны присутствовать другие кредиты (любого типа), дата выдачи которых должна быть между 01.01.2008 и 01.01.2013».

 

Представленная выборка является репрезентативной, так как выгружена согласно требованиям:

«Выборка должна содержать такую же долю кредитных историй с просроченным микрокредитом, как и основной сформированный массив. Доля высчитывается по количеству кредитных историй следующим образом:

 

I. Выбираются все КИ, в которых есть микрокредит, удовлетворяющий описанию массива, и подсчитывается количество таких КИ.

II. Из этой выборки выбираются КИ с просроченным микрокредитом. Если микрокредитов несколько, то в качестве основного рассматриваемого микрокредита берётся микрокредит с более поздней датой выдачи.

III. Далее высчитывается количество КИ с просроченным микрокредитом и его доля от общего количества КИ массива.

 

Доля КИ с просроченными и невозвращёнными микрокредитами по выборке должна быть такой же, как в массиве. В выборке должны быть представлены все регионы в таком же процентном соотношении, как в полном массиве БКИ, даже если их доля будет крайне мала».

2.      Формирование пространства переменных

В качестве основного критерия искомой переменной был выбран статус микрокредита, открытого не ранее 2013 г. Все микрокредиты были распределены по группам: возвращённые, просроченные и невозвращённые. Распределение проводилось согласно принятой методологии:

  1. если статус микрокредита «просрочен» или «проблемы с возвратом», то он считается невозвращённым.
  2. если статус кредита закрыт, но последнее состояние микрокредита «просрочен» или «проблемы с возвратом» или статус одного из первых платежей по кредиту «просрочен», то он считается просроченным.

Среди всех полученных КИ доля кредитных историй, содержащих просроченный микрокредит, составляла 13%, а невозвращённые – 9,9%.

После маркировки данные кредиты были исключены из кредитных историй и перенесены в пространство переменных.

3.      Формирование результата экспертизы

В результате работы Алгоритма по первому режиму было одобрено 71 028 кредитных историй, что составляет 83% всех КИ. Среди всех одобренных доля кредитных историй, содержащих просроченные кредиты, составляла 9,7%, а невозвращённых – 7%. В первом режиме помимо анализа КИ используется совпадение данных заемщика КИ и из открытых источников Интернет, например как соц.сети.

Во втором режиме было одобрено 60 300 кредитных историй, что составляет 70,4% всех КИ. Среди всех одобренных доля кредитных историй, содержащих просроченные кредиты, составляла 10,9%, а невозвращённые – 7,9%.

 

Выводы и результаты тестирования

 

Не смотря на то, что полученная выборка незначительна по отношению к общему массиву кредитных историй с заданными параметрами БКИ, результат тестирования можно считать валидным, в силу того, что первоначальный объем обрабатываемых запросов Сервисом не будет превышать 1 050 000 в месяц.

 

Полученные результаты тестирования представлены в сводной сравнительной таблице:

 

 

Название

Выборка

Заявлено

Результат

Режим 1

Режим 2

 

Одобрено

 

85 697

38 563

71 028

63 300

 

Просрочено

 

11 155

6 941

6 924

6 559

 

Невозвращено

 

8 484

4 242

4 991

4 760

 

% Одобрено

 

Нет данных

45%

83%

70,4%

 

% Просрочено

 

13%

18%

9,7%

10,9%

 

% Невозвращено

 

9,9%

11%

7%

7,9%

 

Следует сделать поправку, что тестирование проводилась на микрокредитах в большей массе банковского сектора, где профиль заемщика более благонадежный, поэтому в реальных условиях эксплуатации для МФО параметры работы алгоритма будут стремиться к заявленным.