Подготовка исходных данных для рассчетов

Для разработки алгоритмов кредитного скоринга необходима историческая выборка данных — так называемая обучающая выборка. От качества этой выборки (репрезентативности) зависит точность оценок параметров модели скоринга и соответственно эффективность (предиктивная мощность) скорингового алгоритма.

Репрезентативность выборки определяется тем, насколько полно в ней присутствуют положительные и отрицательные прецеденты. Один и тот же элемент исторической выборки может быть признан и положительным, и отрицательным для разных постановок задач. Также может и не подходить для включения в обучающую выборку.

При задаче оценки возвратности хотя бы части просроченного кредита, то в качестве положительных прецедентов следует рассматривать все случаи возврата просроченных кредитов в сумме не менее этой части, а отрицательных — все остальные. Случаи погашения кредита точно в срок полностью исключить из выборки, как не относящиеся к задаче.

От постановки задачи скоринга зависит не только способ разбивки обучающей выборки на положительные и отрицательные прецеденты, но и множество значимых факторов. Когда кредит выдан — апликант становится заемщиком, а банку доступна дополнительная информация, например о точности выполнения заемщиком текущих обязательств по уплате процентов за кредит. Кроме того, некоторые из существенных характеристик заемщика просто могут измениться за кредитный период (например, доход или семейное положение).

АИСС БКБ, www.orioncom.ru, tel (495) 783-5510