Алгоритм на основе дерева классификации

Дерево классификаций (дерево решений) является более общим алгоритмом сегментации обучающей выборки прецедентов, чем логистическая регрессия.

В отличие от метода логистической регрессии в методе дерева классификации сегментация прецедентов задается не с помощью n-мерной сетки, а путем последовательного дробления факторного пространства на вложенные прямоугольные области.

При этом соблюдается следующая последовательность шагов.

Дерево решения:


skor-3.gif (9919 bytes)


На первом шаге разделение выборки прецедентов на сегменты производится по самому значимому фактору. На втором и последующих шагах в отношении каждого из полученных ранее сегментов процедура повторяется до тех пор, пока никакой вариант последующего дробления не приводит к существенному различию между соотношением положительных и отрицательных прецедентов в новых сегментах. Количество ответвлений (сегментов) на каждом шаге процедуры построения дерева решений выбирается автоматически.

Сегментация прецедентов по методу дерева классификации:

Skor-2.gif (14513 bytes)

 

АИСС БКБ, www.orioncom.ru, tel (495) 783-5510