Хорошие книги / документы по кредитному скорингу


11

Я ищу рекомендации книг по кредитному скорингу. Я заинтересован во всех аспектах этой проблемы, но в основном: 1) Хорошие возможности. Как их построить? Какие из них оказались хорошими? 2) Нейронные сети. Их применение к проблеме кредитного скоринга. 3) Я выбрал нейронные сети, но меня интересуют и другие методы.


Ответы:


6

Если вы новичок в мире скоринга, ваша первая книга должна быть написана naeem siddiqi по кредитному скорингу с использованием SAS. Если вы не взяли урок, сделайте это. Основное внимание в классе уделяется общему пониманию оценки и продажи SAS-майнера для предприятий за миллионы долларов.

Если вам нужна теория, вам нужен категориальный анализ данных и класс Data mining из ближайшего университета. Даже после этих занятий вам все равно понадобится помощь.

В настоящее время используются самые популярные методы

  1. логистическая регрессия
  2. нейронные сети
  3. опорные векторные машины и
  4. случайные леса

кластеризация, дискриминантный анализ, факторный анализ, основные компоненты также необходимы.

Кредитная оценка elizabeth mays также даст вам хороший обзор.

Я также взял курс моделирования кредитного риска в институте SAS, который мне немного помог. Это постоянный учебный процесс, и он никогда не делается.

Байесовским людям нравятся и их методы.

редактировать

Я также забыл упомянуть. Логистическая регрессия в самой популярной технике существует и всегда будет той, которую банки будут продолжать использовать. Другие методы очень трудно продать руководителям высшего звена, если только ваш банк не желает меньше заботиться о понимании этих методов, и их фокус остается на риске и зарабатывании денег.


Спасибо! Я собираюсь уточнить: я участвую в онлайн-конкурсе, цель которого - предсказать вероятность дефолта заемщика. Итак, 1) Я свободен в выборе любого метода, который мне нравится. Конкурс заканчивается через 2 недели. 2) У меня не так много времени для всестороннего обучения. и 3) Предоставленные данные представляют собой необработанные ответы кредитных бюро о предыдущих кредитах, поэтому я действительно заинтересован в извлечении из этих данных неочевидных особенностей.
Ня

Также, спасибо за ваш ответ, я обязательно посмотрю ваши отзывы.
Ня

1
Что это за соревнование? Могу я знать?
Xiaodai

6

Я работаю в области кредитного скоринга. Несмотря на то, что мне нравится изучать разные подходы, я считаю, что логистическая регрессия часто бывает достаточно хорошей, если не лучшей. Я не исследовал самые последние статьи по этой теме, но по памяти в большинстве работ вы увидите, что другие подходы, такие как модель нейронных сетей, как правило, не предлагают значительного повышения с точки зрения предсказательной силы (как измеряется GINI и AR). Кроме того, эти модели, как правило, гораздо сложнее понять непрофессионалу (часто большинство старших руководителей не имеют опыта работы в статистике), а подход с использованием системы показателей с использованием логистической регрессии, по-видимому, предлагает наиболее простые для объяснения модели. Правда, большинство систем показателей не учитывают взаимодействия,

Сказав это, в последнее время были некоторые интересы в построении карт показателей с использованием методов анализа выживания, поскольку они имеют несколько преимуществ по сравнению с логистической регрессией. А именно, мы можем легче включить макроэкономические факторы в модель, мы можем использовать более свежие данные в построении модели вместо того, чтобы полагаться на данные по крайней мере 12 месяцев назад (поскольку бинарный индикатор в логистике обычно определяется как дефолтный в пределах следующие 12 месяцев). В этом отношении мой тезис может предложить другую перспективу в том, что он рассматривает создание кредитных карт с использованием анализа выживания. Я показал, как оценочные карты анализа выживаемости «выглядят и чувствуют» так же, как оценочные карты логистической регрессии, поэтому их можно вводить без особых проблем.

В своей диссертации я также описал алгоритм ABBA, который является новым подходом к бинированию переменных.

https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwikimedia%2Fimages% 2Fwikipedia% 2Fcommons% 2F2% 2F2f% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & е = 8D8MUorrJs2Trgf56YCwCQ & USG = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & Sig2 = kcEvjUUcn_wT93igxpYYDA & BVM = bv.50768961, d.bmk

Обновление: я не утверждаю, хорош ли мой тезис. Это просто другая точка зрения практикующего в этой области.


1
Это не кажется сосредоточенным на вопросе. Ваше конкретное предложение «прочитай мой тезис». Я не читал это и не квалифицирован, чтобы оценить это, но это не квалифицируется как книга или даже опубликованная статья.
Ник Кокс

4
@Nick Вопрос спрашивает о «других методах», к которым обращается этот ответ. Многие люди считают полезной ссылку на загружаемый текст, возможно, даже больше, чем просто ссылку. Анонимному флагжеру: предоставление ссылки на собственную работу не является спамом. Мы приветствуем исследователей и других новаторов здесь и не хотели бы ограничивать их возможности, чтобы помочь нам, требуя, чтобы они никогда не цитировали свой собственный вклад!
whuber

3
Я понимаю точку зрения @ вубера. Я также полностью согласен с тем, что цитирование собственной работы в порядке. xiaodai: я бы удалил обновление. Весь смысл вашего поста в том, что ваш тезис, возможно, стоит прочитать. Если бы ты так не думал, ты бы не писал. Добавление нотки неуверенности или скромности не требуется.
Ник Кокс

3
  • В прошлом я ссылался на Руководство по кредитному скорингу в R Д. Шармы, и оно является хорошим вводным справочником по подходам, включая логистическую регрессию и методы на основе дерева.
  • Приведенное выше руководство использует немецкие кредитные данные, которые имеют богатый набор функций. Если вы ищете набор данных, вы найдете другие альтернативные подходы, анализ и сравнения, которые могут помочь в выборе функций и выборе модели для вашего набора данных.
  • Нейронные сети - справедливый выбор для проблемы бинарной классификации, как эта. В реальном мире также ожидается, что модель кредитного скоринга предоставит причины, по которым заявка на кредит (скажем) была отклонена. Поэтому полезно иметь модель, в которой вы можете определить, какие функции в кредитной истории приводят к низкому баллу и вызывают отклонение заявки. Особенности регрессионного и древовидного подходов легче интерпретировать по сравнению с нейронными сетями. Если вы оцениваете чисто по форме, NN стоит попробовать
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.