Новости‎ > ‎

Соревнования SAS Institute по анализу данных. Срок сдачи 31.01.2015

Отправлено 13 нояб. 2014 г., 0:04 пользователем Сергей Мезин   [ обновлено 16 дек. 2014 г., 0:31 ]
Компания SAS Россия/СНГ при поддержке "АлгоMост" проводит конкурс для специалистов по анализу данных и бизнес-аналитиков «Соревнования SAS Russia по анализу данных: коллекторский скоринг» (SAS Russia data scientists competition: collection scoring) с призовым фондом 225 000 рублей.

Конкурсная задача:
В рамках конкурса участникам предлагается решить задачу коллекторского скоринга. Это вид скоринга, применяемый для взаимодействия с клиентами, отказывающимися от исполнения условий кредитного договора, т.е. отказываются погашать задолженность. Скоринг в этом случае необходим для определения приоритетности действий служащих коллекторского бюро при работе по возвращению “плохого” кредита. Набор данных для конкурса, аналогичен набору, предоставляемому банком коллекторскому бюро и содержит информацию о банковских займах, проданных коллекторскому агентству.  Для каждого займа приведены его характеристики, характеристики просрочки по займу, а также обезличенная информация о заемщике.

Организация соревнования и требования к участникам:
Соревнования проводятся на площадке компании 
«АлгоМост». Каждый зарегистрированный участник соревнования получает доступ к описанию данных, тренировочному набору с заполненным откликом (признаком, является ли кредит «плохим») и тестовым набором с незаполненным откликом. Задачей участника является разработка алгоритма прогнозировании вероятности возврата кредита.

Качество модели прогнозирования оценивается на тестовой выборке на основе индекса Джини. Регулярно публикуется «таблица лидеров» с оценкой Джини, полученной на 50% тестовой выборки. Финальная оценка качества по окончании соревнований проводится на всей тестовой выборке.

Требования к участникам
Участником соревнования может быть любой желающий, совершеннолетний гражданин РФ или другой страны члена СНГ.

Допустимой средой разработки алгоритма прогнозирования является исключительно продукт SAS University Edition  (SAS UE

Единственными доступными средствами разработки модели являются языки программирования SAS Base и SAS IML, а единственной доступной библиотекой SAS STAT (библиотека методов статистического анализа SAS). Использование других библиотек и инструментов, в том числе, подключаемых (таких как R) или поставляемых с другими продуктами SAS недопустимо.

Использование внешних источников данных (например, находящейся в свободном доступе информации об экономическом состоянии регионов) допустимо, но должно явно указываться в описании алгоритма и не должно нарушать ничьих авторских и других прав.

Критерии выявления победителей

Победители определяются среди участников, приславших все требуемые материалы:

  • метки тестовой выборки,
  • детальное описание алгоритма,
  • код программы на SAS Code или IML,
  • ссылки на источники дополнительной информации, если использовались,
  • имя участника в SAS profile (регистрация необходима для доступа к ПО SAS UE).

При запуске программа должна выдавать файл прогнозом, идентичный присланному участником. Описание должно чётко отражать логику исследований и прагматику выбора итоговой версии алгоритма. В описании следует указать все источники информации, которыми пользовался решатель, а также коллектив решателей. Описание алгоритма должно давать возможность воспроизвести его.

Трое участников, приславшие решения с максимальным значением индекса Джини на тестовой выборке, получают соответственно призы №1, №2, №3 (по убыванию значения индекса Джини).

Предоставляется специальный приз №4 за лучшую работу среди студентов (участники могут указать, являются ли они студентами ВУЗов). Если лучшая студенческая работа попадает в призы №1-3, то призы складываются с призом №4.

Приз №5 предоставляется за лучшее оформление работы, что подразумевает детальное описание кода, используемых алгоритмов и внешних источников данных (если есть). При этом работа должны входить в 10% лучших работ по таблице лидеров. Приз №5 может складываться с остальными. Лучшая по оформлению работа определяется сотрудниками SAS РФ.

Ждем ваших заявок!

Comments