Как искусственный интеллект помогает выдавать кредиты в Украине

397

В индустрии микрокредитования успех зависит от скорости и правильности принятия решения. Не удивительно, что теперь в этом бизнесе на ура пошла технология машинного обучения. Посмотрим, как это работает в Украине.

Что общего между одиноким молодым человеком без высшего образование в возрасте 20-25, мужчиной без семьи, зато с высшим в 26-30 и женщиной под 40 лет с таким же социальным статусом?

Именно эта категория людей чаще всего обращается в микрофинансовые компании за кредитами до зарплаты. Кстати, с большой долей вероятности они делают это под конец месяца и просят о сумме порядка 2000 гривен.

Удается ли им получить желаемое, зависит от почти сотни факторов, которые тщательно высчитываются алгоритмами машинного обучения.

Сам термин «машинное обучение» пока еще для многих в диковинку. Его зачастую путают с такими понятиями как нейросети и big data. Между тем, машинное обучение — это одно из направлений искусственного интеллекта. Под этим термином понимают технологии, которые позволяют компьютерным алгоритмам не просто обрабатывать данные и делать какие-то выводы, но и использовать сам процесс обработки данных для саморазвития.

НВ разобралось, как эти технологии используются в современной Украине и как машинное обучение «понимает», что вам можно выдать кредит.

Популярнее банков

Для начала, опишем масштаб явления.

Итак, в 2016 году в Украине сервисы микрокредитования выдали населению больше кредитов, чем банки.

Как пишет издание PaySpace, источником такой популярности стало то, что организации работают круглосуточно и даже по выходным, займы выдают быстрее (скорость исчисляется в десятках минут, а не в днях) и лояльнее, чем банки.

Вероятность позитивного решения у первых – 70-80%, у вторых – 20-30%. В отличие от банков, микрофинансовым компаниям неинтересно где клиент работает и сколько зарабатывает, что является не последним фактором для украинских заемщиков с низкими доходами.

Также у них действуют программы лояльности, которые стимулируют клиентов обращаться снова и приводить друзей.

Алгоритмы скоринга

Быть быстрее и эффективнее удается благодаря продвинутым скоринговым системам.

Если банк в среднем оценивает заемщика по 15-20 параметрам, присваивает значимость каждому и на основании этого принимает решение о выдаче кредита, то скоринг-система в микрокредитовании может учитывать под сотню параметров, и специалисты по анализу данных постоянно работают над тем, чтобы находить новые закономерности.

«В сфере микрокредитования инвестиции в скоринг на старте составляют до 30%, а в штате зачастую есть 1-2 специалиста по анализу данных», – рассказывает Иван Кривич, директор онлайн-сервиса Mycredit.

Вопрос специалистов по анализу – больная тема, сетует собеседник. Это одна из самых высокооплачиваемых специализаций в IT-индустрии, и найти человека даже за очень большие деньги непросто.

В Украине их почти нигде не готовят. Поэтому если уж человека нашли, то сделают все, чтобы он остался. Не только потому что их мало, но и потому, что не принято делиться секретами алгоритмов с конкурентами.

Тут напрашивается популярный нынче термин big data, но собеседник НВ открещивается от него. До больших массивов данных, которые используются, например, для обучения нейросетей, этой сфере еще далеко (хотя именно к ним все идет).

Тут не такое количество клиентов, не такой продолжительный срок сбора информации. Тем не менее, алгоритмы учитывают совершенно разные параметры. От банального – сколько кредитов есть у человека сейчас, до того, сколько времени человек провел, условно, на третьей странице сайта в верхнем левом углу.

Данные о внимательном изучении какой-то странички не станут поводом отказать в кредите или согласиться с выдачей. Это один из предикторов (прогностических параметров), который тоже имеет свой вес. Даже если он составляет 0,01%, его не станут отбрасывать.

Таких факторов может быть 100, и вместе они потянут на целый процент, который, возможно, убережет компанию от ненужного риска. Точную информацию о том, что используется в качестве предиктора, принято скрывать. В интернете можно найти информацию о том, что онлайн-скоринг учитывает, какими сервисами пользуется посетитель, как ведет себя в социальных сетях и какие ресурсы читает.

Собеседник НВ уверяет, что их скоринговая система учитывает только поведение на сайте компании, а каких бы то ни было закономерностей, связанных с тем, что человек, зашедший с определенного устройства, в определенное время и заинтересовавшийся определенной суммой нет. Софт работает сложнее и учитывает не только поведенческие, но и неповеденческие факторы.

Поведенческие факторы – это время захода на сайт, поведение на сайте. Неповеденческие – это в том числе информация из бюро кредитных историй. В Украине внесение информации в БКИ необязательно, но в Европе много где наоборот.

В компании говорят, что если бы информация о каждом заемщике находилась в БКИ, то это бы повлияло позитивно на риски и стимулировало бы снижение ставок, возможно, они бы опустились до европейских показателей. Сейчас в Украине ставки на 30-40% выше.

Есть такие предикторы, которые сами по себе имеют вес в сотые доли процента, но все вместе, если их сложить, дают результат в разы более весомый (как 2+2=20, например).

Совокупность факторов определяет долю вероятности, что человек вернет кредит. «Каждому из нас знакомо понятие ментальности. Она состоит из индикаторов. По сути, это оцифровка ментальности – нахождение закономерностей по большому количеству признаков. На этом построена наша аналитика», — поясняет Кривич.

В MyCredit используют скоринг, построенный на R (ретро-скоринг на основе исторических данных о кредитной истории), а сами алгоритмы – внутренняя разработка. Используются и стандартные модели зависимостей, которые предлагает платформа, и собственные.

Кроме того, идет постоянный поиск новых предикторов. «Чтобы построить скоринг, нужно понимать, что мы хотим сказать. Мы берем выборку из 1000, например, и смотрим, наличие каких параметров свидетельствует о вероятности наступления какого-то события. Это может быть что угодно – от возврата кредита до поездки за рубеж, покупки определенного товара», – объясняет Кривич.

По такому принципу работают все скоринг-системы. Например, в подразделении Киевстар, которое занимается большими данными, разработали собственную систему скоринга для финансовых организаций, она базируется на данных, которые есть у оператора в привязке к номеру. Это, например, возраст номера, средний чек (причем в долгосрочной перспективе), нахождение в одном и том же месте в рабочее время и т.д.

Тестирование гипотез в скоринге происходит постоянно. Среди заемщиков есть какая-то доля людей, которым компания должна бы отказать, но не отказывает. Среди них есть как ответственные, так и те, кто деньги не возвращает.

«У нас параметр false negative порядка 15%, – объясняет Иван Кривич. — То есть 15% людей, которым мы не выдаем кредит – это наша ошибка. Но здесь постоянная дилемма. Я могу выдавать большему количеству людей кредит. Снизить уровень отсечения. У меня false negative станет меньше, но вырастет false positive. Нахождение золотой середины – бесконечный творческий процесс».

Если взять скоринг в чистом виде, то можно найти золотую середину, при которой будет компания будет выдавать максимальное количество позитивных кредитов, минимальное – негативных. Но включаются другие факторы. Например, маркетинговые затраты и стоимость операционной деятельности. Чем больше кредитов – тем больше затрат на персонал.

Кредиты для одиноких

Анализ человеческого поведения помогает выявлять неожиданные закономерности. Так кредит с большей долей вероятности вернут те, у кого их уже 2-3, так как у них есть платежная дисциплина. Клиент, у которого бывала просрочка до 30 дней, надежнее того, у кого ее не было, а вот больше 60 уже означает, что кредит больше не дадут. Чаще всего обращаются за микрокредитами одинокие люди.

Как только в информационном пространстве появляются тревожные новости о финансовой или политической ситуации, интерес к «кредитам до зарплаты» падает, а в стабильные времена растет. Летом кредиты почти не берут, а с 1 по 10 января не возвращают.

Средняя сумма – 40-60% от минимальной зарплаты, в Украине эта цифра выше, так как официальные зарплаты не соответствуют реальным, но в целом в Европе закономерность сохраняется. Наконец, самым популярным временем для займа является конец месяца, хотя есть небольшой всплеск перед авансом. По данным Mycredit, в последние 12 дней месяца кредитов выдают столько же, сколько в первые 18.

А как у них?

Подобные сервисы появились за несколько лет до кризиса 2008 года, но сокращение кредитных линий в банках и проблемы с заработком стимулировали их развитие. Причем большое распространение они получили не только в странах с нестабильной экономикой.

Родиной онлайн-кредитов стала Великобритания. Там компания Wonga – местный лидер рынка – несколько лет назад преодолел отметку в миллиард долларов капитализации. Как пишут «Ведомости», у компании есть миллион клиентов в своей стране и 3 млн за ее пределами. При этом в другой европейской стране – Германии – наоборот, микрокредиты не так прижились. Вероятно, тут сказывается разница в менталитете.

По данным исследования Technavio, самым быстрорастущим по размерам выручки рынком для подобных сервисов стал Азиатско-Тихоокеанский регион. Лидируют в нем Китай, Гонконг, Южная Корея, Макао, Монголия, Япония и Тайвань. В исследовании говорится, что драйвером роста выступает быстрая индустриализация, увеличение объемов производства и как следствие – растущий спрос на товары и услуги. По прогнозам, к 2020 году микрофинансовые организации займут 70% рынка в этом регионе.

Во многих странах процентные ставки, как и в целом деятельность МФО (микрофинансовых организаций), не урегулирована. Возглавила движение в сторону регулирования деятельности МФО также Великобритания. Несколько лет назад правительство страны обозначило размер максимальной ставки в день (0,8%) и пени. До этого ставки по кредитам в компании Wonga достигали 6000% годовых. Также максимальный размер ставки есть в Польше и США.

Кстати о процентах. В Mycredit говорят, что высокие ставки на подобные сервисы обусловлены прежде всего рисками.

Значительная часть доходов идет на покрытие расходов по невозвратам. Именно поэтому скоринговые модели с максимально точным качеством предсказания критично важны для бизнеса. Другой собеседник редакции оценивал доходность кредитов до зарплаты в 400% годовых.