Райффайзенбанк: Технологии Big Data помогают управлять клиентской информацией
Внедрение технологий Big Data помогло «Райффайзенбанку» значительно ускорить обработку данных для формирования ежедневной отчетности. Оперативное получение данных было важно в связи с внедрением MDM-системы и Siebel CRM. О том, в каких еще бизнес-процессах банка найдет применение анализ больших данных, рассказал руководитель отдела ИТ-архитектуры, вице-президент «Райффайзенбанка» Сергей Щелчков.
CNews: Что вы в «Райффайзенбанке» называете термином Big Data?
Сергей Щелчков: Применительно к нашему банку, можно сказать, что Big Data – это в первую очередь большой объем данных, требующих высокой скорости обработки и нестандартных технологий. Во-вторых, под Big Data мы понимаем быстрые данные, когда необходима репликация в режиме, близком к реальному времени (2–5 минут): как между оперативными системами, так и между оперативными системами и оперативным хранилищем, используемым, например, в качестве источника данных для веб-сервисов или отчетности. В третьих, Big Data отличаются сложностью преобразования данных при их репликации из разнообразных систем, очистке данных и их консолидации.
CNews: Что заставило «Райффайзенбанк» обратиться к технологиям больших данных?
Сергей Щелчков: Исторически сложилось, что в нашем банке используется большое количество систем для ведения информации о клиентах и продуктах. Управленческая и оперативная отчетность строилась на хранилище данных (ХД) на платформе SAS. Это хранилище представляет собой копии данных оперативных систем с множеством витрин данных.
С целью консолидации информации по банкам группы «Райффайзен» в «Райффайзенбанке» было внедрено новое хранилище данных GDWH на платформе Oracle. В нем используется модель данных, единая для всех банков группы «Райффайзен». Объем этого хранилища сейчас превышает 40 Тб. Но потребности в скорости получения отчетности растут, и получение отчетности к вечеру следующего за отчетным дня не устраивает многих бизнес-пользователей. ИТ не устраивает наличие фактически двух ХД.
Сейчас внедряется оперативная область хранения данных (Operational Data Store, ODS), имеющая модель, схожую с моделью GDWH, для целей формирования отчетности на утро дня, следующего за отчетным. После внедрения ODS мы сможем перестать использовать ХД на двух разных платформах с двумя различными моделями данных.
Сергей Щелчков: Big Data могут дать хорошие результаты в работе с потенциальными частными клиентами
Кроме того, у нас есть планы использовать ODS для целей интеграции приложений в режиме, близком к реальному времени, когда репликация данных между системами осуществляется каждые 2–5 минут.
CNews: Кто инициирует проекты Big Data внутри «Райффайзенбанка»?
Сергей Щелчков: Внутренний заказчик, как правило, – это розничный или корпоративный бизнес, финансы и риск-менеджмент. Часто эти требования связаны с Basel II.
CNews: Какими ресурсами осуществляете проект?
Сергей Щелчков: Это внутренние и внешние сотрудники как со стороны ИТ, так и бизнеса. Со стороны ИT на проектах Big Data одновременно задействовано до 8–10 человек. Это аналитики и разработчики, половина из которых – внешние сотрудники.
CNews: Видите ли вы на рынке квалифицированные ресурсы (персонал и интеграторов), которые могут помочь в проектах Big Data?
Сергей Щелчков: Таких ресурсов мало, это связано со спецификой банковской отрасли. К тому же мало известно об успешных проектах Big Data.
CNews: Для каких целей вы применяете Big Data?
Сергей Щелчков: Одно из свойств Big Data связано с требованиями получать данные с небольшим запаздыванием, мы столкнулись с такими требованиями при внедрении операционного CRM на платформе Oracle Siebel CRM. Похожую задачу мы также успешно решили при внедрении системы управления мастер-данными (Master Data Management – MDM) для повышения качества данных, дедупликации клиентской информации и построения мастер-записи о клиенте в режиме реального времени. Обе системы в банке уже внедрены и используются.
CNews: Опишите архитектуру обработки больших данных.
Сергей Щелчков: Это зависит от требований по конкретному проекту. Данные из источника забираем при помощи ETL-средства (средства извлечения, преобразования и загрузки данных) или встроенных средств базы данных источника. Источники данных очень разнородны, это БД Oracle, DB2, SAS, Lotus, веб-сервисы, файлы и информация из интернета. При получении данных важно минимизировать нагрузку на источник, поэтому данные из источника забираем один раз в специальную область, аналог landing-области, у хранилищ данных. Откуда данные с требуемыми преобразованиями распространяются в системы-потребители, или как срез данных на момент времени или как дельта изменений по сравнению с предыдущей загрузкой. Из нестандартных технологий планируется использование дисковых массивов на технологии Flash.
CNews: В каких проектах Big Data оправдали ваши ожидания?
Сергей Щелчков: Это внедрение MDM-системы по клиентской информации, внедрение Siebel CRM.
CNews: В каких направлениях деятельности «Райффайзенбанка» Big Data могут принести эффект?
Сергей Щелчков: Big Data могут дать хорошие результаты в работе с потенциальными частными клиентами в отслеживании поведенческих характеристик при противодействии мошенничеству, в принятии решений по кредитным заявкам, а также при сегментации клиентов и создании маркетинговых кампаний в аналитической CRM. У нас в банке сейчас выполняются несколько проектов по этим направлениям.
CNews: Как вы оцениваете экономическую выгоду от проектов Big Data?
Сергей Щелчков: Не всегда эта выгода сразу заметна, если мы говорим абстрактно о повышении качества данных и повышении оперативности данных. Но, когда благодаря быстрой обработке качественных данных ускоряется бизнес-процесс, сокращается срок принятия решения или уменьшаются трудозатраты, то экономические выгоды налицо.
CNews: Где вы не обнаружили эффекта от Big Data?
Сергей Щелчков: Если эффект еще не обнаружен, это не значит, что его не будет в будущем, часто мы просто накапливаем данные, накапливаем историю их изменений, а пользу от наличия данных и их истории мы получим в будущем.
CNews: Расскажите о планах «Райффайзенбанка» в направлении Big Data.
Сергей Щелчков: Банк стремится лучше знать своего клиента, улучшить качество облуживания, а также снижать свои риски. Новыми областями для Big Data мы видим развитие аналитического CRM, процессов по распознаванию проблемных заемщиков, процессов предотвращения мошенничеств различного характера.
CNews: Что мешает проникновению технологий Big Data в банковском секторе?
Сергей Щелчков: Банк не может сразу работать по-новому, так мы разрушим работу банка. При реализации крупных проектов по внедрению принципиально новой ИТ-системы или платформы большое значение имеет наличие опыта по ее внедрению и дальнейшей эксплуатации. В банковской сфера дополнительно нужно учитывать различные требования регуляторов по обработке, хранению и представлению информации. Пока в банковской сфере не так много известно об успешных внедрениях с использованием технологий Big Data.