«Аэрофлот» внедрил российскую СУБД Tarantool
Платформа на базе Tarantool
«Аэрофлот», российский авиаперевозчик, развернул платформу по работе с обращениями клиентов с применением алгоритмов предиктивной аналитики больших данных. Одним из ключевых компонентов системы стала отечественная система управления базами данных (СУБД) Tarantool, разработанная Mail.ru. Проект внедрения осуществил «Интегро текнолоджиз», российский системный интегратор, входящий в ГК «Рамакс».
Tarantool используется в платформе для управления оперативной базой данных, в которой обращения хранятся в виде специальных структур данных, необходимых для алгоритмов аналитики.
По результатам внедрения «Аэрофлот» с помощью платформы оптимизировал процесс обработки жалоб и обращений клиентов ответственными сотрудниками авиакомпании, значительно сократил время доставки обращений и время на обработку и решение вопросов за счет механизмов обогащения обращений контекстом, тональностью, тематиками, профилем автора и т.п.
Все это нацелено на достижение положительного экономического и репутационного эффекта практически на всех этапах предоставления услуг «Аэрофлотом».
Структура платформы
Платформа по работе с обращениями представляет собой комплекс систем и единый центр доступа к индивидуальным клиентским данным для оказания персонального сервиса, регистрации, маршрутизации и обработки клиентских обращений. Основная задача комплекса – повышение лояльности клиентов с помощью SMM (Social Media Marketing – маркетинг в социальных сетях).
Комплекс состоит из нескольких модулей, которые покрывают функциональные бизнес-требования, обеспечивают интеграцию в существующую ИТ-инфраструктуру «Аэрофлота», а также в различные каналы поступления обращений (социальные сети, адрес электронной почты, официальный сайт, личный кабинет).
Первый модуль системы занимается процессом идентификации клиента на основе комплексного анализа данных, как самого текста (в том числе, комментариев), так и открытых данных профиля автора (ФИО, адрес электронной почты, телефон и т.п.). Объем обрабатываемых данных из различных источников равен нескольким тысячам обращений в день.
Второй модуль отвечает за поиск дублей обращений. Нередко пользователи копируют текст и публикуют его на различных ресурсах, в том числе, направляют по электронной почте. Семантически похожие посты важно определять для выявления кластеров, которые являются инцидентами. Обработка сразу нескольких постов существенно сокращает загрузку ответственных сотрудников.
Третий модуль «инфоповоды» в режиме реального времени занимается анализом потока текстовых данных (публикаций, комментариев). Происходит семантический анализ постов, построение связей слов и групп слов (n-грамм) с последующим наложением на временной ряд, а также поиск и агрегация инфоповодов. Алгоритм призван показывать пики активности в социальных сетях или ее рост, что может указывать на потенциальную «инфобомбу». Одна из возможностей данного модуля – предиктивно выявлять опасные посты еще до того, как начнется рост активности.
Почему «Аэрофлот» сделал выбор в пользу Tarantool
Объем данных, необходимый для перечисленных модулей системы, выходит за пределы привычного лимита локального хранения в приложении. Расчетное количество обращений к данным до внедрения Tarantool равнялось нескольким тысячам запросов в секунду с необходимым откликом в пару миллисекунд. Сложности разработке добавили такие требования, как, например, прописанное ограничение времени в три секунды на обогащение обращения различными свойствами.
Проведя анализ существующих БД на рынке, «Аэрофлот» остановил выбор на СУБД Tarantool по ряду причин.
Tarantool предоставляет полноценное окружение и набор инструментов для реализации ресурсоемкой вычислительной логики в самой БД. СУБД характеризуется поддержкой равноценности серверов и сбалансированного распределения данных для обеспечения высокого уровня отказоустойчивости и оптимального использования серверного оборудования.
Решение использует механизм компактного хранения данных в памяти, обладает низкими требованиями к аппаратному обеспечению, гарантирует сохранность данных и, наконец, является бесплатной, что позволяет существенно сократить расходы на оборудование и лицензии.
Производительность Tarantool в ряде тестов была на несколько процентов выше, чем у конкурентов, а компактность хранения практически на всех типах данных обгоняла конкурентов еще на несколько процентов. Одним из ключевых пожеланий «Аэрофлота» было использование отечественного ПО, так что выбранная платформа удовлетворила требования по всем параметрам.