Экономика больших данных: способы монетизации
В этом году большие данные преодолели пик завышенных ожиданий в Цикле зрелости технологий Gartner и перешли в стадию избавления от иллюзий. В России обсуждение этого стека решений переходит из тональности «это круто» в плоскость «почему это выгодно». Как монетизировать технологии анализа больших данных, обсудили участники круглого стола «Большие данные: тренд новых ИТ», организованного 4 декабря 2014 г. агентствами CNews Conferences и CNews Analytics.
Именно как решение для «маленьких данных» изначально создавалась система Tarantool, которая сегодня все больше вписывается в парадигму больших данных. Эта система с открытым кодом родилась для решения проблем онлайн-бизнеса Mail.Ru Group, в частности задачи кэширования состояния фронт-эндов в масштабируемых архитектурах. Как рассказал руководитель подразделения разработчиков Mail.Ru Group Константин Осипов, на рынке есть много систем хранения данных в оперативной памяти, но ни одна из них не удовлетворяла потребностям Mail.Ru Group. К тому же эти системы абсолютно закрыты и не допускают сторонних доработок. Tarantool, напротив, является открытым решением, программисты могут расширять его своим кодом и использовать любые внешние модули. Решение компании Mail.Ru Group 100% данных хранит в оперативной памяти, за счет чего обеспечиваются очень быстрый отклик на запросы и отказоустойчивость. По словам Осипова, за счет скорости и расширяемости время ответа системы удалось сократить с секунды до микросекунды, что не позволяет технология Hadoop.
В некоторых бизнесах такая высокая скорость отклика оказалась важна. Сейчас Tarantool используется не только в Mail.Ru Group, но и в других компаниях банковской сферы и электронной коммерции. За счет хранения данных в оперативной памяти и возможности реализации собственной логики система оказалась пригодна для аналитических задач. Онлайн-доска объявлений Avito использует Tarantool, чтобы по минимальному числу действий быстро сегментировать пользователей сервиса и показывать им наиболее релевантные объявления. Решение также применяется в Sberbank Digital Ventures для противодействия мошенничеству с пластиковыми картами.
Сквозная отчетность
К внедрению новых технологий зачастую подталкивает не стремление к совершенствованию, а недееспособность существующих систем – высокая степень «плохизны», как шутят ИТ-директора. Так, в «ВТБ Страхование» рост объемов бизнеса привел к необходимости обработки все больших объемов данных, подготовка отчетности требовала много ручного труда, часть отчетов рассчитывалась часами, при этом доступ к данным контролировался слабо.
Чтобы изменить ситуацию, была внедрена новая система бизнес-аналитики, которая обеспечила формирование «сквозной» отчетности в условиях функционирования множества учетных систем. По словам главного специалиста отдела финансовых систем «ВТБ Страхование» Александр Языков, новая BI-система не только решила базовые проблемы, но теперь также позволяет оценить доходность каждого агента, обеспечила общий подход к работе с данными и сделала возможным выведение конечных витрин данных для пользователей.
Своя бигдата
С развитием технологий границы личной информации становятся все более размытыми. Согласно исследованию, анализ анонимизированной информации о времени и месте звонков и SMS полутора миллионов абонентов на протяжении пятнадцати месяцев показал, что для идентификации 95% людей достаточно знать всего четыре пространственно-временные точки их присутствия.
«Я не давал разрешения накапливать информацию о моем местонахождении», – в ходе круглого стола звучали и недовольные мнения участников. Тем не менее, технологии больших данных имеют и очевидные плюсы для обычных людей. Например, интеграция данных сотового оператора и банка позволяет зафиксировать мошенничество, если операция по банковской карте производится далеко от местонахождения ее владельца (определяется при помощи телефона). Это позволяет заблокировать платеж еще до того, как человек обнаружит пропажу своей карты.
«Алгоритмы, построенные на анализе больших данных, позволяют определить типичное поведение для клиента и реагировать на отклонения», – рассказывает Евгений Буслов из «Петер-сервиса». Например, клиент просит провести транзакцию через интернет-банкинг, но звонит при этом из района X, хотя обычно в это время он находится дома в районе Y или на работе в районе Z. В такой ситуации система может усилить меры безопасности по идентификации клиента.
Действие больших данных уже ощущают на себе и люди, и компании. Жизнь первых становится комфортнее, работа вторых – результативнее. Новые технологии, позволяющие снижать расходы и повышать эффективность, скорее всего будут особенно востребованы в сложных экономических условиях, полагают эксперты.
Александра Кирьянова
Презентации участников конференции