«Ашан» запустил платформу для работы с большими данными в облаке Mail.ru Cloud Solutions

Интеграция Инфраструктура Ритейл Розница Big Data Облака

«Ашан» развернул аналитическую платформу для больших данных (Big Data) в публичном облаке Mail.ru Cloud Solutions. Новое решение будет использоваться как для обучения искусственного интеллекта и ML-моделей, так и для ad-hoc аналитики для продуктовых и функциональных команд.

На базе облачной платформы Big Data будет идти разработка и промышленная эксплуатация продуктовых ИИ-решений, включая сервисы для управления цепочками поставок, ценообразованием и программами лояльности. Также в экосистеме Big Data Platform будут развернуты лаборатории данных, в рамках которых продуктовые и функциональные команды будут проводить исследования и ad-hoc аналитику.

Ранее ритейлер использовал для аналитики, обучения ML-моделей и поддержки бизнес-процессов одну и ту же базу данных. Высокая нагрузка на систему, которая возникает при работе с аналитическими проектами, негативно влияла на производительность других сервисов. Для запуска полноценной платформы работы с данными и обработки более сложных задач из области Data Science компания искала партнера, который предлагает нужные компоненты как услугу в облаке. В целях быстрого масштабирования и консолидации всех аналитических направлений на одной платформе «Ашан» решил запустить Big Data Platform в облаке Mail.ru Cloud Solutions.

При выборе поставщика «Ашан» руководствовался двумя важными критериями: наличие всех необходимых платформенных компонентов и оптимальное соотношение цены и качества услуг. Кроме того, было необходимо обеспечить соблюдение 152-ФЗ о персональных данных.

«Ашан» запустил пилотный проект, в рамках которого платформа Mail.ru Cloud Solutions продемонстрировала соответствие требованиям компании, ожиданиям по производительности и скорости развертывания. В основу Big Data Platform лег сервис Cloud Big Data с Apache Hadoop, на который было перенесено 25 ТБ сырых данных, необходимых для построения моделей данных ИИ-решений. Построение витрин данных и ETL между различными компонентами Big Data Platform было реализовано с помощью компонента Spark. Управляемая база данных ClickHouse используется для хранения «горячих» данных, ad-hoc аналитики и витрин данных для ИИ-решений. В качестве массивно-параллельной системы компания подключила Arenadata DB на основе СУБД Greenplum. Ее использование облегчит проведение исследований для логистики, коммерческой дирекции и маркетинга «Ашан».

Компания планирует обучать десятки тысяч ML-моделей, поэтому обратилась к технологии Kubernetes от MCS. Функция автоматического масштабирования кластеров позволяет задействовать сотни машин для обучения и автоматически уменьшать мощности при перерывах в использовании.

На платформе MCS компания построила конвейер обработки больших данных, собираемый под задачу из готовых компонентов PaaS (Platform as a Service) как аналитический конструктор. Запуск платформы Big Data в облаке Mail.ru Cloud Solutions позволил «Ашану» быстро и легко масштабироваться под потребности бизнеса за счет использования кластерных технологий, параллельных вычислений и автомасштабирования Kubernetes.

«Мы видим, что только переход в облако способен удовлетворить запрос быстрорастущего бизнеса на масштабирование ИТ-инфраструктуры. Клиенты понимают ценность облачной платформы, где они получают продвинутые технологии по клику. Бизнес может сфокусироваться на решении своих задач, а не вкладываться в разработку инструментов с нуля», — сказал Илья Летунов, руководитель платформы Mail.ru Cloud Solutions и Tarantool.

«Решение Mail.ru Cloud Solutions соответствовало нашим внутренним требованиям к технологическому стеку, надежности, гибкости, информационной защите. Прогноз спроса – наше первое решение, которое мы перенесли и развернули на нашей облачной Big Data Platform. Мы ожидаем, что промышленное использование данного решения в облаке позволит нам сократить товарные запасы в магазинах минимум на 5% и увеличить продажи на 2% и более. Кроме того, использование микросервисной архитектуры на базе Kubernetes позволит нам эффективно управлять нашими ресурсами в облаке и оптимизировать затраты на разработку, внедрение и поддержку наших ИИ-решений», — сказал Александр Дорофеев, руководитель Big Data компании «Ашан ритейл Россия».


Крупнейшие поставщики BI-решений в России 2017

№ 2016 Название организации Выручка по направлению BI с НДС в 2016 г., ₽тыс. Рост 2016/2015
1 Softline 1 661 471 14,2%
2 GlowByte Consulting 1 450 000 27,1%
3 AT Consulting 1 408 954 4,3%
4 Крок 1 308 708 22,9%
5 Сапран * 590 000 29,9%

смотреть полный рейтиг