Статья

Что можно делать с Большими данными

Big Data
мобильная версия

Практического опыта использования Больших данных в бизнесе пока накоплено не очень много даже на мировом рынке, а российский сектор только подступается к этой теме. Однако некоторые кейсы уже известны и широко обсуждаются. Big data оказываются полезными не только компаниям финансового сектора или телекома, но и в спорте, и в политике.

«Большие данные» как определение все еще сохраняет некоторую терминологическую размытость. По крайней мере, российские ИТ-директора пока не сходятся во мнении, существуют ли такие данные в их реальности или же им по-прежнему приходится иметь дело с возрастающими объемами «обычных» данных. В мировой практике как минимум половина опрошенных Gartner крупных компаний определяет Большие данные не по объему, а по разнообразию поставляющих их источников. Неоднозначность толкования самого термина соответственно усложняет изучение уже реализуемых проектов Big Data — начиная с того, что вообще таковыми считать. В компании Teradata их определяют, например, как проекты, вовлекающие многообразные источники данных и открывающие новые горизонты аналитических возможностей.

В мире, по данным Gartner, уже 64% опрошенных компаний утверждают, что запустили или планируют запустить проекты Big Data. В 2012 г. таковых было 58%, из них 27% уже вели подобные проекты. Теперь же доля работающих с Большими данными компаний выросла до 30%. Более половины респондентов указывают главным мотиватором возможность вывести взаимодействие с клиентами на новый уровень.

Big Data означает переход к новой клиенториентированности, поясняет, говоря о потенциале использования Больших данных в бизнесе, Стивен Бробст, директор по технологиям Teradata. По его словам, актуальную сейчас «экономику внимания» сменяет «экономика намерений», когда задача поставщиков состоит уже не в ривлечении внимания покупателей многообразными способами, а в том, чтобы максимально упростить и ускорить их выбор. В новой парадигме — С2В (Consumer to Business) — покупатель формулирует конкретный запрос, в ответ на который озвучивают свои предложения поставщики, а покупатель выбирает из них оптимальный для себя вариант. Отслеживать такие запросы и быстро формировать под них адекватные предложения помогают постоянно накапливаемые и анализируемые Большие данные. В итоге то направление, которое мы сегодня знаем как Business Intelligence, со временем превращается в Consumer Intelligence.

Big Data на выборах

Пользователь: Предвыборный штаб Барака Обамы.

Задача: Исследование поведения избирателей, сбор денежных средств, максимально эффективное расходование финансовых ресурсов в ходе кампании.

Рейд Джани (Rayid Ghani), главный аналитик (или «главный ученый», chief scientist — о новой профессии data scientist журнал CNews писал в No 66, с. 50) предвыборного штаба Обамы, поясняет, что в ходе кампании нужно было решать задачи как привлечения финансирования, так и оптимального распределения ресурсов. Например, важно было в первую очередь сфокусироваться на агитации «колеблющихся». В американском представлении это отнюдь не те, кто выбирает, за какую из двух партий голосовать. Обычно такой выбор уже сделан раз и навсегда, считает Джани, и переход из одного лагеря в другой в Америке обычно невозможен.

Однако избиратель, пусть даже однозначно поддерживающий демократов, может просто не дойти до выборов. Соответственно, нужно обеспечить максимальную явку. И, поскольку финансовые ресурсы для агитации не бесконечны, важно оптимально распределить их в ходе кампании. Скажем, не нужно уговаривать «до последнего» — достаточно обеспечить 51% голосов в каждом штате. Тем более не нужно тратить усилия на агитацию убежденных противников.

Соответственно, аналитики штаба Обамы были заняты постоянным мониторингом ситуации с целью оперативной корректировки стратегий. В режиме реального времени обрабатывались данные опросов общественного мнения, на основе полученных результатов принимались решения о выделении ресурсов. Например, на дополнительную рекламу (по ТВ или онлайн), ориентированную на конкретную целевую аудиторию. Команда могла спрогнозировать, кому и какое число напоминаний нужно прислать, чтобы собрать пожертвования или убедить проголосовать впервые и пр. Залогом успеха предвыборной кампании Обамы в его штабе называют «измерение всего, что можно измерить» и постоянное моделирование вариантов.

Если вспомнить предыдущие выборы, то в кампании 2008 г. в основном использовались телефонные звонки и визиты на дом, чтобы убедить избирателей прийти и проголосовать. В 2012 г. стало ясно, что до большинства избирателей молодого возраста гораздо проще достучаться через соцсети. Тем более что телефонной линии или ТВ у них может просто не оказаться. При этом избиратели старшего поколения по-прежнему лучше воспринимают живое общение или даже вообще не доступны по «цифровым каналам». Соответственно, аналитикам нужно было определить перспективные целевые группы аудитории избирателей, а также наиболее эффективные каналы для взаимодействия с ними. Именно такой подход, по мнению Джани, будет со временем использоваться в предвыборных кампаниях повсеместно.

Начав активно работать с молодежью через соцсети, команда дата-ученых под руководством Джани «вербовала» в Facebook не только потенциальных избирателей, но и агитаторов. Ведь, помимо денежных ресурсов, в ходе кампании необходимы были и ресурсы человеческие. В соцсети отбирались наиболее перспективные кадры — с точки зрения их влиятельности на мнения «друзей» и подписчиков, а также охвата этих подписчиков. Использование контактов соцсетей давало, по их мнению, самый лучший результат: «чем ближе контакт, тем с большей вероятностью он побуждает к действию — прийти на выборы».

Big Data в спорте

Пользователь: Футбольный клуб Chelsea.

Задача: Отбор игроков, управление инвестициями в таланты, управление здоровьем и физической нагрузкой игроков.

Майк Форд, исполнительный директор футбольного клуба Chelsea, отмечает, что профессиональный футбол — это бизнес. А в этом бизнесе, как в любом другом, необходимо анализировать большое количество данных для принятия решений, например при отборе игроков в основной состав, поиске будущих талантов и пр. Помимо этого, данные, собираемые клубом, — это также база исследований для мониторинга здоровья игроков, оценки влияния возраста и KPI, управления их физической нагрузкой. Здесь есть много откровений для дата-ученых, считает Форд. Например, интересные результаты обнаружил анализ кривой возраста. Традиционно считалось, что в идеальной команде игрокам в среднем должно быть по 27 лет. Однако футбольный клуб Милана продемонстрировал, что чемпионами могут стать и команды, где средний возраст игроков 31 год.


Полную версию статьи читайте в свежем номере журнала CNews.

Мария Попова


Крупнейшие поставщики BI-решений в России 2017

№ 2016 Название организации Выручка по направлению BI с НДС в 2016 г., ₽тыс. Рост 2016/2015
1 Softline 1 661 471 14,2%
2 GlowByte Consulting 1 450 000 27,1%
3 AT Consulting 1 408 954 4,3%
4 Крок 1 308 708 22,9%
5 Сапран * 590 000 29,9%

смотреть полный рейтиг