Big Data увеличила суммарное время аудитории на сайте Sports.ru до 20 лет в день

Big Data Маркет
, Текст: Александра Кирьянова
Анализ больших данных о посетителях портала Sports.ru помог существенно повысить посещаемость и привлечь авторов «из народа». Данные используются для сегментации аудитории и создания персонализированных email-рассылок или индивидуальных рекомендаций на сайте. Благодаря этому подписки на блоги выросли в восемь раз, а число регистраций – в пять раз. Суммарное время, проводимое пользователями на сайте в течение дня, достигло 20 лет.

Около года назад руководство спортивного сайта Sports.ru и спортивной социальной сети «Трибуна» пришло к выводу, что аналитика, поставляемая публичными счетчиками, недостаточна для развития интернет-проекта. Руководители проектов начали искать новые способы обработки данных. Портал, собирающий более 1 млн уникальных посетителей в сутки, располагает большим объемом информации для анализа. Ежедневно на сайте размещается около 700 новостей и 500 текстов (97%  из которых пользовательские). Впоследствии они также доступны через 160 мобильных приложений и в 1200 тематических группах в соцсетях (посвященных разным видам спорта, клубам и спортсменам), что значительно расширяет конечную аудиторию потребителей.

«Нельзя сказать, что мы знали, что делаем в начале пути. Мы предполагали, что данные добавят нашему интуитивному творчеству чуть больше смысла. И нам очень хотелось много красивых графиков и больше понимания, чем живут наши пользователи. Мы совсем не ожидали, что за год построим систему полного цикла обработки данных, а компания начнет дышать в ритме DataDriven», – вспоминает Илья Салтанов, директор по развитию Sports.ru.

Для анализа обширной информации о пользователях Sports.ru обратился к технологиям BigData. Сбор сырых данных компания делает сама, а функции хранения, вычисления, анализа и визуализации было решено вынести в облако. Для этих задач аналитики Sports.ru воспользовались сервисами Amazon Redshift, Chart.io и AppAnnie. Такая архитектура позволила обойтись без капитальных затрат. На аренду серверов и оплату внешних сервисов компания тратит около 60 тыс. руб. в месяц.

Сейчас Sports.ru анализирует и соотносит данные об источниках трафика, просмотрах страниц, активности пользователей и их предпочтения. Информацию об интересах читателей компания получает разными способами. Например, посетителям на сайте задается вопрос об их любимой команде, анализируется по каким тегам человек чаще всего читает новости и посты, сравниваются источники трафика с базой фанатских сайтов и т.д. Sports.ru также контролирует активность подписчиков своих новостных потоков о командах, спортсменах и видах спорта в социальных сетях.

Полученные данные используются для сегментации аудитории и создания персонализированных email-рассылок или индивидуальных рекомендаций на сайте. Например, система позволяет сделать рассылку для пользователей, болеющих за ЦСКА, имеющих телефон c Android и аккаунт в Facebook, заходивших на сайт регулярно в течение прошлого года, но переставших посещать сайт на прошлой неделе. «Мы знаем теперь очень многое о наших читателях. Формируя матрицу предпочтений каждого посетителя, мы накладываем на нее матрицу рекомендаций и даем каждому релевантные подсказки», – говорит Илья Салтанов.

По словам руководителя отдела аналитики Sports.ru Олега Новикова, понимание интересов аудитории сайта сильно помогает повышать активность пользователей. «Некоторые типы рекомендаций давали очень сильный эффект: например, восьмикратный роста числа подписок на блоги и теги или пятикратный рост числа регистраций. CTR некоторых персонализированных блоков достигает 50%. Из числа посетителей с явными клубными предпочтениями, перешедших с фанатских сайтов, 80% ответило на вопрос о любимом клубе. Персонализация помогла сделать сайт более удобным и рассказать пользователям о новых возможностях, про которые они не знали. Сейчас дневная аудитория сайта достигает 1,2 млн уникальных посетителей, а суммарное время, проводимое пользователями на сайте в течение дня, достигло 20 лет», – рассказал он.

Анализ аудитории сайта помог редакции Sports.ru получить глубокое понимание информационных потребностей пользователей. Как рассказали в компании, кластеризация посетителей по интересующим их тегам показала, что кроме очевидных групп пользователей, читающих только про клубы российской премьер-лиги или ЦСКА, есть сегмент посетителей, предпочитающих только такие «мужские» виды спорта, как хоккей, бокс и бои без правил.

Интересно, что анализ Big Data выявил достаточно большую группу посетителей, которые интересуются только красивыми спортсменками независимо от вида спорта или клуба. Представители этого сегмента аудитории регулярно читают посты и смотрят галереи про Илону Корстин, Марию Кириленко и Анастасию Янькову.

Технологии помогают Sports.ru привлекать и продвигать авторов из социальных сетей. «Мы замечаем действительно ярких персонажей и берем их в оборот в социальной редакции: выносим посты на главную, раскидываем ссылки по потокам, даем им советы по оформлению и подаче», – рассказывает Илья Салтанов.

Анализ больших данных помог переформатировать редакционную стратегию Sports.ru, ставшего по сути средством массовой информации поколения 2.0. Его новостной поток формируется из сообщений профессиональных журналистов и авторов из социальных сетей с учетом интересов пользователей, а место на первой полосе определяется не редактором, а каждым конкретным читателем.

Sports.ru идет по логичному пути, по которому уже прошли многие крупные интернет-компании, такие как Google, Facebook, «Яндекс», Mail.ru. Они используют технологии, по масштабу соответствующие задачам проекта. «Вероятно, со следующим значительным скачком количества пользователей Sports.ru начнет использовать и Hadoop, который вполне вписывается в описанную задачу, - говорит Михаил Соловьев, ведущий системный архитектор дивизиона данных компании IBS. - Sports.ru – очень интересный пример современного СМИ 2.0. Сейчас мы видим несколько лидеров этого тренда: digg.com, reddit.com, habrahabr.ru, livejournal.com. На примерах этих сайтов видно, как по-разному могут быть реализованы схожие идеи, как они работают на разных рынках».

Сайт Sports.ru представляет собой самостоятельный бизнес, а не интернет-страницу бумажного СМИ. Для этого бизнеса, живущего по своим правилам, важны все знания о посетителе: как, когда и почему он пришел на сайт, зачем, с чем ушел. При помощи Big Data сайт готовится к следующему визиту этого посетителя, становится «лучше» для него и для всех остальных сотен тысяч посетителей – так достигается увеличение охвата аудитории и гарантируются повторные визиты пользователей. «В модели, когда еще и наполнение сайта генерируют в большой степени сами пользователи, их вовлеченность, широта охвата аудитории, проникновение становятся критическими показателями для бизнеса. СМИ 2.0 уже сейчас масштабируемые, мобильные, актуальные и персонифицированные. Они похожи на газету в романе про Гарри Поттера – персональные новости объединяются в блоки, рубрики в момент начала чтения такой газеты. И по ходу чтения газета актуализируется, подстраивается под читателя», – добавляет Михаил Соловьев.


Крупнейшие поставщики BI-решений в России 2017

№ 2016 Название организации Выручка по направлению BI с НДС в 2016 г., ₽тыс. Рост 2016/2015
1 Softline 1 661 471 14,2%
2 GlowByte Consulting 1 450 000 27,1%
3 AT Consulting 1 408 954 4,3%
4 Крок 1 308 708 22,9%
5 Сапран * 590 000 29,9%

смотреть полный рейтиг