«ЦРТ-инновации» представили новый метод анализа больших данных

Цифровизация Big Data
, Текст: Татьяна Короткова

Компания «ЦРТ-инновации» (группа компаний ЦРТ) при поддержке Министерства образования и науки РФ разработала новый метод выделения связных контекстов словоупотребления, ориентированный на работу с живой неподготовленной (спонтанной) речью. Использоваться новый метод будет в таких инструментах речевой аналитики ЦРТ, как «Модуль кластеризации» и «Модуль автоматического аннотирования», сообщили CNews в компании ЦРТ.

По словам представителей «ЦРТ-инноваций», метод основан на технологиях работы с большими данными (Big Data) и современных методах машинного обучения (machine learning) в сочетании с глубоким лингвистическим и семантическим анализом речи.

Особенно остро проблема «понимания» речи (речевого сообщения и/или большого объема речевых данных) стоит в крупных контакт-центрах, обрабатывающих информацию в постоянном режиме и больших объемах. Именно поэтому основными потенциальными потребителями систем, автоматически выделяющих связные контексты (логические структуры, «ситуации») тех или иных значимых для анализа слов, являются аналитические службы КЦ и службы технической поддержки государственных и коммерческих структур.

Цель выделения контекстов в больших массивах данных — учитывать информацию, непосредственно связанную с целевым словом, и не включать в контекст нерелевантную информацию, пояснили в компании. В целом выделение связных контекстов слов упрощает работу аналитиков, позволяя им в автоматическом режиме решать такие задачи, как: анализ употребления ключевых слов (людей, организаций, географических объектов) в тексте и/или речи; выявление контекстов употребления ключевых (значимых) слов в диалогах; составление текстовой аннотации (информативной выжимки) текста и/или речи; автоматическое формирование заголовков тематических кластеров и т.п.


Крупнейшие поставщики BI-решений в России 2017

№ 2016 Название организации Выручка по направлению BI с НДС в 2016 г., ₽тыс. Рост 2016/2015
1 Softline 1 661 471 14,2%
2 GlowByte Consulting 1 450 000 27,1%
3 AT Consulting 1 408 954 4,3%
4 Крок 1 308 708 22,9%
5 Сапран * 590 000 29,9%

смотреть полный рейтиг