Teradata предложила новый подход к проектированию и развертыванию «озер данных»
Корпорация Teradata, поставщик решений для аналитики больших данных и приложений интегрированного маркетинга, анонсировала свой новый подход к развертыванию «озер данных» на основе «шаблонных проектов», в которых нашел свое применение многолетний опыт консалтинга и оптимизации больших данных. Данный подход призван помочь клиентам построить «озера данных», сообщили CNews в Teradata.
Организации изучают функциональные возможности «озер данных» для понимания и использования растущих объемов данных. Однако работу ИТ-отделов осложняют серьезные проблемы, такие как недостаток передовых методик, нехватка специалистов по обработке и анализу данных и даже неясность в отношении определения «озера данных». Наряду с этими сложными задачами, растет число вариантов технологической реализации. Например, обычно считается, что «озера данных» аналогичны технологии Hadoop, которая является прекрасным выбором для многих рабочих нагрузок «озер данных»; однако «озеро данных» может быть построено на основе нескольких различных технологий, таких как Hadoop, NoSQL, Amazon Simple Storage Service (S3), реляционная база данных (система управления реляционными базами данных, RDBMS), либо их комбинаций, пояснили в Teradata.
«До тех пор, пока технологии определяют результат, для успешного построения “озера данных” необходим план. Шаблон проекта “озера данных” — это и есть тот самый план», — указали в компании. Шаблон проекта содержит объекты интеллектуальной собственности на основе передовых методик для корпоративного сегмента в сочетании с продуктами, разработанными совместно с другими компаниями на основе их опыта успешного привлечения клиентов.
«Корпорация Teradata вышла на передовой рубеж создания шаблонов реализации “озер данных”, — утверждает Тони Баер (Tony Baer), старший аналитик компании Ovum. — “Озеро данных” отличается от хранилища рабочих данных. Возможности, которые предлагает Teradata, основаны на реальном практическом опыте и помогут клиентам справляться с управлением данными в условиях разнородных сред. С приобретением компании Think Big корпорация Teradata приобрела ценные интеллектуальные активы — шаблоны проектов, которые помогут построить прозрачные “озера данных”».
Благодаря доступу к новым данным, таким как записи службы поддержки клиентов, сведения о посещении сайтов, IP-трафик, содержимое журналов событий, информация от датчиков, хранящаяся в «озере данных», пользователи могут рассматривать ситуации, обычно требующие взаимной проверки нескольких одновременных интерпретаций данных. В частности, они смогут создавать улучшенные модели распознавания оттока клиентов посредством выделения текста из звонков службы поддержки клиентов, хранящихся в «озере данных», с последующим применением методов предиктивной аналитики текста. Кроме того, пользователи получат возможность проводить анализ тенденций по отношению к комбинациям громадных потоков машинных данных и данных клиентов. Например, для коммунальных предприятий «озера данных» создают основу для сравнительной оценки выполнения нескольких моделей данных для изучения последствий установки энергосберегающего оборудования и скрытого эффекта снижения потребления электроэнергии (через несколько месяцев).
«Кто не слышал о кошмарах внедрения “озер данных”? Именно поэтому мы развиваемся: нас просят прийти и помочь исправить недостатки “озер данных”, которые не только создают проблемы, но и дорого обходятся компаниям, — рассказал Рон Бодкин (Ron Bodkin), президент компании Think Big, входящей в корпорацию Teradata. — Мы приспосабливаем наш подход, основанный на шаблоне проекта “озера данных”, к каждому конкретному случаю. К сожалению, многие компании считают сложности использования больших данных препятствием. Мы вытаскиваем клиентов из кризисных ситуаций и помогаем компаниям, ИТ-специалистам и специалистам по обработке и анализу данных планировать, внедрять и использовать преимущества “озер данных”. Последние, вообще-то, задумывались как серьезное подспорье для бизнеса — таковыми они и становятся, когда их построением занимаются профессионалы».
Как отмечается, с самого начала компания Think Big сохраняет нейтралитет в отношении платформ и технологий и сосредоточена на реализации преимуществ технологий с открытым исходным кодом, таких как Apache Hadoop, Apache Spark и NoSQL. Think Big предлагает ряд услуг по созданию проектов на основе шаблонов «озер данных», включая: шаблон Data Lake Foundation для коллективов, только начинающих работу с «озером данных» или которым необходимы советы по использованию передовых методик; шаблон Data Lake Architecture, разработанный для организаций, которым требуются рекомендации по применению передовых методик работы с «озером данных» и выбору технологий; шаблон Data Lake Analytics, который поддерживает первичную обработку данных при реализации аналитических циклов.
Teradata также предлагает разнообразные продукты и технологии, оптимизированные для использования в средах «озер данных». В их число входит Teradata Listener — продукт, упрощающий передачу потока больших данных в «озеро данных» благодаря интеллектуальному программному решению, не требующему дополнительного обслуживания; программный комплекс Teradata Appliance for Hadoop, доступное по цене решение для хранения данных; Presto — технология, обеспечивающее реализацию современной архитектуры SQL-on-Hadoop; и, наконец, акселераторы «озера данных», построенные на основе протокола IP, а именно — Pipeline Controller и Buffer Server, совместная работа которых обеспечивает управление перемещением данных из местных серверов в хранилище Hadoop.