Аналитика и большие данные должны приносить прибыль
Большие данные уже перешли из разряда хайповых технологий в категорию решений, без которых сложно представить эффективно развивающийся бизнес. Сегодня основная задача состоит в том, как монетизировать такие решения. Своим опытом поделились участники организованной CNews Conferences конференции «Аналитика и большие данные 2019: как получить эффективное решение».
Игорь Макаров: Мы готовы внедрить NVMe-oF с минимальными затратами
О том, как развивались интерфейсы для SSD и в чем основные преимущества NVMe-oF, рассказал Игорь Макаров, менеджер по развитию бизнеса Toshiba Memory Europe GMBH.
CNews: В чем, на ваш взгляд, преимущества использования SSD в ЦОД?
Игорь Макаров: Для начала стоит понять, что такое SSD. SSD (Solid State Drive) или твердотельный накопитель состоит из микросхем памяти, как правило флэш, хотя имеются и другие типы, а так же контроллера, управляющего этими микросхемами и обеспечивающего связь накопителя с хост-системой по интерфейсам. Основными интерфейсами для SSD на данный момент служат: SATA, SAS, NVMe.
Интерфейсы SATA и SAS были позаимствованы от традиционных накопителей с вращающими магнитными дисками, так называемыми HDD (Hard Disk Drive) или накопителей на жестких магнитных дисках, скорее для совместимости с уже имеющимися хост-системами. Интерфейс NVMe появился позднее и на данный момент быстро и динамично развивается.
Внедрение принципиально нового интерфейса было обусловлено спецификой работы SSD накопителей, отсутствием необходимости в обмене большим количеством сервисной и управляющей информацией, необходимой для поддержания работы HDD. Задачей нового интерфейса стало снижение задержек, повышение скорости передачи данных, масштабируемость подключаемых устройств – то есть всего того, чем SSD превосходят HDD.
Каждый новый процессор становится совершеннее в пересчете на основные показатели, физические размеры, потребляемую мощность. Однако жесткие диски, увеличивая свою емкость, постоянно снижали свои удельные характеристики производительности, а именно количество операций ввода-вывода на единицу емкости. По сути, емкость HDD росла существенно быстрее их способности обрабатывать данные. Таким образом сложилась ситуация, когда объединение нескольких HDD в единый массив с целью увеличения их производительности стало так нагружать процессор, что потребовало внедрения твердотельных накопителей.
Проникновение SSD в ЦОД началось как раз по причине отсутствия возможности обеспечить требуемые скорости обработки данных на основе HDD. Дополнительными факторами, повлиявшими на внедрение SSD, стали их габаритные показатели и энергопотребление. Плотность установки компонентов в стойке, количество операций на ватт потребленной энергии, затраты на охлаждение являются важнейшими индикаторами эффективности ЦОД. На сегодняшний день SSD уже вырвались вперед по емкости, а именно SSD предлагают 15ТБ в компактном форм факторе 2.5”, обеспечивая порядка 700-800 тысяч операций ввода-вывода против нескольких терабайт емкости и порядка 180-200 операций ввода-вывода. Вывод очевиден: если требуется обрабатывать данные, то это дешевле и эффективнее делать на SSD. Хранить же данные пока еще выгоднее на HDD формата 3.5”.
CNews: Что такое технология NVMe-oF?
Игорь Макаров: NVMe-oF или NVMe Over Fabrics – технология, позволяющая передавать команды и данные между хост-системами и NVMe накопителями через Ethernet, Fibre Channel (FC) или InfiniBand. NVMe Over Fabrics определяет общую архитектуру, которая поддерживает ряд сетевых структур хранения для протокола блочного хранения NVMe через сетевую структуру хранения. Она включает в себя наличие внешнего интерфейса системы хранения, возможность масштабирования до большого количества устройств NVMe и увеличение расстояния в пределах ЦОД, на котором можно получить доступ к устройствам NVMe и подсистемам NVMe.
Работа над спецификацией NVMe over Fabrics началась в 2014 году с целью распространить NVMe на такие структуры, как Ethernet, Fiber Channel и InfiniBand. NVMe over Fabrics предназначена для работы с любой подходящей сетью хранения данных. В настоящее время разрабатываются два типа сетевых транспортов для NVMe: NVMe Over Fabrics c использованием RDMA и NVMe Over Fabrics c использованием Fibre Channel (FC-NVMe). Цель NVMe Over Fabrics – обеспечить дистанционное подключение к устройствам NVMe с дополнительной задержкой не более 10 мкс по сравнению с устройством NVMe, находящимся непосредственно внутри сервера.
Существует несколько вариантов использования NVMe Over Fabrics. Можно легко представить систему хранения, состоящую из множества устройств NVMe, использующих NVMe Over Fabrics с интерфейсом RDMA или Fibre Channel, образующих законченное решение для хранения данных. Такая система обеспечит чрезвычайно высокую производительность при сохранении очень низкой задержки, присущей NVMe. Другая реализация будет использовать NVMe Over Fabrics для достижения низкой задержки при подключении только к подсистеме хранения, которая использует традиционные протоколы взаимодействия с SSD. Это позволит получить преимущество от упрощенного стека программного обеспечения хоста и более низкой задержки при передаче по проводам, совместно с существующей технологией подсистемы хранения.
CNews: Как вы оцениваете перспективы использования NVMe Over Fabrics?
Игорь Макаров: Исходя из повышенного интереса именно к NVMe oF, я оцениваю перспективы развития этой технологии весьма высоко. Ведь сама технология позволяет в кратчайший срок развернуть высокоскоростную, масштабируемую систему хранения данных с очень низкими задержками. Технология позволяет эффективно использовать дорогие серверные NVMe накопители и разделять их ресурсы среди огромного количества серверов. Решение Toshiba Kumoscale позволяет внедрить эту технологию с минимальными затратами уже сейчас.