Почему vGPU не уступают по производительности «железным» решениям

Решения
Павел Игнатьев
20.06.2019
Количество просмотров
2815
VMware обновили свой гипервизор ESXi. Теперь скорость работы виртуальных графических процессоров под его управлением сопоставима с возможностями их bare metal реализаций — разница составляет всего 3%. Рассказываем, как компании удалось этого добиться.

Что поменяли

ИТ-гигант внес две модификации в конфигурацию ESXi: отключил функцию vMotion и добавил поддержку технологии DirectPath I/O.

Задачей vMotion является балансировка нагрузки — система мигрирует виртуальные машины (ВМ) между серверами. При переносе ВМ местоположение ее файлов не меняется, просто она начинает потреблять ресурсы (память и процессор) другого хоста ESXi. Отключив vMotion, VMware закрепили vGPU за конкретными виртуальными машинами. Такой подход сократил издержки, связанные с передачей данных при миграции, и увеличил общую производительность гипервизора.

Что касается DirectPath I/O, то эта технология напрямую связывает драйвер CUDA (программно-аппаратную архитектуру параллельных вычислений для GPU от Nvidia) с ВМ — в обход гипервизора.

Сам по себе метод DirectPath работает только для связки «одна виртуальная машина — один GPU». Если виртуальной машине требуется большее число ускорителей, то они связываются в единый кластер с помощью технологии FlexDirect (от партнеров VMware — BitFusion). Если же, наоборот, необходимо разделить мощности одного GPU среди нескольких виртуальных машин, то здесь используется технология Nvidia GRID — она делит память карты на независимые сегменты фиксированного размера.

Общую схему работы системы можно представить следующим образом:

Отключили функцию vMotion и добавил поддержку технологии DirectPath I/O

Перспективы

Инженеры VMware протестировали обновленный гипервизор на задаче с обучением языковой модели, используя открытую программную библиотеку для МО TensorFlow. Производительность виртуальных графических процессоров была всего на три-четыре процента меньше, чем у решений bare metal. При этом виртуальная система обладала большим потенциалом к масштабированию.

Производительность vGPU проверили и в работе с контейнерными технологиями. Разработчики ИТ-гиганта разделили ресурсы одного графического процессора между четырьмя контейнерными ВМ и запустили на этой инфраструктуре нейронную сеть для распознавания изображений. В этой ситуации производительность индивидуальных машин снизилась почти на 20% (по сравнению с одной ВМ, имеющей в своем распоряжении все ресурсы графического ускорителя), но при этом в три раза выросло (средний график) число обрабатываемых за секунду изображений.

В VMware говорят, что технология найдет применение в сфере высокопроизводительных вычислений (HPC): ESXi будут использовать для обучения нейросетей, рендеринга, моделирования и проведения симуляций. Пока что для таких нагрузок виртуализация практически не применяется.

Инженеры VMware надеются, что обновленный ESXi поспособствует распространению виртуализированных решений на рынке высокопроизводительных систем. Сегодня виртуализированы порядка 70% рабочих нагрузок в дата-центрах. Оставшиеся 30% по большей части представляют собой HPC-системы, которые работают на bare metal. В Statista говорят, что к 2021 году ситуация изменится и уже 94% рабочих нагрузок дата-центров будут выполняться в виртуальной среде (соответственно, всего 6% будет приходиться на системы без гипервизоров).

Unsplash License

/ фото Thomas Jensen / Unsplash License

Кто еще занимается vGPU

Кроме VMware разработкой технологий виртуализации графических ускорителей занимаются AMD и Intel.

Первый ИТ-гигант разрабатывает технологию SR-IOV. Она делит аппаратные возможности физического устройства между несколькими виртуальными машинами. Хотя основной целью SR-IOV является виртуализация сетевых плат, компания предлагает использовать её для работы с GPU.

Технология уже позволяет разделить ресурсы одного ускорителя между шестнадцатью пользователями, поддерживая равную производительность для каждого из них. Технология Intel строится на базе кросс-платформенного гипервизора Citrix XenServer 7. Она объединяет работу стандартного GPU-драйвера и виртуальной машины. ВМ получает возможность оперировать «тяжелыми» приложениями на устройствах нескольких сотен пользователей одновременно.

Что ждет рынок

Разработчики аппаратного и программного обеспечения для работы с графическими ускорителями делают ставку на рост популярности HPC-решений. Аналитики говорят, что объем продаж аппаратного обеспечения для высокопроизводительных систем составит 45 млрд долларов к 2022 году (с учетом того, что два года назад эта цифра равнялась 32 млрд). ИТ-гиганты надеются, что необходимость обрабатывать крупные объемы данных приведет к росту спроса на vGPU.

При этом разрабатываются технологии, которые повысят производительность виртуальных решений. Инженеры стараются совместить возможности классических и графических процессоров на одном чипе, чтобы получить лучшее от обоих миров. Такие технологии позволят эффективнее выполнять задачи, связанные с графикой и логическими операциями. По словам экспертов, новые объединенные решения изменят подход к виртуализации и распределению виртуальных ресурсов в рамках дата-центров.

Материалы по теме из нашего блога:

Средняя оценка: 0, всего оценок: 0
Поделиться

Только полезные материалы в нашей рассылке

Ошибка подписки

Похожие статьи

Решения
Страхование облачных рисков с «ИТ-ГРАД» и AIG
28.12.2015
Количество просмотров
2726

Страхование облачных рисков с «ИТ-ГРАД» и AIG

Если вы задавались подобным вопросом и до сих пор не знаете точного ответа, мы подготовили материал, который поможет вам в этом разобраться.
IT-инфраструктура
Протокол IPv6: адресов хватит всем
11.02.2021
Количество просмотров
8365

Протокол IPv6: адресов хватит всем

Как известно, IPv4, протокол, появившийся в далеком 1981 году, подразумевает 32-битную адресацию. Это значит, что адрес включает 4 байта, каждый из которых принимает значение от 0 до 255, разделенных точкой. Таким образом, всего возможно выдать 4 294 967 296 уникальных адресов. Число только кажется большим: на практике «запас» из четырех с хвостиком миллиардов адресов уже исчерпан.
Решения
Лучшие практики миграции и развертывания инфраструктуры в облаке IaaS
27.11.2017
Количество просмотров
4390

Лучшие практики миграции и развертывания инфраструктуры в облаке IaaS

Как часто вы покупаете товар, о котором мало что известно? Наверняка в такую ситуацию попадал каждый хотя бы раз, при этом ожидания не всегда соответствовали действительности. А характерно ли аналогичное для облака? Стоит ли отдавать предпочтение облачным сервисам, не зная конечного результата?

Ваше обращение приняли

Скоро наш менеджер свяжется с вами.
А пока вы можете изучить интересные материалы в нашем блоге.

Подписка оформлена

Скоро отправим вам уведомление о новых материалах.