Руководство по синтетическому бенчмаркингу корпоративных систем хранения данных и лучшие практики. Часть 2. Критерии успеха и параметры бенчмаркинга

Николай Куликов опубликовал своё руководство по тестированию систем хранения на английском языке, поэтому захотелось получить русский вариант. Данный перевод выполнен ИИ с моими правками (возможны правки формулировок).

Определение критериев успеха для синтетического бенчмаркинга
Исходные данные и вводные
Сбор метрик из существующих систем
Список параметров, которые необходимо определить

Заключение

Определение критериев успеха для синтетического бенчмаркинга

Как я уже упоминал в первой части руководства, определение целей и критериев успеха является обязательным шагом для успешного POC. Конечно, критерии успеха могут быть разными, но у них есть нечто общее – они должны следовать правилам S.M.A.R.T:

  • Конкретность – цель должна быть конкретной и ясной для всех, кто участвует в тестировании. Не должно быть никаких разночтений, двусмысленных толкований или “само собой разумеется”.
  • Измеримость – это означает, что существует метрика или число, которое может однозначно определить прохождение/непрохождение или результат A лучше, чем B.
  • Достижимость – требования должны быть реалистичными и достижимыми (хотя бы теоретически) для каждого участника. В противном случае нет смысла тратить на это время.
  • Релевантность – здесь это самый важный пункт. Вы должны быть в состоянии прояснить и очень четко показать, почему были выбраны именно такие цели и метрики. Как они связаны с потребностями бизнеса? Почему именно эта метрика или число, а не другая? И будьте осторожны со ссылками на “отраслевые стандарты”, “вот как мы делали это раньше”, “опыт других компаний”. Слишком легко ошибиться и потерять релевантность вашим конкретным бизнес-потребностям.
  • Ограниченность во времени – в вашем плане POC должны быть четко и заранее определены временные рамки и сроки.

Цели, а также подробная контрольная программа (описывающая, как именно будут проводиться тесты) должны быть написаны ДО начала POC и одобрены/подтверждены каждым участником.

Я также рекомендую отправить черновик программы участникам, часто они могут дать полезные советы, рекомендации или комментарии, а также для того, чтобы они были готовы. А также быть на связи с производителями/партнерами в процессе бенчмаркинга, особенно, если есть какие-то проблемы или система не смогла достичь поставленных целей. Часто эти проблемы можно легко решить, просто правильно настроив и отрегулировав систему.

Упрощенный пример критерия успеха может выглядеть следующим образом: “Задержка в гостевых ОС, работающих на системе хранения данных в нормальных условиях и полностью рабочем состоянии, должна быть менее 1,5 мс при 95-м процентиле при обеспечении 100 тыс. IOPS с профилем 8K 70/30 Чтение/Запись 90% Случайный доступ”. Рабочая нагрузка генерируется 12 ВМ с 5 виртуальными дисками в каждой, использование хранилища (общий объем данных, хранимых этими ВМ) должно составлять 70% от полезной ёмкости хранилища, размер набора активной рабочей нагрузки составляет 10%, продолжительность теста 2 часа после 1 часа прогрева”. Continue reading “Руководство по синтетическому бенчмаркингу корпоративных систем хранения данных и лучшие практики. Часть 2. Критерии успеха и параметры бенчмаркинга”

Руководство по синтетическому бенчмаркингу корпоративных систем хранения данных и лучшие практики. Часть 1. Общая теория, методы и подходы

Николай Куликов опубликовал своё руководство по тестированию систем хранения на английском языке, поэтому захотелось получить русский вариант. Данный перевод выполнен ИИ с моими правками (возможны правки формулировок).

Введение
Определение целей бенчмаркинга
Выбор подхода и методологии бенчмаркинга

Выбор инструментов и утилиты для синтетического бенчмаркинга хранилища данных
Формирование конфигурации демонстрационной среды

Заключение

Введение

За более чем десять лет работы в ИТ-индустрии я провел множество тестов и проверок концепций (proof-of-concepts, POC) различных систем хранения данных (СХД). Хотя это были совершенно разные типы систем хранения – традиционные SAN-системы хранения с подключением по FC, NAS, SDS (Software Defined Storage, программно-определяемое хранилище) и платформы HCI (Hyper Converged Infrastructure, гиперконвергентная инфраструктура), задачи были практически одинаковыми. И довольно часто я сталкивался с ситуацией, когда тесты никак не соответствовали потребностям бизнеса и даже были технически некорректны, что приводило к невозможности получить какие-либо значимые результаты.

Все мы знаем, насколько критически важными могут быть системы хранения данных для ИТ- и бизнес-операций. Мы также знаем, как много усилий требуется от всех вовлеченных сторон, чтобы правильно протестировать систему хранения и получить значимые результаты, способствующие процессу принятия решений. Именно поэтому я верю, что хорошо структурированный подход с полным вниманием к деталям является обязательным условием для любого вида тестирования и/или бенчмаркинга систем хранения данных.

В большинстве случаев валидация/POC систем хранения данных состоит из трех частей – тесты доступности, функциональные тесты и тесты производительности (они же бенчмаркинг):

  1. Функциональные тесты очень специфичны для конкретной организации, поскольку они должны быть согласованы с ИТ-ландшафтом заказчика, бизнес-процессами и другими отличительными аспектами.
  2. Тесты доступности требуют много времени, но это самая очевидная часть – заказчик должен составить список потенциальных рисков, описать ожидаемое поведение в каждом случае, определить с производителем/поставщиком/дистрибьютором варианты моделирования таких сценариев и выполнить такие тесты.
  3. Тесты производительности или бенчмаркинг – сложная и часто противоречивая часть плана тестирования, потому что это всегда баланс между применимостью и точностью против осуществимости и сложности.

В этом руководстве я рассмотрю только аспект тестирования производительности, и он будет связан в основном с синтетическим бенчмаркингом основной системы хранения общего назначения. Основная цель данного руководства – предоставить указания и рекомендации по проведению бенчмаркинга любого типа корпоративных систем хранения данных для получения значимых результатов при минимизации усилий. Я не буду много говорить об общих вещах, связанных с тестированием в целом и с организацией POC.

Это руководство состоит из двух частей – первая часть более универсальна и подходит практически для любой ситуации, когда вам необходимо провести синтетическое нагрузочное тестирование. Поэтому она состоит в основном из общих приемов, лучших практик и рекомендаций (хотя я постараюсь добавить больше примеров), а не из конкретных действий. Вторая часть – практическая и конкретная, где я на примере показываю, как можно проводить нагрузочное тестирование и как каждый из параметров нагрузочного тестирования влияет на результат.

Чтобы быть более конкретным и, по сути, отразить мой самый последний опыт, все дальнейшие примеры будут связаны с тестированием систем хранения данных в среде виртуальной инфраструктуры VMware.  Однако эти рекомендации могут быть применены и в других случаях с минимальными изменениями. Continue reading “Руководство по синтетическому бенчмаркингу корпоративных систем хранения данных и лучшие практики. Часть 1. Общая теория, методы и подходы”

VMware vCenter 7.0 Lifecycle Manager не скачивает обновления через прокси

Попали на странные грабли – VMware vCenter 7.0 Lifecycle Manager не скачивает обновления через прокси.

При запуске Sync Update выпадает в ошибку ‘A general system error occurred: Download patch definitions task failed while syncing depots. Error: ‘integrity.fault.NoSignatureSiteConnection’.

Поиск в интернете выдает пару рекомендаций:

  1. vCenter 7.0, Lifecycle Manager fails downloading patches Error: “integrity.fault.NoSignatureSiteConnection”
  2. “A general system error occurred: Download patch definitions task failed while syncing depots. Error: ‘integrity.fault.MetadataDownloadFailure’.” Sync Updates vCenter 7.0.3c

Про второй случай я уже писал – и второй раз сбрасывать базу не собирался.

Обновление VMware vCenter с версии 6.7 до 7.0

А вот первый совет навёл на странную мысль, что в указании https прокси надо вместо https://ip_proxy указать http://ip_proxy. Как ни странно, помогло.

Мониторинг IBM Bladecenter AMM по протоколу SNMP в Zabbix 6

Мы несколько лет используем Zabbix для мониторинга различных операционных систем – Linux, Windows, vSphere.

Иногда приходится добавлять и железо. Пришла задачка замониторить лезвийное шасси IBM Bladecenter H.

Поиск выдал старый шаблон Template IBM BC_AMM SNMP Chassis Stats.xml в формате Zabbix 2.0. Мы его посмотрели и наваяли свой под Zabbix 6.0.

Скачать шаблон IBM Bladecenter AMM SNMP в формате Zabbix 6.

P.S. Дополнительно залил пропавший на просторах сети шаблон для Lenovo ThinkSystem XClarity Contoller (заменить USERNAME и PASSWORD в макросах).

VMware vSAN: как к нему подходить и с чего начинать

Статья прислана читателем бложика.

Предисловие

Изначально этот текст представлял собой выборку ссылок и пояснений из подготовленной где-то перед новым, 2022 годом, презентации «почему vSAN нам не очень нужен». В апреле 2022 года старый текст пришлось перечитать, переписать и существенно расширить. По логике надо бы этот текст разбить на четыре части – теория, подготовка развертывания, тестирование, и рабочие моменты, но вряд ли я этим займусь.

Уровень материала: 50-100.

Уровень требуемого английского для чтения: IELTS 3, способность скопировать непонятный текст и вставить в пока еще доступные онлайн переводчики.

Аффтар(ТМ) выражает отдельную благодарность участникам и администрации русского сообщества https://t.me/VMwarevSAN/ за внесенные коррективы, уточнения и огромную подготовительную работу.

Оглавление

Continue reading “VMware vSAN: как к нему подходить и с чего начинать”

Свежие релизы российских СРК и ВД

На этой неделе друг за другом две компании представили новые релизы продуктов на российском рынке систем резервного копирования и восстановления данных.

Компания «Киберпротект» представила Кибер Бэкап 15U2.6:

  • Поддержка Подключаемого модуля аутентификации (PAM-модуля)
  • Поддержка новых операционных систем (ОС)
    • РЕД ОС версии 7.3
    • SUSE Linux Enterprise Server 15
    • ОС Linux с версией ядра 5.0 и выше (до 5.15)
  • Поддержка решения для управления виртуализацией серверов и рабочих станций Ред Виртуализация.

Компания RuBackup представила Rubackup 1.9:

  • Ролевая модель доступа к административным функциям системы резервного копирования. Возможность разграничения доступа для нескольких администраторов единой системы резервного копирования
  • Автоматическая балансировка задач резервного копирования между пулами или медиа-серверами резервного копирования
  • Приоритезация заданий резервного копирования
  • Менеджер администратора RuBackup вынесен в отдельный пакет и может работать на отдельном АРМ
  • Консолидированная отчетность
  • Возможность разрешить или запретить централизованное восстановление, а так же возможность запретить восстановление или инициацию резервного копирования со стороны клиента
  • Автономный режим работы клиента RuBackup
  • Возможность установить минимальный обязательный период хранения любых резервных копий, без возможности их удаления из системы резервного копирования
  • Добавлены модули резервного копирования:
    • Среда виртуализации Aerodisk AIST
    • СУБД PostgreSQL 13
    • СУБД MS SQL
    • СУБД SQLite
    • СУБД Tarantool

Февральские патчи ESXi 2022 года

Статья прислана читателем бложика.

Занимались аудитом и обслуживанием очередной пары фирм, попутно обновляли VMware  – увидели много интересного.

Первая фирма, обновления 7.0.1 – 7.0 Update 2e build 19290878.

Опять какие-то проблемы с iSCSI. На одном сервере полностью поменялся IQN, причем с изменением даже имени. После этого по возвращении сервер не увидел СХД, пришлось настраивать. На аналогичном втором сервере потерялся target, но IQN остался тот же.

Как оказалось, проблема описана в интернете, НО что-то не находится в VMware release notes: Continue reading “Февральские патчи ESXi 2022 года”

Релиз RVTools 4.3.1

Rob de Veij выпустил обновление своей отличной утилиты инвентаризации VMware vSphere — RVTools версии 4.3.1.

В этой версии используется VMware vSphere Management SDK 7.0U3, а также есть другие изменения:

  • Новая вкладка “vSource”: отображается информация о сервере, на котором запущена веб-служба SDK, используемая RVTools для сбора всех данных. Это ваш сервер vCenter или хост ESX.
  • На вкладке vHost появилась новая колонка: Host UUID.
  • Свойства Health: новые флажки для включения или отключения сообщений о состоянии безопасности и производительности.
  • На всех связанных страницах вкладки VM столбец UUID был заполнен значением SMBIOS UUID, которое не является уникальным. Теперь столбец заполняется уникальным 128-битным значением UUID, специфичным для VirtualCenter.
  • На вкладке vHealth: новые советы по производительности дискового ввода-вывода и памяти.
  • Исправлено: на вкладке vInfo не отображалось значение Video RAM.
  • Исправлено: RVToolsMergeExcelFiles, когда один из xlsx файлов не содержит ВМ, то в объединенный xlsx добавлялась дополнительная строка заголовка.

Hyper-V Deep Dive

Недавно зашло обсуждение c друзьями про возможности Hyper-V и собеседник дал ссылку на подробную документацию Верхнеуровневая функциональная спецификация гипервизора:

Hypervisor Top Level Functional Specification Windows Server 2019 v6.0b

Дополнительно рекомендую ознакомиться со статьёй What happens if I don’t upgrade the virtual machine configuration version?

Релиз VMware vSphere 7.0 Update 3с

VMware vSphere 7.0 Update 3 вернулся!

В официальном списке KB обещают, что исправлены причины отзыва:

Summary KB Impact Fix / Workaround
ESXi 7.0 Update 3 hosts can experience a PSOD when virtual machines on a VMFS6 thin disk execute UNMAP/TRIM functions. 86100 Potential ESXi host crash This issue is resolved in ESXi 7.0 Update 3c.
Starting with vSphere 7.0 Update 3, the inbox i40enu network driver for ESXi changes name back to i40en.  This can result in ESXi failing to update with the error: “host returned esxupdate code –1″ 85982 Upgrade Blocking This issue is resolved in ESXi 7.0 Update 3c.
In vCenter 7.0 Update 3 FIPS compliance was enabled by default; This has the impact of blocking the SMB protocol; VAMI backup fails using SMB Protocol on vCenter 7.0 U3 with the error: “Path not exported by remote file system” 86069 BCDR Impacting This issue is resolved in vCenter Server 7.0 Update 3c.
Enabling vSphere HA might fail or never complete on hosts that were upgraded to ESXi 7.0 Update 3. 86191 Environmental Stability This issue is resolved in ESXi 7.0 Update 3c.

Выпустили официальный список KB, обязательный к ознакомлению и применению:

Knowledge Base article title Knowledge Base article link
Upgrading vCenter Server 7.0 fails during precheck with “Host(s) were found in the vCenter Inventory, that are potentially problematic for a vCenter upgrade” KB86447
Using the dual_driver_check.py script KB87258
Converting an ESXi cluster to be vLCM image managed fails in vCenter Server 7.0u3c with “The following host(s) have an ESXi version higher than ESXi 7.0 U2a and lower than ESXi 7.0 U3c” KB87308
Enabling vSphere HA might fail or never complete on hosts with ESXi 7.0u2c/u2d and 7.0u3/u3a KB87299
Critical baseline may remain Non-compliant after first remediation KB87451
Platform Configuration Error: /usr/sbin/esxupdate returned with exit status: 32″, ESXi 7.0 Upgrade fails if the environment had migrated from NSX-V to NSX-T using NSX V2T migration KB87423
Workaround Instructions For CVE-2021-22045 on VMware ESXi Hosts KB87249
Upgrading to vCenter Server 7.0 U3c using the CLI fails during precheck with “Installation failed. Retry to resume from the current state. Or please collect the VC support bundle”‘ KB87319

Почему-то не упомянули в таблицах KB эти фиксы: