Lenovo ThinkSystem M.2 Mirror распадается на двое

Опыт эксплуатации серверов Lenovo ThinkSystem выявил одну болячку. При использовании M.2 Mirror комплекта для размещение гипервизора неожиданно виртуальный диск в RAID распадается на два – каждому накопителю свой виртуальный диск,  система сыпет ошибками.

Решение довольно простое – надо удалить второй дубликат в меню F1 Setup –> UEFI Setup –> System Settings –> Storage –> M.2 + Mirroring Kit Configuration Utility –> Virtual Disk Management и дождаться ребилда. Если диск не ребилдится, а пишет Foreign, то выбрать Import.

Проблеме уже года полтора, но только сейчас Lenovo официальное её признала, выпустив заметку в базе знаний M.2 + Mirror Kit RAID 1 splits into 2 foreign RAID 1 drives with possible rebuild failure – Lenovo ThinkSystem.

Для предупреждения необходимо обновить прошивку M.2 Mirror до версии v2.3.10.1194 (она же 2.3.10.1098).

Не работает мониторинг в vCenter Server Appliance

Встретилась проблема – раздел Monitor в VCSA не показывает новых данных. При этом в разделе Services служба VMware Appliance Monitoring Service находится в состоянии Stopped либо в консоли проверить статус службы vmware-statsmonitor:

Гугление подсказало решение – выставить время ожидания старта службы в 10 минут (предварительно сделать снимок VCSA – после проверки удалить):

  1. Подключиться по  SSH к VCSA, используя root.
  2. Изменить время ожидания:
  3. Убить процесс
  4. Принудительно выполнить перезапуск сервиса
  5. Перезапустить VCSA и проверить через 15 минут, что VMware Appliance Monitoring Service запущен.

Вышел Vembu BDR Suite v4.0

Всех с наступающим праздником оливье и мандаринов.

Наш спонсор без устали работал и выпустил новую версию своего флагманского продукта – Vembu BDR Suite v4.0.

Из нововведений:

  • поддержка резервного копирования виртуальных машин (ВМ), находящихся в Hyper-V кластере. Теперь инкрементальная копия не прервется при переезде ВМ;
  • появился компонент “Credential Manager”, позволяющий использовать централизованное хранение административных учетных записей при добавлении новых хостов;
  • добавилась поддержка “Shared VHDX”;
  • добавилась технология создания инкрементов, использующаяся при сбое основного механизма “Change Block Tracking”;
  • интерфейс (GUI) был оптимизирован с целью упрощения процессов.

Также есть ряд более “мелких” нововведений:

  • новый диск виртуальной машины будет сохранен при создании инкремента (ранее он сохранялся только при выполнении полного резервного копирования);
  • про сбое задания на бэкап, например, при отпадывании сети, оно автоматически продолжится при восстановлении сетевого соединения;
  • при восстановлении ВМ из бэкапа VMware вы можете указать – какими характеристиками будет обладать ВМ (количество сокетов и ядер, памяти и т.п.);
  • при восстановлении ВМ из бэкапа Hyper-V вы можете указать другой хост/кластер;
  • вы можете выбрать, с каких ВМ нужно собирать “Application state”, чтобы делать консистентные бэкапы MSSQL, например. Netbackup пока так не умеет 😉
  • добавилась возможность переключать реплику между серверами, находящимися в резервном сайте;
  • при выполнении “Quick Recovery (включение из бэкапа)” вы получите краткий отчет о статусе этой операции, содержащий имя ВМ и хоста;
  • выпущен API, позволяющий анализировать утилизацию хранилища бэкапов виртуальными машинами.

Скачать можно отсюда, здесь – информация о выпуске (release notes).

А теперь – обещаный бонус: компания Vembu проводит опрос, за участие в котором вы можете получить подарочную карту Amazon.

PowerCLI – CloneVM

Понадобилось наполнить объект vAPP однотипными клонами одной и той же ВМ.

Клонировать ее вручную показалось трудоемко – изучил возможности PowerCLI и написал себе шпаргалку:

После подключения к vCenter запускаем подобный скрипт:

После запуска данного скрипта у вас появится 67 однотипных клонов виртуальной машины vm01_bi.

Вместо параметра VApp рекомендуется использовать параметр “ResourcePool”

vSphere HA reconfiguration timed out

После обновления Windows vCenter до версии 6.0 Update 3h (с 3d или 3e), на ряде кластеров стала наблюдаться замечательная картина – агенты на хостах vSphere 6.0U3 в разных кластерах стали выдавать ошибку:

Перенастройка HA (Reconfigure for vSphere HA) завершалась таймаутом.

Чтение журнала fdm.log показало, что в момент начала переконфигурирования агента выдается следующее сообщение:

Смутно похожая статья из KB рекомендовала “просто выключить и включить HA”.

Удостоверившись, что настройки кластера стандартные, я выключил HA, подождал несколько минут, проверил статус служб “vSphere High Availability Agent” и заново включил HA.

Помогло.

Обновление HPE StoreOnce

HPE StoreOnce – это такой аппаратно-программный апплайнс, на который можно делать резервные копии.

К программной части периодически выходит обновление, к аппаратной части – прошивки.

StoreOnce даже имеет встроенное оповещение:

Так как под рукой не оказалось гайда по обновлению, а сайт HPE был недоступен в силу каких-то очередных преобразований, я решил черкнуть заметку тут.

Continue reading “Обновление HPE StoreOnce”

Минимальная рекомендуемая версия vHW

На днях озадачился проблемой с минимальной версией vHW в ESXi.

Текущая ситуация с ESXi такова:

  1. ESXi 6.7 поддерживает vHW версий с 4 по 14 – Virtual machine hardware versions.
  2. vSphere 5.5 сошла с дистанции.
  3. В связи с Чипокалипсом минимальная рекомендуемая версия – 9, сильно рекомендуемая – 11: Hypervisor-Assisted Guest Mitigation for Branch Target injectionPerformance impact on VMware appliances after patching for Spectre/Meltdown.
  4. VCSA 6.7u1 использует Photon OS 1.0, который у нас не работает, если поднять версию старше 11.
  5. Есть непонятки с EVC Mode и vHW.
  6. UNMAP в тонких дисках поддерживается с версии vHW 11, для Linux с версии vHW 13.
  7. Поддержка Per-VM EVC требует vHW версии 14.
  8. Поддержка Secure Boot требует vHW версии 13.
  9. Поддержка Dynamic DirectPath требует vHW версии 17.
  10. Поддержка Virtual NUMA Topology и Virtual HT требует vHW версии 20.

В итоге мы ориентируемся на следующие версии (предварительно делается копия *.vmx либо бэкап ВМ, после повышения проверка, Upgrading a virtual machine to the latest hardware version (multiple versions)):

  1. Готовые Virtual Appliances и шаблоны виртуальных машин повышаются до версии 11 либо 14.
  2. Целевая версия для Linux с тонкими дисками – 14 либо 17.
  3. Целевая версия для ПО, требующего новых инструкций CPU – 14 либо 17.
  4. В частных случаях смотрим на фунционал Hardware Features Available with Virtual Machine Compatibility Settings и  Hardware Features Available with Virtual Machine Compatibility Settings.

Обновление версии VCSA с 6.7 до 6.7 update 1

Ранее в бложике были описаны два сценария установки обновлений на VCSA 6.7:

Но, чтобы админы на работе не скучали, компания VMware стремится разнообразить способы обновления.

Для обновления VCSA 6.7  в режиме HA до версии 6.7 update 1 опубликована отдельная статья в БЗ VMware Changes in patching VCHA enabled vSphere 6.7 systems to any 6.7 update/patch release:

  1. Зайдите vSphere Client.
  2. Перейдите в Configure > vCHA.
  3. Нажмите Edit.
  4. Выберите “Remove vCenter HA”.
  5. Обновите vCenter Server.
  6. Заново создайте vCHA.

После пары матюков в адрес разработчиков были выполнены данные рекомендации и осуществлена попытка обновить vCenter через VAMI (по инструкции для одиночного сервера), но установщик вставал на 73% и заваливал vCenter. После этого запущено обновление через CLI (один цикл из инструкции по обновление в конфигурации HA), которое прошло без сбоев.

EVC Mode и vHW

Заметил странный факт, что на процессорах Skylake и гипервизоре ESXi 6.7u1 “не отрабатывает” EVC Mode, выставленный в  Skylake – все машины стоят в режиме Broadwell.

Обратил внимание, что у нас 80% виртуальных машин работают на virtual hardware(vHW)  версии 11, он же Compatibility: ESXi 6.0 and later (VM version 11).

Предположил, что данный уровень дополнительно ограничивает уровень ЦПУ, хотя в EVC and CPU Compatibility FAQ и Enhanced vMotion Compatibility (EVC) processor support ничего про такое поведение не заметил.

Решил пойти опытным путём – создал ВМ и прогнал все версии vHW c 4 до 14. В результате выявилось, что ВМ с vHW от 4 до 12 имеют максимальный EVC Mode -Broadwell, а ВМ с vHW равным 13 или 14 могут быть в режиме Skylake.

VMware – возможна потеря данных в SEsparse

Благодаря подписке на рассылку от Veeam Community Forums, углядел наличие одной прелестной проблемы с vSphere.

При использовании SEsparse-снапшотов могут наблюдаться следующие симптомы:

  • СУБД могут репортовать о несогласованности блоков данных внутри БД;
  • гостевые операционные системы могут сообщить о сбоях блоков данных;
  • виртуальные машины могут перестать загружаться.

Continue reading “VMware – возможна потеря данных в SEsparse”