Очень скоро заканчивается жизненный цикл VMware vSphere 7.0 и после 2 октября 2025 года уязвимости будут прирастать, а вот патчи вряд ли.
Просидев на 7-ке ровно 5 лет, мы решили обновиться на 8-ке. Обновление с update 3 на update 3 не предвещало никаких проблем… Так что продолжим традиции статьи Хождение по граблям VMware vSphere 7.0.
Обновление vCenter встаёт по таймауту
Обновили несколько vCenter’ов и на очередном обновлятор встаёт колом:
При этом даёт классный совет, типа, за 1 час не успеваю, дай мне побольше времени:
Upgrade phase timed out. The time planned for the upgrade phase
was 60 minutes. The upgrade phase has already been running for 60
minutes. To extend the default timeout, set environment variable
UPGRADE_EXPORT_TIMEOUT
Поиск дал ссылочку на БЗ – The vCenter Server upgrade from version 7.0 to 8.0 fails at 39% with the error: “Upgrade phase timed out” after getting stuck during the “Exporting the VMware Analytics Service data” step
Запускаем предложенный скрипт и смотрим на наличие 127k файликов в аналитике:
1 2 3 4 5 6 7 8 9 10 11 12 |
root@vc [ /tmp ]# ls /var/log/vmware/analytics/prod | wc -l 127465 root@vc [ /tmp ]# chmod +x cleaning_vddk_script.sh root@vc [ /tmp ]# ./cleaning_vddk_script.sh 90 Files before the clean : 127452 === Start cleaning VDDK files older than 90 days... Clean successful! === Files after the clean: 0 root@vc [ /tmp ]# ls /var/log/vmware/analytics/prod | wc -l 102 |
Зачем сломали интерфейс?
Интерфейс в 7-ке были вылизан и привычен. В 8-ке решили, что FULL HD мониторы – это прошлый век, и исправили иконки, всплывающие длинные поля поменяли на полный вывод, а если название хоста не влезет, то не постеснялись в 2 этажа отобразить. Выбор нескольких строк тоже поломали.
Старое оборудование не поддерживается в ESXi 8
После эпопеи VMware ESXi 7.0 и неподдерживаемое оборудование отказ от оборудования в 8-ке продолжился. По процессорам у нас вышли из поддержки Intel Xeon 26xx v2 – хорошо, отправим на списание. Для любителей хлама – неофициально ESXi8 на старых процессорах работает Heads Up – ESXi 8.0 Update 2 requires XSAVE CPU instruction even with allowLegacyCPU=true.
Актуальной остаётся проблема Отвал FC HBA Emulex 8/16-Gb/s после обновления VMware ESXi 7.0 update 3. Драйвер нужно интегрировать старый.
Загрузка ESXi и TPM 2.0
8-ка стала требовать включения TPM 2.0 на серверах (с TPM 1.2 грузится, но ругается):
TPM 1.2 device detected. Support for TPM version 1.2 is discontinued. Installation may proceed, but may cause the system to behave unexpectedly.Make sure the host is upgraded to TPM 2.0.
Как оказалось, на всех старых серверах необходимо на уровне UEFI, а местами и джамперов, переключаться на TPM 2.0.
Как включить TPM 2.0 на серверах Lenovo:
- How to set TPM and enable secure boot on a Lenovo ThinkSystem
- 3550 M5 System-board switches, jumpers, and buttons
- 3650 M5 TPM 2.0
QuickBoot и TPM 2.0, а ещё TXT и IPMI
С 8-ки поддерживается QuickBoot на серверах с TPM 2.0, но встаём на целый набор граблей: современный сервер пишет, что поддержки нет. Запускаем утилиту проверки для определения причин:
1 2 3 4 5 6 |
/usr/lib/vmware/loadesx/bin/loadESXCheckCompat.py BmcInfo: ipmi returned invalid data length: 1 ccode 255 BmcInfoImpl: Retrieve Version information failed This system is not QuickBoot compatible: violating one or more strict requirements (Quick Boot is not supported on this machine) The host does not fulfill the following hard dependencies: - Intel TXT is enabled |
Ищем где выключить TXT на серверах Lenovo – находим нужный пункт в этой КБ:
1 2 3 4 |
/usr/lib/vmware/loadesx/bin/loadESXCheckCompat.py BmcInfo: ipmi returned invalid data length: 1 ccode 255 BmcInfoImpl: Retrieve Version information failed This system is compatible with Quick Boot. |
По второй ошибке – “BMC Firmware Version” missing in System information of VMware DCUI, проверяем, что поля заполнены или нет:
1 2 3 4 5 6 7 8 9 10 11 12 |
esxcli hardware ipmi bmc get BMCFirmware Version: 0.00 Hostname Reported: IPMIVersion: 0.0 IPv4Address: IPv4Gateway: IPv4Subnet: IPv6Addresses: LANif Admin Status: false MACAddress: Manufacturer: Unknown OSName Reported: |
Ошибка спустя несколько минут исправилась после перезагрузки контроллера.
В итоге получаем:
1 2 |
/usr/lib/vmware/loadesx/bin/loadESXCheckCompat.py This system is compatible with Quick Boot. |
Проблема с плагином Veeam BR
Также отвалился плагин для Veeam BR – порешалось переустановкой? Нет…
Distributed switch Features:
8.0.3 Dual DPU Support
8.0.0 Network Offloads Support
7.0.3 NVMe over TCP
7.0.2 LACP Fast Mode
Для обновления ESXi надо удалить старые драйверы от 6.7:
esxcli software vib remove -n nenic --dry-run
esxcli software vib remove -n nfnic --dry-run
esxcli software vib remove -n nmlx4-core --dry-run
esxcli software vib remove -n nmlx4-en --dry-run
esxcli software vib remove -n nmlx4-rdma --dry-run
Нетаповский nfs-плагин тоже просто так не поставить, первая сборка ветки 2.0 оказалась без подписи и после замены показывает старую чексумму:
2025-04-22T11:55:15Z lifecycle: 2115306: imagemanagerctl:157 ERROR esximage.Errors.VibChecksumError: ('NetApp_bootbank_NetAppNasPlugin_2.0.1-16', 'VIB checksum does not match: calculated: 843541d744953d0241cbdc975b893f757ad5babee4d062fcc1d201e484dba030, expected: 62ea7eaa674a0cc15935420da3625f3b7d0d780a8ccdf08eb024b49c704f1874')
Решилось сбросом базы vLCM.
Исправить код 204 вместо сертификата по адресу https://vcenter/afd/vecs/ca назначением прав на директорию:
chmod g+wx /var/lib/vmware/vmca