Рекомендую подписаться на следующие группы в Telegram для получения широкой экспертной поддержки:
При вступлении в группы осмотритесь, оцените обстановку и не забудьте ознакомиться с правилами задавания вопросов.
Записки о виртуализации и о жизни
Рекомендую подписаться на следующие группы в Telegram для получения широкой экспертной поддержки:
При вступлении в группы осмотритесь, оцените обстановку и не забудьте ознакомиться с правилами задавания вопросов.
Недавно мы писали о выходе нового обновления для vSphere 7.0
И вот, встав не с той ноги, решили обновить VCSA в нашей инфраструктуре Horizon.
Как у нас заведено, сделали снимок ВМ VCSA с оперативной памятью и запустили в GUI обновление, аналогично
Как это бывает с GUI, обновление не завершилось:
1 |
Data conversion/Post install hook failed |
Статусы служб при попытке пнуть вручную:
1 |
Service-control failed. Error: Failed to start services in profile ALL. RC=5, stderr=Failed to start eam, vsphere-ui, analytics, lookupsvc, applmgmt, vmware-postgres-archiver, vtsdb services. Error: Operation not allowed in current service state |
Решили откатить снимок и запустить обновление с CLI, но vpxd был с нами не согласен:
1 2 3 4 5 |
10:53 020-11-05T05:52:27.046Z error vpxd[25938] [Originator@6876 sub=Default opID=HB-host-103@780911-5fc80db7] An unrecoverable problem has occurred, stopping the VMware VirtualCenter service. Error: Error[VdbODBCError] (-1) "ODBC error: (23505) - ERROR: duplicate key value violates unique constraint "pk_n_vm_config_info"; --> Error while executing the query" is returned when executing SQL statement "INSERT INTO VPX_NON_ORM_VM_CONFIG_INFO (ID,CHANGE_VERSION,CHANGE_TRACKING_ENABLED,CPU_HOT_ADD_ENABLED,CPU_HOT_REMOVE_ENABLED,MEM_HOT_ADD_ENABLED,HARDWARE_NUM,HARDWARE_MEMORY,HARDWARE_CORES,VIRTUAL_ICH7M_PRESENT,VIRTUAL_SMC_PRESENT,TOOLS_BEFORE_GUEST_STANDBY_FLG,TOOLS_BEFORE_GUESTSHUTDOWN_FLG,TOOLS_TOOLS_UPGRADE_POLICY,TOOLS_AFTER_RESUME_FLG,TOOLS_AFTER_POWER_ON_FLG,TOOLS_SYNC_TIME_WITH_HOST_FLG,TOOLS_TOOLS_VERSION,TOOLS_LASTINSTALL_COUNTER,GUEST_FULL_NAME,INSTANCE_UUID,UUID,ANNOTATION,VERSION,TEMPLATE_FLG,M" 2020-11-05T05:52:27.051Z panic vpxd[25938] [Originator@6876 sub=Default opID=HB-host-103@780911-5fc80db7] --> |
Предположительно, во время снятия снимка Horizon клепал ВМ и мы попали в конфликт записей о ВМ.
Сделав несколько вздохов, приступили к восстановлению из резервной копии. На всякий случай, прогулялись по граблям:
Как обновлять с помощью ISO в CLI описано в статье
В этот же раз мы обновляли с URL:
1 2 3 4 5 6 7 |
software-packages stage --url https://vapp-updates.vmware.com/vai-catalog/valm/vmw/8d167796-34d5-4899-be0a-6daade4005a3/7.0.0.10400.latest/ --acceptEulas software-packages list --staged software-packages install --staged reboot |
Пару недель назад прошёл VMworld 2020. Было порядка 900 сессий, из которых я успел посмотреть малую малость.
Про просьбе трудящихся публикую плейлист (видео требовали регистрацию, PDF – нет):
Релиз VMware vSphere 7.0 update 1:
VMware vSphere Hypervisor (ESXi) 7.0U1 [Release Notes] [Download]
VMware vCenter Server 7.0U1 [Release Notes] [Download]
VMware vRealize Automation 8.2.0 [Release Notes] [Download]
VMware vRealize Orchestrator Appliance 8.2.0 [Release Notes] [Download]
VMware vRealize Operations 8.2.0 [Release Notes] [Download]
VMware vRealize Log Insight 8.2.0 [Release Notes] [Download]
VMware vRealize Suite Lifecycle Manager 8.2.0 [Release Notes] [Download]
Анонс VMware vSphere 7 Update 1, vSAN 7 Update 1 и Cloud Foundation 4.1
В платформе VMware vSphere 6.7 появилась технология vSphere(ESXi) Quick Boot, предназначенная для быстрой перезагрузки ESXi хостов во время обновлений с помощью vSphere Update Manager.
Технология требует соблюдения нескольких условий, описанных в БЗ Understanding ESXi Quick Boot Compatibility (52477):
В vSphere 7.0 третье ограничение снято, а четвертое отсутствует архитектурно.
Для проверки можно использовать локальный скрипт, выводящие информацию о совместимости модели сервера и драйверов:
1 |
/usr/lib/vmware/loadesx/bin/loadESXCheckCompat.py |
Пример вывода на стендовом хосте:
1 2 3 |
LoadESX is not compatible with vmkLinux drivers. This platform (IBM:System x3650 M2 -[794744G]-) is not compatible with loadESX. Compatibility check failed: violating one or more strict requirements (loadESX is not supported on this machine) |
Для быстрого обновления хостов технология включается в vSphere 7+ Menu->Lifecycle Manager-> Images/Baselines Remediation Settings->Quick Boot. Сокращение времени установки равно времени проверок UEFI при полной перезагрузке хоста.
Также меня заинтересовала возможность быстрой перезагрузки хостов без применения обновлений, поиск в интернете выявил два схожих варианта.
1 2 3 |
/bin/loadESXEnable -e /usr/lib/vmware/loadesx/bin/loadESX.py reboot |
1 2 3 |
/bin/loadESXEnable -e /usr/lib/vmware/loadesx/bin/loadESXShutdown.sh prepare reboot |
Прошу проголосовать за добавление функционала в графический интерфейс на портале по сбору идей vSphere Ideas, авторизация стандартная от vmware.com.
Компания VMware сегодня анонсирует обновления своих инфраструктурных продуктов VMware vSphere 7 Update 1, VMware vSAN 7 Update 1 и VMware Cloud Foundation 4.1:
Update 16092020
Запись вебинара на русском языке
https://cormachogan.com/2020/09/15/vsan-7-0u1-whats-new/
vSphere 7 Update 1 – vSphere Lifecycle Manager Improvements
vSphere 7 Update 1 – AMD SEV-ES
What’s New with VMware vSphere 7 Update 1
Цикл статей о борьбе с VMware vSphere 7.0 продолжается. Читайте содержимое предыдущих серий:
Обновление IBM/LENOVO System X M5 Embedded Hypervisor on SD-card до версии ESXi 7.0
Снимки ВМ и NetApp FAS ONTAP
Самая жёсткая проблема, с которой столкнулись — это переход LUN’ов на системе хранения NetApp FAS в режим Offline при попытке сделать снимок из-под vSphere 7.0 с ошибкой “Out of space”.
Предположительно, проблема связана с All Flash LUN’ами, созданными в ONTAP версии 9.1 или 9.2. Проблема наблюдается в ONTAP 9.7P4, более поздние патчи не проверяли.
Для нас пока закончилось падением пары продуктивных баз данных при инициации резервного копирования.
Решение проблемы:
vLCM Image и Intel VMD NVMe Driver
Самая весёлая проблема, которая убила кучу времени.
При переводе кластеров с модели обновления Baseline на модель обновления Image поймали отличный конфликт компонентов там, где не ожидали.
Про драйвер читать в статье:
На текущий момент в VSAN HCL рекомендуется версия драйвера intel-nvme-vmd-2.0.0.1146, в стандартном же образе зашит другой драйвер iavmd 2.0.0.1055-3vmw.700.1.0.15843807. При попытке собрать образ, совместимый с VSAN HCL получаем невозможность установить компоненты HA. Валят скопом такие ошибки:
Решение проблемы:
В итоге, проходим проверку на VSAN HCL и получаем Warning при проверке Image Compliance.
Update 11092020. 10.09.2020 драйвер iavmd 2.0.0.1055-3vmw.700 добавлен в VSAN HCL.
Image не накатывается на хосты
Ещё одна весёлая проблема, при попытке пройти проверку или накатить Image получаем шедевральную ошибку:
Unknown error occurred when invoking host API.
Самое тупое решение:
Не работает vLCM Image Export
Для переноса сборки Image между кластерами или vCenter разработчики предусмотрели вариант выгрузки собранной вами конструкции.
Существует три варианта экспорта:
А теперь о проблеме: если вы используете свои сертификаты, то ни одна опция не работает, происходит ошибка браузера “ERR_SSL_PROTOCOL_ERROR”.
Решение проблемы, конкурирующие с предыдущим по интеллектуальности и попахивает уязвимостью (неавторизованный доступ):
Семейство серверов IBM/LENOVO System X серии M5 может иметь предустановленный Embedded Hypervisor на SD-карте с совместимой версией ESXi 6.x.
При попытке обновиться до версии ESXi 7.0 выходит ошибка:
1 |
<em>The boot disk has a size of 1024MB, the minimum requirement of the upgrade image is 3814MB.</em> |
Управление SD-картой осуществляется в интерфейсе IMM2. Анализ адаптера показывает, что в реальности используются 32 ГБ карты, но на заводе создан виртуальный диск на 1 ГБ. Расширение размеров не поддерживается.
Для установки ESXi 7.0 придётся прибегнуть к обходной схеме:
P.S. Возможно, данная проблема встречается и на серверах других производителей с предустановленным гипервизором.
Disclaimer: все дальнейшие рассуждения и действия не соответствуют политике технической поддержки VMware. Любое использование оборудования вне VMware HCL может быть использовано только на свой страх и риск. В статье рассматривается только то оборудование, на котором возможен технический запуск ESXi 6.7U3.
В связи с выходом платформы VMware vSphere 7.0 виртуальные системные администраторы стали анализировать возможность обновления либо внедрения данного продукта.
Если проблемы с vCenter 7.0 вполне решаемы и описаны в нашей статье Обновление VMware vCenter с версии 6.7 до 7.0, то с ESXi 7.0 всё не так просто.
Для “упрощения” работы администраторов VMware расширила функциональность Update Manager (VUM) полуавтоматическим анализом оборудования: сверкой моделей серверов с HCL, проверкой версий прошивок и драйверов компонентов. Данная функциональность уже была частично представлена в VSAN [Skyline] Health Hardware compatibility для дисковой подсистемы. Новая версия VUM стала называться vSphere Lifecycle Manager (vLCM). Для загрузки HCL следует в административном интерфейсе нажать ACTIONS->Sync HCL.
Мои ожидания от vLCM были примерно такие – запускаю на хосте Updates -> Hardware Compatibility и система пишет, что оборудование не в HCL, такие-то компоненты не имеют драйверов и не будут работать. В реальности, если сервер не в HCL, то на этом проверка останавливается:
Host model is not compatible with ESXi 7.0
Skipped checking host devices.
Что как бы нас совершенно не устраивает, так как наша цель – запуститься вне HCL, и хотелось бы понимать какие компоненты не имеют драйверов и поддержки.
Поэтому с компонентами придётся разбираться самостоятельно. Continue reading “VMware ESXi 7.0 и неподдерживаемое оборудование”
Дождавшись выхода VMware vSphere 7.0.0b, мы решились на обновление нашей инфраструктуры, построенной на платформе версии 6.7.
Для уменьшения количества граблей внимательно прочитали следующие документы:
Проблема с сертификатами
При попытке обновления вылезла ошибка с сертификатами:
Error: A vCenter Single Sign-On endpoint certificate validation error has occurred.
Resolution: Ensure that the endpoint service registrations in vmdir match their corrsponding machine SSL certificates in VECS. For more information, see Knowledge Base article KB 2121701
Как это бывает, КБшка не помогла, как и не помог совет в форуме VMware.
Обратились в ТП VMware, получили волшебный скрипт и инструкцию: ls_ssltrust_fixer_p3.
1 |
cd /usr/lib/vmidentity/tools/scripts |
1 |
chmod 777 ls_ssltrust_fixer.py |
1 |
python ls_ssltrust_fixer.py -f scan |
1 |
python ls_ssltrust_fixer.py -f fix |
После магических пасов руками vCenter обновился.
Проблема с vLCM
Зная рецепт, обновили несколько vCenter и получили разную функциональность в обновлении Update Manager – vSphere Lifecycle Manager (vLCM). Местами он категорически отказывался показывать Image Depot и видеть обновления для ESXi 7.0. Недолго думая, мы решили сделать сброс БД, чтобы заодно её почистить от компонентов для ESXi6.0 – Resetting VMware Update Manager Database on a vCenter Server Appliance 6.5/6.7/7.0 (2147284). Это исправило “видимость” семёрочных обновлений.
Проблема с безагентской антивирусной проверкой
Для безагентской антивирусной проверки требуются компоненты VMware NSX Data Center for vSphere, поддержка которого не была заявлена (вышел новый продукт) при релизе vSphere 7.0. Но, VMware одумалась и в этом месяце всё таки выпустила патч версии 6.4.7.
Проблема с плагином Veeam BR
Также отвалился плагин для Veeam BR – порешалось переустановкой.
P.S. В придачу слетел файловый бэкап vCenter ;). Требуется перенастройка.