Удаление сломанного HA из VCSA 6.7

У меня случилась поломка – при обновлении vCenter Server Appliance High Availability (VCSA HA) версии 6.7 случайно перезагрузил ноду Witness, которая обновлялась.  В итоге получил ноды VCHA с разными версиями и невозможностью накатить обновление на Witness.

Через GUI все операции с HA заблокировались и ничего не давали сделать. Поиск подсказал, что надо разрушить VCSA HA – описание процедуры в документации Recovering from Isolated vCenter HA Nodes.

Удалил виртуальные машины Passive и Witness нод и приступил к “разрушению” HA-конфигурации.

Вот только результат ввёл в ступор:

Полные непонятки – везде даётся несуществующая команда.

Поискал другие статьи на тему HA, нашёл команду vcha-reset-primary.

Решил попробовать vcha-destroy -f.

Оно!

VMware vCenter Server Appliance 6.7 нет места на /storage/archive

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

В консоли VMware vCenter Server Appliance Management появился Alert:

Поиск сразу вывел на статью Increasing the disk space for the VMware vCenter Server Appliance in vSphere 6.0, но выявилось 2 нюанса:

  1. У нас VCVA(VCSA) в конфигурации HA, не ясно как на пассивной ноде что-то менять, кроме переразворачивания HA, как это делается при смене сертификатов.
  2. В БЗ список дисков из 11 позиций, в 6.7 дисков 13 и archive – это Hard disk 13.

Обратился в VMware и получил ответы технической поддержки:

  1. “PostgreSQL archive file system is designed to be used up to its full size. This is a designed behavior because we want to retain as much WAL as possible using the amount of space we have”.
  2. “This is as per design and will be functioning like this without causing any harm to the services. The engineering team is already aware of this and they have confirmed that behavior is expected as per design. So can safely ignore this and probably in future update the engineering team will have the warning message fixed as they are working on this”.

Не заморачивайся, братан, пусть алёртит!

В VMware vSphere 6.7 не работает SNMP

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

Одной из существенных оказалась неработоспособность службы SNMPd.

При настройке SNMP вы сможете опрашивать ESXi-хосты некоторое время – у нас от десятков минут до нескольких часов, после чего ответа от службы не дождаться. Кратковременно помогает рестарт службы.

Ответ технической поддержки: “Engineering is still confirming but the fix for this is looking to be tentatively in Q3 or Q4 of this year”.

Обновление. Появилась статья в БЗ – SNMPD crashes frequently after upgrading to ESXi 6.7.

Невидимый VMFS

Прошлый месяц был богат на развлечения.

Не успели мы решить проблему с “где-то” исчезающими хранилищами, как пришла новая беда: после сбоя пара виртуальных машин отказались включаться с одного VMFS-хранилища.

Операция Browse Datastore ясности не принесла – содержимое хранилища было абсолютно пустым.

Я не поленился проверить – включенные с этого хранилища виртуальные машины успешно работали.

Continue reading “Невидимый VMFS”

Пропадающий VMFS

На новом кластере с Gen10 и vSphere 6 была обнаружена новая проблема: ряд хостов не видели ряд хранилищ с HP EVA 8400.

Лун презентован и виден в списке устройств, однако…

Операция Rescan не помогает, в журнале событий хоста написано “Lost access to volume aaa-aaa-aaa-aa (VMFS Datastore) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly”

Continue reading “Пропадающий VMFS”

vSphere 6.0 и FCoE поверх Qlogic578xx

После разворачивания на блейдах BL460c Gen10 vSphere 6.0 и подключения к СХД по FCoE в списке Storage Adapters было пусто. Наикрутейшие Broadcom Qlogic 57840 10/20Gbit почему-то отсутствовали как класс.

Статья на сайте Dell посоветовала включить автообнаружение FCoE (как обходное решение, пока это не будет внесено в драйвера).

В самых распоследних на сегодня драйверах автообнаружения на Qlogic578 тоже нет.

Фильтры, задания и снимки в VMware vSphere 6.7

Многие читатели бложика, наверное, заметили, что мы проигнорировали VMware vSphere 6.5 ;). Одна из ключевых причин – отсутствие C# (толстого) клиента для управления средой виртуализации.

По причине перехода на VMware vSphere 6.7 приходится сравнивать 4 (четыре) клиента:

  1. vSphere Client (C#) – классика жанра, очень быстр, отображение состояния инфраструктуры близко к реальному времени при многопользовательской работе. Подключение к хосту и vCenter.
  2. ESXi Embedded Host Client – хостовый встроенный клиент, из полезного – умеет читать логи ВМ, не требует установки.
  3. vSphere HTML5 Web Client – перспективный клиент, очень много радости у людей с нелюбовью к Adobe Flash, но допилить никак не могут. Оценить задержки по времени от реального состояния инфраструктуры затрудняюсь – без кнопки Обновить при одновременной работе нескольких админов не обойтись, в IE работает с тормозами.
  4. vSphere Web Client (Flex) – вот из-за него-то и не стали переходить на 6.5 после реализации 6.0, а VMware его пилили-пилили, местами допилили. Есть задержки от реального времени, но есть Live Refresh и интервалы обновлений можно уменьшить до 10 секунд.

Неожиданно для себя нахожу полезняшки в vSphere Web Client, коими и спешу поделиться.

Назначенные задания и перезагрузка виртуальных машин Continue reading “Фильтры, задания и снимки в VMware vSphere 6.7”

Переход на VMware vSphere 6.7

Пока Андрей обновляется с vSphere 5.5 на 6.0, мы решили двигаться дальше.

На входе у нас кластер VMware vSphere 6.0U3 на Windows Server + Cisco Nexus 1000V с блейдами на базе Intel Xeon 56xx и E5-26xx V1, на выходе желаем получить vSphere 6.7 VCVA+DVS 6.6 на стоечных серверах на базе Intel Xeon Gold 61xx.

Сначала провели анализ совместимости оборудования в HCL – невероятно, но наши блейды на базе  E5-26xx V1 ещё поддерживаются!

Теперь по поводу Intel Xeon 56xx: как вы знаете, поддержка данных процессоров прекращена, но ситуация двоякая. Если в вашем BIOS/UEFI разрешены инструкции AES-NI, то гипервизор будет работать, иначе – вам не повезло. В моих серверах AES-NI поддерживается, так что проблем с ESXi 6.7 не возникло.

Принципиально решил не обновлять vCenter, а развернуть с нуля, чтобы не тащить старые косяки и получить чистую установку. Скачал дистрибутив VCVA 6.7 и с 7 раза поставил. Проблема в том, что клиентский установщик не отрабатывает второй этап (решение: на втором этапе перейти в браузер и оттуда продолжить установку), но, вроде, проблему решили в VCVA 6.7a.

На новые хосты на базе Intel Xeon Gold 61xx поставили ESXi 6.7 и подключили в VCVA. Проблема возникла на ровном месте – при попытке создать EVC уровня Skylake возникла ошибка, что процессоры не поддерживают инструкции данного уровня. Решение быстро нашлось – необходимо включить MONITOR/MWAIT в BIOS/UEFI.

На старом кластере сетевые порты были переключены из Cisco Nexus 1000V в стандартный vSwitch, а хосты переведены под управление VCVA по нашей know how технологии (©2012 vMind.ru): Continue reading “Переход на VMware vSphere 6.7”

Обновление VMware vCenter Server с 5.5 до 6.0

Никогда такого не было, и вот опять…

Внезапно мы узнали, что vSphere 5.5 не поддерживается на новых серверах HPE BL460c Gen10, и приняли принципиальное решение двигаться дальше :).

Так как основная масса хостов – это vSphere 5.5 с одиноким 5.1, то максимально допустимая для нас версия vCenter – это 6.0. Текущий vCenter установлен на MS Windows Server, так что было принято решение там и оставаться.

Я прочитал гайд по обновлению, посмотрел пару видео, и заверте…

Continue reading “Обновление VMware vCenter Server с 5.5 до 6.0”

Обновление до vCenter 6.5 встаёт из-за отсутствия pgpass.conf

При попытке обновления до vCenter 6.5 со встроенной СУБД PostgreSQL установщик встаёт из-за отсутствия pgpass.conf

Поиск в базе знаний приводит к статье Upgrading to vCenter Server 6.5 fails during pre-check with error: “FATAL: password authentication failed for user “postgres””, которая говорит, что файл ищите в %appdata%\postgresql\pgpass.conf.

Проблема в том, что данный файлик создаётся в пользовательском профиле, соответственно, при удалении профиля либо запуском установщика под другим администратором файлик не обнаруживается.

Поэтому создадим файл сами.

Формат файла берём из документации по PostgreSQL – The Password File:

Из файла C:\ProgramData\VMware\vCenterServer\cfg\vmware-vpx\vcdb.properties берем адрес и порт, которые слушает СУБД (localhost:5432), имя пользователя (vc), название БД (VCDB либо *) и копируем пароль.

Файл размещаем в профиле либо в системном каталоге.