Удаление сломанного HA из VCSA 6.7

У меня случилась поломка – при обновлении vCenter Server Appliance High Availability (VCSA HA) версии 6.7 случайно перезагрузил ноду Witness, которая обновлялась.  В итоге получил ноды VCHA с разными версиями и невозможностью накатить обновление на Witness.

Через GUI все операции с HA заблокировались и ничего не давали сделать. Поиск подсказал, что надо разрушить VCSA HA – описание процедуры в документации Recovering from Isolated vCenter HA Nodes.

Удалил виртуальные машины Passive и Witness нод и приступил к “разрушению” HA-конфигурации.

Вот только результат ввёл в ступор:

Полные непонятки – везде даётся несуществующая команда.

Поискал другие статьи на тему HA, нашёл команду vcha-reset-primary.

Решил попробовать vcha-destroy -f.

Оно!

VMware vCenter Server Appliance 6.7 нет места на /storage/archive

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

В консоли VMware vCenter Server Appliance Management появился Alert:

Поиск сразу вывел на статью Increasing the disk space for the VMware vCenter Server Appliance in vSphere 6.0, но выявилось 2 нюанса:

  1. У нас VCVA(VCSA) в конфигурации HA, не ясно как на пассивной ноде что-то менять, кроме переразворачивания HA, как это делается при смене сертификатов.
  2. В БЗ список дисков из 11 позиций, в 6.7 дисков 13 и archive – это Hard disk 13.

Обратился в VMware и получил ответы технической поддержки:

  1. “PostgreSQL archive file system is designed to be used up to its full size. This is a designed behavior because we want to retain as much WAL as possible using the amount of space we have”.
  2. “This is as per design and will be functioning like this without causing any harm to the services. The engineering team is already aware of this and they have confirmed that behavior is expected as per design. So can safely ignore this and probably in future update the engineering team will have the warning message fixed as they are working on this”.

Не заморачивайся, братан, пусть алёртит!

В VMware vSphere 6.7 не работает SNMP

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

Одной из существенных оказалась неработоспособность службы SNMPd.

При настройке SNMP вы сможете опрашивать ESXi-хосты некоторое время – у нас от десятков минут до нескольких часов, после чего ответа от службы не дождаться. Кратковременно помогает рестарт службы.

Ответ технической поддержки: “Engineering is still confirming but the fix for this is looking to be tentatively in Q3 or Q4 of this year”.

Обновление. Появилась статья в БЗ – SNMPD crashes frequently after upgrading to ESXi 6.7.

Невидимый VMFS

Прошлый месяц был богат на развлечения.

Не успели мы решить проблему с “где-то” исчезающими хранилищами, как пришла новая беда: после сбоя пара виртуальных машин отказались включаться с одного VMFS-хранилища.

Операция Browse Datastore ясности не принесла – содержимое хранилища было абсолютно пустым.

Я не поленился проверить – включенные с этого хранилища виртуальные машины успешно работали.

Continue reading “Невидимый VMFS”

Пропадающий VMFS

На новом кластере с Gen10 и vSphere 6 была обнаружена новая проблема: ряд хостов не видели ряд хранилищ с HP EVA 8400.

Лун презентован и виден в списке устройств, однако…

Операция Rescan не помогает, в журнале событий хоста написано “Lost access to volume aaa-aaa-aaa-aa (VMFS Datastore) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly”

Continue reading “Пропадающий VMFS”

Exchange 2013 DAG и пропавшие сетевые интерфейсы

Иногда мы занимаемся обновлением наших серверов Exchange. В этот раз совпала установка обновлений Windows, .Net, Exchange CU&Security update, а также обновление движка антивируса.

Все шло как обычно, даже отключившаяся служба Exchange Search Host Controller (точнее, получившая статус автозапуска Disabled). Однако, был и нюанс – даже после ее запуска базы одна из нод маркировалась как Failed (с невозможностью связаться по сети).

Continue reading “Exchange 2013 DAG и пропавшие сетевые интерфейсы”

vSphere 6.0 и FCoE поверх Qlogic578xx

После разворачивания на блейдах BL460c Gen10 vSphere 6.0 и подключения к СХД по FCoE в списке Storage Adapters было пусто. Наикрутейшие Broadcom Qlogic 57840 10/20Gbit почему-то отсутствовали как класс.

Статья на сайте Dell посоветовала включить автообнаружение FCoE (как обходное решение, пока это не будет внесено в драйвера).

В самых распоследних на сегодня драйверах автообнаружения на Qlogic578 тоже нет.