Удаление сломанного HA из VCSA 6.7

У меня случилась поломка – при обновлении vCenter Server Appliance High Availability (VCSA HA) версии 6.7 случайно перезагрузил ноду Witness, которая обновлялась.  В итоге получил ноды VCHA с разными версиями и невозможностью накатить обновление на Witness.

Через GUI все операции с HA заблокировались и ничего не давали сделать. Поиск подсказал, что надо разрушить VCSA HA – описание процедуры в документации Recovering from Isolated vCenter HA Nodes.

Удалил виртуальные машины Passive и Witness нод и приступил к “разрушению” HA-конфигурации.

Вот только результат ввёл в ступор:

Полные непонятки – везде даётся несуществующая команда.

Поискал другие статьи на тему HA, нашёл команду vcha-reset-primary.

Решил попробовать vcha-destroy -f.

Оно!

VMware vCenter Server Appliance 6.7 нет места на /storage/archive

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

В консоли VMware vCenter Server Appliance Management появился Alert:

Поиск сразу вывел на статью Increasing the disk space for the VMware vCenter Server Appliance in vSphere 6.0, но выявилось 2 нюанса:

  1. У нас VCVA(VCSA) в конфигурации HA, не ясно как на пассивной ноде что-то менять, кроме переразворачивания HA, как это делается при смене сертификатов.
  2. В БЗ список дисков из 11 позиций, в 6.7 дисков 13 и archive – это Hard disk 13.

Обратился в VMware и получил ответы технической поддержки:

  1. “PostgreSQL archive file system is designed to be used up to its full size. This is a designed behavior because we want to retain as much WAL as possible using the amount of space we have”.
  2. “This is as per design and will be functioning like this without causing any harm to the services. The engineering team is already aware of this and they have confirmed that behavior is expected as per design. So can safely ignore this and probably in future update the engineering team will have the warning message fixed as they are working on this”.

Не заморачивайся, братан, пусть алёртит!

В VMware vSphere 6.7 не работает SNMP

Эксплуатация VMware vSphere 6.7 выявляет различные недоработки в ПО.

Одной из существенных оказалась неработоспособность службы SNMPd.

При настройке SNMP вы сможете опрашивать ESXi-хосты некоторое время – у нас от десятков минут до нескольких часов, после чего ответа от службы не дождаться. Кратковременно помогает рестарт службы.

Ответ технической поддержки: “Engineering is still confirming but the fix for this is looking to be tentatively in Q3 or Q4 of this year”.

Обновление. Появилась статья в БЗ – SNMPD crashes frequently after upgrading to ESXi 6.7.

Невидимый VMFS

Прошлый месяц был богат на развлечения.

Не успели мы решить проблему с “где-то” исчезающими хранилищами, как пришла новая беда: после сбоя пара виртуальных машин отказались включаться с одного VMFS-хранилища.

Операция Browse Datastore ясности не принесла – содержимое хранилища было абсолютно пустым.

Я не поленился проверить – включенные с этого хранилища виртуальные машины успешно работали.

Continue reading “Невидимый VMFS”

Пропадающий VMFS

На новом кластере с Gen10 и vSphere 6 была обнаружена новая проблема: ряд хостов не видели ряд хранилищ с HP EVA 8400.

Лун презентован и виден в списке устройств, однако…

Операция Rescan не помогает, в журнале событий хоста написано “Lost access to volume aaa-aaa-aaa-aa (VMFS Datastore) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly”

Continue reading “Пропадающий VMFS”

Exchange 2013 DAG и пропавшие сетевые интерфейсы

Иногда мы занимаемся обновлением наших серверов Exchange. В этот раз совпала установка обновлений Windows, .Net, Exchange CU&Security update, а также обновление движка антивируса.

Все шло как обычно, даже отключившаяся служба Exchange Search Host Controller (точнее, получившая статус автозапуска Disabled). Однако, был и нюанс – даже после ее запуска базы одна из нод маркировалась как Failed (с невозможностью связаться по сети).

Continue reading “Exchange 2013 DAG и пропавшие сетевые интерфейсы”

vSphere 6.0 и FCoE поверх Qlogic578xx

После разворачивания на блейдах BL460c Gen10 vSphere 6.0 и подключения к СХД по FCoE в списке Storage Adapters было пусто. Наикрутейшие Broadcom Qlogic 57840 10/20Gbit почему-то отсутствовали как класс.

Статья на сайте Dell посоветовала включить автообнаружение FCoE (как обходное решение, пока это не будет внесено в драйвера).

В самых распоследних на сегодня драйверах автообнаружения на Qlogic578 тоже нет.

Фильтры, задания и снимки в VMware vSphere 6.7

Многие читатели бложика, наверное, заметили, что мы проигнорировали VMware vSphere 6.5 ;). Одна из ключевых причин – отсутствие C# (толстого) клиента для управления средой виртуализации.

По причине перехода на VMware vSphere 6.7 приходится сравнивать 4 (четыре) клиента:

  1. vSphere Client (C#) – классика жанра, очень быстр, отображение состояния инфраструктуры близко к реальному времени при многопользовательской работе. Подключение к хосту и vCenter.
  2. ESXi Embedded Host Client – хостовый встроенный клиент, из полезного – умеет читать логи ВМ, не требует установки.
  3. vSphere HTML5 Web Client – перспективный клиент, очень много радости у людей с нелюбовью к Adobe Flash, но допилить никак не могут. Оценить задержки по времени от реального состояния инфраструктуры затрудняюсь – без кнопки Обновить при одновременной работе нескольких админов не обойтись, в IE работает с тормозами.
  4. vSphere Web Client (Flex) – вот из-за него-то и не стали переходить на 6.5 после реализации 6.0, а VMware его пилили-пилили, местами допилили. Есть задержки от реального времени, но есть Live Refresh и интервалы обновлений можно уменьшить до 10 секунд.

Неожиданно для себя нахожу полезняшки в vSphere Web Client, коими и спешу поделиться.

Назначенные задания и перезагрузка виртуальных машин Continue reading “Фильтры, задания и снимки в VMware vSphere 6.7”

Stor2rrd vs HPE StoreOnce

Как поклонник бесплатного решения Stor2rrd для мониторинга SAN-сети, я попробовал поучаствовать в тестировании их решения для мониторинга HPE StoreOnce.

Было достаточно забавно: протестировать два релиза и поменять два скрипта по опросу производительности :). Continue reading “Stor2rrd vs HPE StoreOnce”

Переход на VMware vSphere 6.7

Пока Андрей обновляется с vSphere 5.5 на 6.0, мы решили двигаться дальше.

На входе у нас кластер VMware vSphere 6.0U3 на Windows Server + Cisco Nexus 1000V с блейдами на базе Intel Xeon 56xx и E5-26xx V1, на выходе желаем получить vSphere 6.7 VCVA+DVS 6.6 на стоечных серверах на базе Intel Xeon Gold 61xx.

Сначала провели анализ совместимости оборудования в HCL – невероятно, но наши блейды на базе  E5-26xx V1 ещё поддерживаются!

Теперь по поводу Intel Xeon 56xx: как вы знаете, поддержка данных процессоров прекращена, но ситуация двоякая. Если в вашем BIOS/UEFI разрешены инструкции AES-NI, то гипервизор будет работать, иначе – вам не повезло. В моих серверах AES-NI поддерживается, так что проблем с ESXi 6.7 не возникло.

Принципиально решил не обновлять vCenter, а развернуть с нуля, чтобы не тащить старые косяки и получить чистую установку. Скачал дистрибутив VCVA 6.7 и с 7 раза поставил. Проблема в том, что клиентский установщик не отрабатывает второй этап (решение: на втором этапе перейти в браузер и оттуда продолжить установку), но, вроде, проблему решили в VCVA 6.7a.

На новые хосты на базе Intel Xeon Gold 61xx поставили ESXi 6.7 и подключили в VCVA. Проблема возникла на ровном месте – при попытке создать EVC уровня Skylake возникла ошибка, что процессоры не поддерживают инструкции данного уровня. Решение быстро нашлось – необходимо включить MONITOR/MWAIT в BIOS/UEFI.

На старом кластере сетевые порты были переключены из Cisco Nexus 1000V в стандартный vSwitch, а хосты переведены под управление VCVA по нашей know how технологии (©2012 vMind.ru): Continue reading “Переход на VMware vSphere 6.7”