Big Memory or Project Capitola

Одним из грядущих “бутылочных” горлышек гипервизоров называют оперативную память. Это связано с несколькими причинами:

  • кризис производства полупроводников 2021;
  • в предыдущую десятилетку было построено так много заводов по производству DRAM, что их владельцы были вынуждены демпинговать в борьбе за потребителя;
  • оперативная память не успевает вслед за процессорами понижать техпроцесс, вследствие чего количество ОЗУ на сокет ограничено (например, 6 каналами и двумя DIMM-слотами на каждый в Xeon Skylake). Количество ОЗУ на ядро перестало расти в последние годы, а вскоре, возможно, начнет падать;
  • немаловажным аспектом также является и цена за гигабайт – в стоимости современного сервера ОЗУ дороже всего остального вместе взятого.

Continue reading “Big Memory or Project Capitola”

Заметки в базе знаний VMware по платформе vSphere 7.0 Update 3

Выпущено много новых заметок в базе знаний по проблемам, планам, принятым решениям по платформе VMware vSphere 7.0 Update 3 (либо описывается текущая проблема во всех версиях):

  • vSphere 7.0 Update 3 Critical Known Issues and Workarounds (86287)
  • vSphere 7.0 Update 3 Known Issues and Workarounds (86281)
  • vSphere Back-in-time release upgrade restriction (67077)
  • Virtual machine hardware versions (1003746)
  • Build numbers and versions of VMware vCenter Server (2143838)
  • Removal of Windows Update published PVSCSI driver version 1.3.18.0 (86053)
  • Understanding vSAN on-disk format versions and compatibility (2148493)
  • Interactive/Scripted ISO upgrade to 7.0 U3 failed with message about live VIB installation (85859)
  • ToolsRamdisk option is not available with ESXi 7.0.x releases (83782)
  • Failed to create a new Virtual Machine with virtual Trusted Platform Module (vTPM) device (85974)
  • /etc/hosts and /etc/resolv.conf do not support direct update from 7.0 U3. The content of the files are saved to configstore. They can only be updated by public cli or API (86015)
  • “Authentication failed, Lifecycle Manager server could not be contacted”, Access to Lifecycle Manager fails in vCenter 7.0 Update 3 when logged in with an Active Directory account (85962)
  • Intermittent 100% CPU Usage spikes on hosts with AMD EPYC Zen3 (Milan) CPUs (85071)
  • HPE Serviceguard for Linux Clustering (SGLX) with shared disks on VMware vSphere 7.x: Guidelines for supported configuration (Partner Verified and Supported) (85910)
  • Intel VMD is support plus additional support for RAID 1 for boot volumes (85889)
  • Backup speed are slow over NBD transport mode for VMs on high-latency storage (83401)
  • Intel NVM update tools do not work on Intel 1G igbn adapters (85983)
  • DRS Advanced option “MaxMemMBHeadroomPerHost” for Memory Headroom (86013)
  • vSphere Lifecycle Manager can show non-compliant status after rollup Remediation, new cluster creation or transition from Baseline-managed cluster to Image-managed cluster for few upgrade paths due to i40en/i40enu driver name change (85982)
  • “vSAN network alarm ‘RDMA Configuration Health'” warning is seen in vSAN over RDMA cluster when using async Intel icen driver (85947)
  • vSAN Health Service – vSAN HCL Health – NVMe device can be identified (85782)
  • vSAN Health Service – vSAN Network Health – Hosts with LACP issues (85886)
  • vSAN Health Service – vSAN Network Health – Hosts with duplicate IP addresses (85883)
  • vSAN Health Service – vSAN HCL Health – NVMe device is VMware certified (85852)
  • Unable to change vSAN File service configuration after creation (80028)
  • vSAN iSCSI first-time enablement with CHAP authentication fails with an internal error (86019)
  • vSphere Support for Intel’s Optane Persistent Memory (PMEM) (67645)
  • vCenter Server /storage/log filling up due to localhost_access.log and catalina.log in sso and lookupsvc log directories (85475)
  • “Error in method invocation Exception occurred while unzipping patch script, please retry after sometime” while patching VC 7.x (85797)
  • Clearing BACKUP_STORES certificates in the VCSA via shell script (82560)
  • File-based Backups via SFTP in vCenter 7.0 Update 2d failing with “General system error reported by backup server.” (85966)
  • WCP service fails to start in vCenter Server 7.x (82507)
  • Enabling and disabling vSAN over RDMA with unsupported driver/firmware versions for Intel E810* family NIC may lead to vSAN core dumps or ESXi Host PSOD (86077)
  • VMkernel might shut down virtual machines due to a vCPU timer issue (86075)
  • vCenter has a large number of localhost_access log files generated under /storage/log/vmware/eam/web/ (85249)
  • ESXi host fails with a backtrace NMI IPI: Panic requested by another PCPU (86100)
  • Workaround Instructions for CVE-2021-22048 (86292)
  • Guest OS Customization for Rocky Linux is not fully supported (86163)
  • vCenter upgrade from 7.0 update 2 to update 3.0 fails with could not find function “archive_build_segment_list” in file “/opt/vmware/vpostgres/13/lib/pg_addons.so” (86073)

VMware vSphere 7.0 update 3 – что сломали на этот раз

Статья прислана читателем бложика.

Перед началом дальнейшего прочтения надо вспомнить, что VMware vSphere состоит из двух мегаменовESXi на хостах и правящий всеми vCenter. Мне лично больше нравится таблица тут, но ее не так быстро обновляют.

Читаем «что там нового»

Как знают все, интересующиеся темой, на VMworld был анонсировано и тут же выложено обновление для ESXi от 2021-10-05/ 18644231, одновременно с vCenter Server 7.0 Update 3 (7.0.3.00000). Обновление ESXi было выложено, потом убрано со скачивания, затем снова выложено в том же виде. По старой традиции VMware убирать странное и делать вид что ничего не было (что уже было не один раз с HCL) – из VMware ESXi 7.0 Update 3 Release Notes – ждем, когда из RN пропадут строки типа: Continue reading “VMware vSphere 7.0 update 3 – что сломали на этот раз”

VMware vSphere 7 Update 3: обновления службы vCLS

Перевод статьи vSphere 7 Update 3: vCLS Updates.

Глоссарий

В данном тексте используется биологический термин “аффинность” для перевода “Affinity”, так как русский вариант “сродство” встречается в ИТ-лексиконе практически никогда. Под аффинностью в статье подразумевается принудительное размещение нескольких ВМ на одном хосте, под анти-аффинностью – запрет их совместного одновременного размещения на одном хосте.

Вступление

Служба vSphere Cluster Service (vCLS) была представлена в vSphere 7 Update 1. В vSphere 7 Update 3 появилось несколько хороших обновлений vCLS для повышения эффективности таких операций, как размещение агентских ВМ vCLS службы на хостах и хранилищах данных (datastores).

Аффиность стала умнее

Используя конструкцию Compute Policies, которая теперь является частью vSphere, мы можем обеспечить более разумное размещение ВМ агентов. Compute Policies уже были частью решения VMC on AWS. Это динамический способ создания правил (анти-)аффинности или создание динамического размещения ВМ в кластере с использованием тегов vSphere. В vSphere 7 Update 3 Compute Policies можно использовать только для агентских ВМ службы vCLS.

Это решает потенциальную проблему, с которой сталкивались клиенты, например, с рабочими нагрузками SAP HANA, требующими выделенных сокетов на узлах. Клиенты не могут использовать сокеты рабочих нагрузок HANA для запуска других приложений или даже агентских ВМ, как в случае с vCLS. Таким образом, клиенты теряют целиком весь сокет в кластере HANA для запуска агентских виртуальных машин vCLS, что может привести к потере значительных вычислительных ресурсов, в зависимости от размера и конфигурации кластера.

С помощью интеллектуальных конфигураций аффинности для агентских виртуальных машин vCLS, используя Compute Policies, мы можем запускать агентские ВМ vCLS на хостах внутри кластера, которые не будут мешать специфичным виртуальным машинам. Таким образом, пользователи SAP HANA могут задать аффинность, чтобы агентские виртуальные машины использовали выделенный хост. Причина использования Compute Policies, а не правил (анти-)аффинности DRS заключается в том, что DRS будет недоступна во время настройки аффинности агентских ВМ vCLS.

Как настроить?

Continue reading “VMware vSphere 7 Update 3: обновления службы vCLS”

Эволюция производительности VMware vSphere 7

В продолжении цикла

vSphere6 — эволюция

публикую перевод статьи What’s New in Performance for VMware vSphere 7.x?

В основе каждого выпуска VMware vSphere лежит множество улучшений производительности и масштабируемости. Платформа vSphere 7.x продолжает обеспечивать лучшую в отрасли производительность и функции для успешной виртуализации и управления вашим программно-определяемым центром обработки данных.

Последний технический документ “What’s New in Performance for VMware vSphere 7?” охватывает VMware vSphere 7.0, U1, U2 и U3. Некоторые основные моменты включают: Continue reading “Эволюция производительности VMware vSphere 7”

Релиз VMware vSphere 7.0 update 3

Вышло очередное обновление платформы VMware vSphere 7.0 до версии update 3:

Обновление серверов Dell с помощью VMware LifeCycle Manager

Мы ранее уже делились опытом обновления серверов Lenovo, теперь настала очередь Dell.

Допустим, у вас есть парочка серверов R740, и вы слышали, что вроде бы VMware умеет обновлять прошивки.

Вам потребуется Dell OpenManage Integration for VMware vCenter aka OMIVV, который можно скачать отсюда. Начиная с версии 5.3, присутствует поддержка VMware vSphere 7.0 U2.

OMIVV поставляется в виде виртуального апплайнса. Сразу после установки работает пробная лицензия на 5 хостов и 15 серверов vCenter.

Лицензируется продукт по хостам, доступны 3-х и 5-летние пакеты.

После установки необходимо зарегистрировать в OMIVV vCenter и vLCM, поддерживается одновременная работа с 15 vCenter-серверами.

Continue reading “Обновление серверов Dell с помощью VMware LifeCycle Manager”

Требования к загрузочному накопителю в VMware ESXi 7 и нюансы использования

Перевод статьи ESXi 7 Boot Media Consideration and VMware Technical Guidance.

Исторически сложилось так, что для освобождения отсеков для устройств и снижения стоимости установки узлов ESXi выбирались SD-карты или USB-устройства. Однако такие устройства имеют низкий ресурс и со временем проявляют проблемы с надежностью. SD-карты и USB-накопители также могут иметь проблемы с производительностью и не выдерживать высокочастотных операций чтения-записи. В настоящее время мы все чаще наблюдаем проблемы, связанные с загрузкой в ESXi 7.x, с узлами, использующими SD-карты или USB-накопители в качестве загрузочных накопителей. В этой статье мы подробно расскажем о том, что мы видели, и предоставим техническое руководство по устранению таких проблем.

Прежде чем перейти к деталям, важно понять новую схему системы. До появления vSphere 7 управление разделами было ограничено: размеры разделов были фиксированными, а номера разделов – статичными. Существовали ограничения на использование нескольких решений с размерами разделов vSphere 6.x, например, если вы начинали комбинировать NSX-T, vSAN, Tanzu, vGPU и т.д. Это ограничивало поддержку установки больших модулей, отладочных функций и возможных сторонних компонентов.

В перспективе потребность в поддержке хостами ESXi других решений VMware или сторонних производителей постоянно возрастает. Поэтому потребность в более надежном, гибком и высокопроизводительном устройстве хранения данных для системного хранилища является необходимостью.

В новой схеме разделов vSphere 7.x только загрузочный раздел системы имеет фиксированный размер 100 МБ. Остальные разделы являются динамическими, то есть размер раздела будет определяться в зависимости от размера загрузочного накопителя. Continue reading “Требования к загрузочному накопителю в VMware ESXi 7 и нюансы использования”

Анонс VMware vSphere&vSAN 7.0 Update 3

Компания VMware анонсировала vSphere&vSAN 7.0 Update 3 и опубликовала несколько материалов об этих продуктах:

Announcing-vSAN 7 update 3

Аnnouncing vSphere 7 update 3

Падучая ESXi или возвращение блудного хоста

И снова статья от участника телеграм-канала VMware User Group Rus.

Третьего дня в чат опять пришли коллеги с стандартной проблемой – хост отвалился от vCenter  – ШТО ДЕЛАТЬ?

Правильный ответ – писать сценарии отказа и отрабатывать их, это один из таких случаев, с которыми надо быть знакомыми до начала эксплуатации.

Вводные

Есть некий хост с VMware (разумеется, с последними патчами – а то было тут как-то PR 2412475: You see Sensor -1 type hardware health alarms on ESXi hosts and receive excessive mail alerts). Хост отвалился от VCenter (разумеется, тоже с последними патчами – особенно это касается линейки 7.0). Виртуальные машины на хосте продолжают работать, отказоустойчивости на уровне сервисов (Oracle real application clusters, database availability group, MS SQL Always On и так далее) нет, но и просто так перезагрузить хост – не вариант. Нет никаких гарантий, что хост поднимется, что есть ресурсы на других хостах.

В данном случае имеет смысл обратиться в поддержку – если, конечно, у вас система работает на поддерживаемой конфигурации, куплены лицензии и куплена эта самая поддержка. Поддержку можно купить «поштучно» – VMware Per Incident Support.

Шаг 1. Что было, то и будет; и что делалось, то и будет делаться, и нет ничего нового под солнцем

Continue reading “Падучая ESXi или возвращение блудного хоста”