ESXi ramdisk ‘root’ is full

При попытке переноса одной ВМ между хранилищами было получено странное сообщение:

The ramdisk ‘root’ is full. As a result, the file /var/log/vmware/journal/… could not be written.

SSH на сервере не работал, поэтому пришлось лезть в iLO (это сервер HP).

Стандартная команда «df -h» результата не дала — вроде бы все хорошо.

Поиск в интернете выдал следующую KB2033073.

Два симптома из трех совпадали:

— не работал SSH;

— команда vdf -h выдавала полную занятость диска ‘root’ (Use = 100%).

Кем/чем — не понятно.

Из соседней KB была найдена команда, отобразившая список файлов >50MB

find / -path «/vmfs» -prune -o -type f -size +50000k -exec ls -l ‘{}’ \;

Почти все они, кроме /var/log/hpHelper.log относились к системным файлам. По этому журналу нагуглилась другая KB2055924.

Согласно этой KB, глюки софта от HP переполняли этот журнал при работе на Proliant Gen8.

Решение проблемы следующее:

1) Остановить агента HP Helper

/etc/init.d/hp-ams.sh stop

2) Удалить файл журналов

rm /var/log/hpHelper.log

3) Установить обновление на агентов или отключить агентов вообще

В случае отключения необходимо выполнить команду

chkconfig hp-ams.sh off

Если делать вообще ничего не хочется, можно перезагрузить хост. Однако, vMotion с такого хоста у меня тоже не сработал.

Запись опубликована в рубрике 4.1, 5.0, 5.1, 5.5, VMware, vSphere. Добавьте в закладки постоянную ссылку.

2 комментария: ESXi ramdisk ‘root’ is full

  1. Artem говорит:

    тоже недавно наткнулся на проблемы с hp-ams
    • не запасаются вм после миграции
    Cannot expand. Could not start VMX: msg.vmk.status.VMK_NO_MEMORY
    • не работает миграция
    ESXi host cannot initiate vMotion or enable services and reports the error: Heap globalCartel-1 already at its maximum size.Cannot expand
    • консольно нельзя подключится к виртуалке,
    Unable to connect to the MKS: Failed to launch the MKS client: That system cannot find file specified

    Всё это из за костуметизированного образа HP а котором есть драйвер hp-ams-esx-550.9.5.0-26.1198610
    Вот решение вмваре (отключение этого драйвера): http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2085618
    Вот решение HP (обновление этого драйвера до версии 10.0.1-2) https://h20566.www2.hp.com/hpsc/swd/public/detail?swItemId=MTX_b05d4c644fb742aa87cb5f5da1#tab3
    эти проблемы заметил на bl460g8 и bl660g8, в кластере были ещё g7 но у них вроде нормально всё, но тем не менее обдейт hp-ams выполнил на всех

  2. Андрей Вахитов говорит:

    Поправлю ссылку статьи в VMware
    http://kb.vmware.com/kb/2085618
    И рекомендация
    1) Остановить сервис
    /etc/init.d/hp-ams.sh stop
    2) Проверить, что HP AMS установлен
    esxcli software vib list | grep ams
    3) Удалить его
    esxcli software vib remove -n hp-ams
    4) Перезагрузить хост

    Предложенный мною вариант из другой KB чуть менее строгий — «отключить» службу
    chkconfig hp-ams.sh off

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *