При попытке переноса одной ВМ между хранилищами было получено странное сообщение:
The ramdisk ‘root’ is full. As a result, the file /var/log/vmware/journal/… could not be written.
SSH на сервере не работал, поэтому пришлось лезть в iLO (это сервер HP).
Стандартная команда “df -h” результата не дала – вроде бы все хорошо.
Поиск в интернете выдал следующую KB2033073.
Два симптома из трех совпадали:
– не работал SSH;
– команда vdf -h выдавала полную занятость диска ‘root’ (Use = 100%).
Кем/чем – не понятно.
Из соседней KB была найдена команда, отобразившая список файлов >50MB
find / -path “/vmfs” -prune -o -type f -size +50000k -exec ls -l ‘{}’ \;
Почти все они, кроме /var/log/hpHelper.log относились к системным файлам. По этому журналу нагуглилась другая KB2055924.
Согласно этой KB, глюки софта от HP переполняли этот журнал при работе на Proliant Gen8.
Решение проблемы следующее:
1) Остановить агента HP Helper
/etc/init.d/hp-ams.sh stop
2) Удалить файл журналов
rm /var/log/hpHelper.log
3) Установить обновление на агентов или отключить агентов вообще
В случае отключения необходимо выполнить команду
chkconfig hp-ams.sh off
Если делать вообще ничего не хочется, можно перезагрузить хост. Однако, vMotion с такого хоста у меня тоже не сработал.
тоже недавно наткнулся на проблемы с hp-ams
• не запасаются вм после миграции
Cannot expand. Could not start VMX: msg.vmk.status.VMK_NO_MEMORY
• не работает миграция
ESXi host cannot initiate vMotion or enable services and reports the error: Heap globalCartel-1 already at its maximum size.Cannot expand
• консольно нельзя подключится к виртуалке,
Unable to connect to the MKS: Failed to launch the MKS client: That system cannot find file specified
Всё это из за костуметизированного образа HP а котором есть драйвер hp-ams-esx-550.9.5.0-26.1198610
Вот решение вмваре (отключение этого драйвера): http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2085618
Вот решение HP (обновление этого драйвера до версии 10.0.1-2) https://h20566.www2.hp.com/hpsc/swd/public/detail?swItemId=MTX_b05d4c644fb742aa87cb5f5da1#tab3
эти проблемы заметил на bl460g8 и bl660g8, в кластере были ещё g7 но у них вроде нормально всё, но тем не менее обдейт hp-ams выполнил на всех
Поправлю ссылку статьи в VMware
http://kb.vmware.com/kb/2085618
И рекомендация
1) Остановить сервис
/etc/init.d/hp-ams.sh stop
2) Проверить, что HP AMS установлен
esxcli software vib list | grep ams
3) Удалить его
esxcli software vib remove -n hp-ams
4) Перезагрузить хост
Предложенный мною вариант из другой KB чуть менее строгий – “отключить” службу
chkconfig hp-ams.sh off