Пару дней потратил на зачистку снапшотов в своей инфраструктуре, так как наши администраторы серверов используют снапшоты как бэкапы и хранят их по несколько месяцев. Решил поделиться опытом с нашими читателями.
Снапшоты
Описывать что такое снапшоты не буду – дам набор ссылок:
- Снапшоты в vSphere.
- Снапшоты не являются бэкапами и следуют следовать рекомендациям при работе с ними.
- Механизм для исправления проблем с неотработавшими операциями со снапшотам отличается в версиях 3.x-4.x и в версии 5.0 (по-русски).
- Статьи про снапшоты на нашем сайте – первая, вторая.
Как определить у каких машин есть снапшоты?
Предложу следующие варианты (гуёвые):
- Пробежать по каждой VM, по правой кнопке мыши Snapshot-Snapshot Manager
- Поставить утилиту VMware Guest Console и переключиться на режим Snapshot Manager
- Воспользоваться утилитой Trilead VMX, которая нам поможет в дальнейшем
- Использовать утилиту RVtools, закладка vSnapshots.
- Storage View в vClient (подсказывают в комментариях).
Проблемы со снапшотами
Первая проблема – это ошибки удаления/создания снапшотов, решилась запуском описанной выше процедуры консолидации снапшотов.
Вторая проблема, потрепавшая нервы – это проблема “зависания” на 99%, как при консолидации, так и при удалении. Выглядит она, как часами наблюдаемый прогресс-бар в состояни 99%.
Для понимая, что процесс идёт, VMware рекомендует мониторить наличие delta-файлов через команды консоли в этой статье.
Я же воспользовался Trilead VMX.
В разделе DataCenter добавляем хосты и находим нужную виртуалку со снапшотами, по правой мышке кликаем на Locate Files…
В проводнике файлов видим delta-файлы, а также время последней модификации файлов. Не забываем прибавить временную зону. При обновление панели убеждаемся, что с файлами в текущий момент идут операции.
Для оценки какую угрозу представляют снапшоты сортируем по размеру и видим печальную картину. В-третьих, не забудьте, что свободного места на хранилище должно быть не меньше самого большого снапшота, до 4.0u2 требовалось для удаления снапшотов места в размере суммы снапшотов.
Проблема четвертая, скорее частная, чем общая, при удалении снапшотов резко растёт лог БД vim_vcdb – гигабайты в минуту, что приводит к его переполнению и остановке vCenter. К сожалению, советы эти мне не помогли. Проблема существенная, так как может происходит во время операции по резервному копированию виртуальных машин. Дальнейшее решение по этой проблеме в комментариях к статье.
Выводы
Будьте осторожны в использовании снапшотов, проблемы могут вылезти в различных местах: от остановки виртуальных машин по причине заполнения места на хранилищах до остановки vCenter. Следуйте рекомендациям лучших вмвареводов…
Проапгрейдил MS SQL, так как не работал SQL Agent
http://paulgrevink.wordpress.com/2011/01/28/upgrading-vmware-vcenter-microsoft-sql-server-2008-r2-express/
Добавил в него job’ы, так как у меня их не было
список – http://kb.vmware.com/kb/2006097
инструкция – http://kb.vmware.com/kb/1004382
Самый простой метод увидеть все Snapshot-ы – это воспользоваться стандартной закладкой в Storage Views на уровне Datacenter в вашем vCenter. Потом выбрать View – Show All Virtual Machines и там сразу увидите как сами Snapshot-ы, так и их размер. Это актуально как для 4ой, так и для 5ой версии vSphere.
Раньше, когда я этого не знал, я тоже пользовался RVTools, но со встроенными средствами намного проще.
Отличный совет, я про этот метод просто забыл.
А еще Veeam Monitor. 🙂 Может и алармы слать по снапшотам, если необходимо.
Алармы и в vCenter можно настроить по размеру. Иногда полезно получить аларм, что снапшот превысил 10гб.