Всегда говори да!

«Обычно люди обращаются за советом, — говорил Атос, – только для того, чтобы не следовать ему, а если кто-нибудь и следует совету, то только для того, чтобы было кого упрекнуть впоследствии.»

Пришло мне в голову дать вам бесплатный совет: соглашайтесь на практически любую движуху. Приведу пару примеров из своего опыта:

  1. 2009-й год, я работаю обычным системным администратором на заводе. Windows, Exchange и немножко ДрВеба с Симантеком :).
    Тут мне предлагают стать ответственным за администрирование коммутаторов, маршрутизаторов и брандмауэров Cisco. В качестве бонуса еще и немного учат!
    Я, конечно же, соглашаюсь. Коллега из соседнего отдела сомневается и отказывается – зачем ему дополнительный головняк?
  2. 2011 год, в другом месте мне предлагают взяться за администрирование системы MS Lync Server 2010. Тоже учат, ага…
    Там же ближе к 2017 – внедрить систему резервного копирования NetBackup.

Результатом первой возможности стало более глубокое понимание работы сети и сертификат CCNA (хотя, поработав в интернет-провайдере, я осознал – насколько же это были базовые знания). Пару раз помогало тыкать носом сетевиков в их косяки.
Результатом второй и третьей – приличные знания по обеим системам в качестве T-shape специалиста. В результате, в 2020м меня брали на центрального администратора Commvault с хорошим окладом без практического опыта по нему 😉

Я не могу рассказать о текущем стеке, но он не имеет ничего общего с привычным мне VMware/Microsoft. Когда-нибудь я расскажу и эту историю…

Купил монитор

Виктор давненько подбивал меня купить себе новый монитор.

На UHD я не развелся, однако купил себе QHD.

Зацените картинку БЫЛО-СТАЛО:

До красной линии – 14″ FHD 150% масштаб. После – 27″ QHD 100% масштаб.

Я считаю – оно того стоило, а вы? 🙂

VCP:DCV2020 от Veeam

Наш спонсор, Veeam, выпустил обновленную версию неофициального гайда по подготовке к экзамену VMware Certified Professional on DataCenter Virtualization (VCP:DCV2020).

Данный гайд является хоть и неофициальным, но достаточно интересным буквариком для подготовки к экзамену.

Руководство подготовлено Shane Williford и Paul Wilk, имеющими общую цифру 2x:

  • Шейн в ИТ более 20 лет;
  • Пол пока не разменял третий десяток 😉

P.S. А еще Пол похож на того мужика, что сует 1С в Кубернетис.

Много проблем с VMware Data Recovery

Много лет назад VMware решили, что неплохо было бы сделать свой бэкап-софт для виртуальной среды. Так и появился VMware Data Recovery.

Софт был несколько глючный, поэтому через несколько версий/лет (и объединение с EMC) VMware похоронило свою разработку и сделало vDP на базе EMC Avamar.

На этом глюки поуменьшились, но VMware и этого было мало, вследствие чего поддержка vDP была окончательно похоронена (в 2019 или 2020 году)…

  1. Как-то сдох у меня основной сторадж, на котором лежало все: виртуалки, контроллер домена, vcenter 6.0. Остался жить только vdp и еще один виндовый сервер, лежащие на локальных дисках ESXi. Стоит отметить, что места на локальных дисках ESXi под все виртуальные сервера из бэкапа не было. Но это не стало основной проблемой 😉
  2. Я зашел на веб-интерфейс vDP и запустил Emergency Restore трех продуктивных виртуальных машин (топ по критичности). Это была главная ошибка: надо было сначала восстанавливать DC/VC.
  3. Три критичных виртуалки восстановились, после чего веб-интерфейс vDP отмер – по таймауту. В течение суток и пары ребутов vDP восстановить его не удалось, пошли в саппорт.
  4. Ахмед сказал, что vDP окончательно слетел с саппорта и добавил: “я не гинеколог, но посмотреть могу”. Посмотрел на мое горе, посоветовал развернуть максимально свежую версию vDP и вставить диски туда/либо развернуть vDP 6.1.2 и подоткнуть диски туда.
  5. В штатном режиме vDP развертывается (ovf deploy) только через vCenter. 😉 (Ох щит) (это знак, что стоило сесть за чтение документации по развертыванию vDP)
  6. Я отредактировал вручную .OVF и успешно импортировал виртуальную машину;
  7. Затем я научился менять ip-настройки SLES11 из командной строки;
  8. После этого запустился инсталлятор vDP из веб-интерфейса и… напоролся на проблемы с отсутствием записей DNS.
  9. Ну вы помните, что у меня рабочих систем нет и я работаю в выжженом поле 😉 Ладно, побороли и DNS.
  10. На следующем шаге vDP сказал, что ему нужна для развертывания регистрация в vCenter. АААааааа 😊
  11. В силу ограниченных ресурсов я попытался развернуть vCSA 6.0. Ожидаемо встал на грабли плагина интеграции с браузером, который не захотел устанавливаться.
  12. Мыши плакали, кололись, но продолжали есть кактус.
  13. Я решил рискнуть костями и поставить vCSA 6.5. Да, по матрице он не совместим с vDP 6.1.2, но мало ли что. Впрочем, vCenter развернулся штатно (хоть что-то).
  14. Ожидаемо, регистрация vDP 6.1.2 на vCSA 6.5 не проходит. (непереводимая игра слов)
  15. Развернул через vCenter vDP 6.1.11 – он нормально прошел регистрацию на vCSA 6.5. С замиранием духа втыкаю в него VMDK от старого vDP и прожимаю импорт. Через полчаса…
  16. Через полчаса vDP 6.1.11 говорит, что пароль рута к дискам не подходит. Кстати говоря, эта же проблема имела место год назад. Тогда vDP 6.1.2 не стартовал, импорт дисков не помогал. Тогда vDP мне починил инженер из саппорта (фактически, специалист по Авамару и линуксу, судя по тому трешу, что он творил в консоли)
  17. Остается обратно лохматить старый и неподдерживаемый vDP.
  18. Обратно включаем с дисками старый vDP 6.1.2.
  19. Веб-интерфейс старого vDP открывается, но говорит “ждите до 25 минут, запускаемся”;
  20. В консоли старого vDP вижу, что не запускается служба MCS из-за проблем с чекпоинтами. К счастью есть статья в КБ (https://kb.vmware.com/s/article/2053986), служба запускается и…
  21. Еще минут через 5-10 запускается веб-интерфейс. И я могу продолжать emergency restore!!!11111

Выводы:

  1. Никогда. Не. Используйте. VMware Data Recovery!
  2. В DR-план восстановления инфраструктуры заложите восстановление самого сервера резервного копирования в случае какого-либо сбоя. Ну и тестируйте это (DR – Disaster Recovery, восстановление после катастрофы)!
  3. Я крайне не рекомендую использование в продуктиве софта, для DR-переустановки которого требуется куча “левых” компонент типа vCenter.

P.S. Впрочем, это одна из причин, по которой VMware “мигрировали” vDP на Avamar. До Avamar vDP метаданные держал в базе vCenter. Нет vCenter – ну вы поняли 😉

Skype for Business on Mac – April Joke

28 апреля 2020 года вышло очередное обновление Skype for Business on Mac, которое сломало функционал звонков.

Все устройства дружно перестали осуществлять звонки через пограничный сервер SfB, когда один участник находится внутри, а другой – снаружи.

На Windows клиентах с обеих сторон проблема не воспроизводилась.

Единственная запись в CLS-журналах сервера, относящаяся к сбою, – “Application accepts invitations via static registration only”.

В ходе тестирования различных вариантов был найден workaround: выйти и зайти в учетную запись SfB on Mac (аналог logoff/logon). При этом если вместо выхода/входа перезапустить SfB (или перезапустить сразу после выхода/входа), функционал звонков не работоспособен 🙂

The printer is beeping

When people believe they are accomplished and successful and if they are experts in the field where they work, they tend to recall stories that happened to them. The stories typically start with the words: « Some weird stuff happened to me when I was young and stupid, …»
When I was young promising new grands worked in the Help Desk department, I got a call. A person who called complained regarding a printer: «My printer is beeping while it is printing. » I went to the trouble of getting up and walking to the next building to see that weird printer. Indeed, it made such strange beeping noise printing pages out. And when I printed several pages out in a row it was beeping till it finished printing out.
Both colleagues and I had been trying to realize what problem is and fix it for half an hour! But no luck at all! Then I said to my colleague, «Denis, please hit up the storage to bring a new one. Probably it can be special warning indicates that the printer is going to die or even explode”. I kept staring at the printer. Some people assume that just admin’s look can fix broken printer (or any laptop or server etc) or admin just need to drop by someone who has a problem and chances are problem diapers immediately! Ha-ha. But unfortunately, it was not that case and it looks like I was not the real admin! LOL
I kept staring at its lights and it was winking and beeping teasing us!
I suddenly noticed the flashing red light and it blinked with the rhythm of the beeping printer. I shook my head, but I still saw glitches. Then I focused my attention on the light and the object where it was located. It was a UPS APC with an illuminating red overload light.

I think you’ve already guessed what happened. One of the interns accidentally plugged the printer into the UPS port that was not designed for printers moving the office equipment. Accordingly, when the printing mechanism operated, the UPS overload occurred (or reboot?)
PS. It was a story about beeping HP, but you can face it on Brother, Xerox, Canon, Epson, Kyocera high power laser devices and so on.

Русская версия.

Epic fail story

Всем привет!

Пятница, вечер, дождик…

1) В одной компании вышел из строя RAID6 на HP Proliant Gen6, виртуальные машины на VMware ESXi стали частично недоступны.

Пошли за бэкапами на систему хранения QNAP – оказалось, что она тоже потеряла два диска в RAID5, вследствие чего бэкапов тоже нет.

Владелец взял где-то два брендовых SATA-диска IBM, объединил их в программное зеркало (динамический диск MS Windows) и скинул туда данные с сервера Hyper-V. Сервер Hyper-V был переформатирован под ESXi.

Когда через месяц-два он раздобыл новый сервер под Hyper-V, оказалось, что оба IBM-диска неживые.

Я не уточнял у него, как он вышел из этой ситуации.

2) В другой компании внезапно стали недоступными виртуальные машины, находящиеся на одном из RAID-массивов. Как оказалось, LUN3, состоящий из двух SSD-дисков в зеркала, решил что ну его…

У нас же есть бэкапы, заявил мой тезка. Угу-угу, VMware Data Protection 6.1.2 не загружался, в консоли висела надпись:

Перезагрузка не помогла, через час все было точно также.

vDP пытались оживить сначала вручную, потом через техподдержку VMware. Третий по счету инженер из EMC смог оживить бэкапы и мы узнали… что последний бэкап сделан год назад. Так как “Retention Policy” требует хранить бэкапы за последние 90 дней…

Тут мой тезка и говорит “у меня есть еще одна система резервного копирования, сохраняющая файлы на сервер в Amazon. Но я залогиниться туда не могу 🙁

В общем, сервер с бэкапами на Amazon оказался заражен каким-то ransomware…

Параллельно была сделана попытка выключить и включить система храения с выдергиванием/втыканием SSD-дисков (потому что она еще и на RAID-контроллер ругалась)…

После включения массива сдохло еще 4 SAS-диска (2 уже не работали), вследствие чего Lun2 ушел следом за Lun3. Как оказалось, MD3220i более 7 лет.

Какие выводы (кроме настройки уведомлений) вы бы сделали из обоих историй?

Какие epic fail были у вас?

Микрософт отжигает 0x800706D9

Пишет мне коллега – проблема с обновлением адресной книги в Outlook (не может скачать с Exchange).

ms02

Меня в гугле не забанили.

Решение: чтобы избавиться от ошибки 0x800706d9 при обновлении Windows 10 нужно просто запустить службу брандмауэра (он же файрволл). Если ты не знаешь, как это сделать, тогда проделай следующие действия: открываем панель управления – администрирование – службы. Здесь вылезет окно, в котором нужно найти службу «брандмауэр Windows», открываем ее свойства и устанавливаем тип запуска (вручную или автоматически, как выбрать, смотрите выше).  После чего жмем на кнопку «запустить». Вот собственно и все, снова пробуем обновить ОС и радуемся, что ошибка 0x800706d9 исчезла.

Я: посмотри вот эту ссылку. Советуют запустить службу брандмауэра Windows.

Коллега: Спасибо, огромное. Нет слов… мелкософт отжигают.

И вновь продолжается бой

Давеча (как кстати перевести это слово на английский?) мы уже писали про аптайм Windows-сервера, про который забыли.

В комментариях мне показали ссылку на FreeBSD, проработавший на 2,5 года дольше (2651 день на момент написания той статьи).

Шах и мат, линуксоиды 🙂

msl

 

Поговорим об аптайме

Предыдущий известный вирус – WannaCry – подвиг нас на то, чтобы заняться сканированием всех подсетей холдинга и поиском тех, кто еще не ставит апдейты.

Я нашел два виртуальных сервера Windows 2003 SP1, проработавших 2 года. Вспомнил, что ровно два года назад виртуальными сделал их я 🙂

А еще нашел вот такой железный сервер, правда, с Windows 2003 SP2.

uptime

35 дней до юбилея не хватило!

Думаю, теперь я все знаю про аптайм 🙂