10 настроек сервера, которые стоит проверить к Новому году

(чтобы ничего не случилось)

“Нужно ли проверять серверы к Новому году?” Ответ прост: да.

Новый год не делает серверы особенными. Но люди меняются.

  • Сокращение персонала из‑за отпусков
  • Перемена паттернов трафика
  • Снижение напряжённости

Поэтому к Новому году риск инцидентов обычно самый высокий. Эта статья – не «обязательный чек‑лист» по «почему» к Новому году, а реалистичный список проверок, чтобы ничего не произошло во время праздников.


1. Использование диска и скорость роста логов



Новый год не уменьшает количество логов.

Особенно важно проверить:

  • Использование /var/log
  • Настройки ротации логов приложений
  • Размер логов Docker‑контейнеров (не бесконечный рост json‑логов)

Сервер с заполненным диском прекратит работу без предупреждения. То, что в обычный день «поймёт» себя, в праздники может стать причиной сбоя.


2. Не только наличие резервных копий, но и их восстановление

Наличие файлов резервного копирования – не главное.

«Можно ли действительно восстановиться?»

Перед Новым годом сделайте хотя бы один раз:

  • Проверку наличия последнего резервного файла
  • Быструю проверку целостности архива
  • Восстановление в тестовую среду

Чтобы в первый рабочий день нового года не обнаружилось «копия повреждена».


3. Дата истечения SSL/TLS сертификатов



В период новогодних и новогодних праздников часто происходят инциденты с истечением сертификатов.

  • Работает ли автоматическое обновление Let’s Encrypt
  • Не отключён ли cron или systemd timer
  • Нет ли ошибок в логах обновления

«Автоматическое обновление – всё в порядке» – типичный триггер сбоя.


4. Правила брандмауэра и «временные» открытые порты

За год на сервере накопилось:

  • Порты, открытые для тестов
  • Временные IP‑адреса
  • Порты, которые больше не нужны

Такие временные настройки со временем становятся «памятными дырками». Новый год – идеальное время, чтобы их убрать.


5. Методы доступа по SSH и управление ключами

В период праздников попытки взлома часто остаются незамеченными.

Поэтому настройте SSH как можно более строго:

  • Отключение логина по паролю
  • Удаление неиспользуемых ключей
  • Удаление ключей бывших сотрудников и подрядчиков
  • Минимальные привилегии для администраторов

Оптимистичный взгляд «никто не будет интересоваться нашим сервером» почти всегда ошибочен.


6. Тихие неудачи планировщика cron

cron, systemd timer и другие планировщики могут тихо падать.

  • Нет ли ошибок в последних логах выполнения
  • Нет ли давно неработающих задач
  • Нет ли задач, которые больше не нужны

Планировщик, сломанный к Новому году, останется сломанным и в следующем году.


7. Использование ресурсов по «пиковой» нагрузке, а не по среднему

Трафик в новогодние дни более переменный.

  • Внезапные всплески в определённые периоды
  • Ненормальный доступ ботов/краулеров
  • Праздничные паттерны по странам

Поэтому мониторинг должен смотреть не среднее, а пик:

  • Пиковое использование CPU и памяти
  • Количество соединений к БД, длина очередей
  • Количество одновременных подключений, сессий

«В обычный день всё в порядке» – не спасает в новогодние дни.


8. Состояние зависимых сервисов

Сервер может быть в порядке, но если зависимые сервисы падают, сервис тоже остановится.

Например:

  • Redis / Memcached
  • Message brokers (Kafka, RabbitMQ, SQS и т.д.)
  • Внешние API (платёжные, аутентификационные, уведомления)
  • Хранилище файлов/изображений

В новогодние дни эти сервисы тоже проходят проверки, деплои и плановые работы. Проверьте страницы состояния и каналы оповещений.


9. Проверка, действительно ли приходят уведомления об ошибках

Наличие системы оповещений – не то же самое, что они приходят.

  • Имитируйте ошибку
  • Проверьте, приходят ли email/Slack/Webhook
  • Убедитесь, что фильтры Severity не игнорируют

Самая частая причина новогодних инцидентов – «никто не заметил».


10. Документ «откуда начать, если возникнут проблемы»

Последний пункт – не настройка, а документ.

  • Список ключевых сервисов
  • Способы подключения к серверу/контейнеру
  • Места логов (nginx, приложение, БД, очередь)
  • Способы перезапуска/отката
  • Приоритеты действий в экстренной ситуации

Наличие такой страницы может изменить сложность реагирования с «тяжёлый» на «нормальный».


Проверочный список к Новому году

Ниже простая таблица, чтобы можно было быстро проверить всё.

Пункт Что проверяем Как проверить Рекомендуемое состояние
Использование диска Свободное место, логи df -h, размер /var/log >20 % свободного места
Ротация логов Периодичность logrotate, настройки Docker Регулярная ротация
Резервные копии Наличие и восстановление Восстановление в тестовой среде Успешное восстановление за 24–48 ч
SSL‑сертификаты Сроки, автообновление certbot, логи >30 дней до истечения
Брандмауэр Открытые порты ufw, iptables Минимум, удалены лишние порты
SSH Аутентификация, ключи sshd_config, список ключей Логин по ключу, удалены лишние ключи
Планировщики Ошибки Логи cron/systemd Нет ошибок за последние 24 ч
Пиковые нагрузки CPU, память, соединения Мониторинг, htop Пиковые нагрузки в пределах лимитов
Зависимые сервисы Состояние, оповещения Страницы состояния, каналы Быстрое обнаружение сбоев

Если вы прошли все пункты, можно спокойно отдыхать. Но большинство администраторов всё равно берут ноутбук в багаж, чтобы в случае непредвиденного события иметь доступ.

Мы делаем всё, чтобы вероятность инцидента была минимальной, а если всё же возникнет, то знать, как реагировать.

Пусть ваш Новый год будет спокойным и без неожиданных сбоев.

Dev cheking operating server