Проверочный список серверов к Новому году: 10 обязательных настроек

10 настроек сервера, которые стоит проверить к Новому году

(чтобы ничего не случилось)

“Нужно ли проверять серверы к Новому году?” Ответ прост: да.

Новый год не делает серверы особенными. Но люди меняются.

Сокращение персонала из‑за отпусков
Перемена паттернов трафика
Снижение напряжённости

Поэтому к Новому году риск инцидентов обычно самый высокий. Эта статья – не «обязательный чек‑лист» по «почему» к Новому году, а реалистичный список проверок, чтобы ничего не произошло во время праздников.

1. Использование диска и скорость роста логов

Новый год не уменьшает количество логов.

Особенно важно проверить:

Использование /var/log
Настройки ротации логов приложений
Размер логов Docker‑контейнеров (не бесконечный рост json‑логов)

Сервер с заполненным диском прекратит работу без предупреждения. То, что в обычный день «поймёт» себя, в праздники может стать причиной сбоя.

2. Не только наличие резервных копий, но и их восстановление

Наличие файлов резервного копирования – не главное.

«Можно ли действительно восстановиться?»

Перед Новым годом сделайте хотя бы один раз:

Проверку наличия последнего резервного файла
Быструю проверку целостности архива
Восстановление в тестовую среду

Чтобы в первый рабочий день нового года не обнаружилось «копия повреждена».

3. Дата истечения SSL/TLS сертификатов

В период новогодних и новогодних праздников часто происходят инциденты с истечением сертификатов.

Работает ли автоматическое обновление Let’s Encrypt
Не отключён ли cron или systemd timer
Нет ли ошибок в логах обновления

«Автоматическое обновление – всё в порядке» – типичный триггер сбоя.

4. Правила брандмауэра и «временные» открытые порты

За год на сервере накопилось:

Порты, открытые для тестов
Временные IP‑адреса
Порты, которые больше не нужны

Такие временные настройки со временем становятся «памятными дырками». Новый год – идеальное время, чтобы их убрать.

5. Методы доступа по SSH и управление ключами

В период праздников попытки взлома часто остаются незамеченными.

Поэтому настройте SSH как можно более строго:

Отключение логина по паролю
Удаление неиспользуемых ключей
Удаление ключей бывших сотрудников и подрядчиков
Минимальные привилегии для администраторов

Оптимистичный взгляд «никто не будет интересоваться нашим сервером» почти всегда ошибочен.

6. Тихие неудачи планировщика cron

cron, systemd timer и другие планировщики могут тихо падать.

Нет ли ошибок в последних логах выполнения
Нет ли давно неработающих задач
Нет ли задач, которые больше не нужны

Планировщик, сломанный к Новому году, останется сломанным и в следующем году.

7. Использование ресурсов по «пиковой» нагрузке, а не по среднему

Трафик в новогодние дни более переменный.

Внезапные всплески в определённые периоды
Ненормальный доступ ботов/краулеров
Праздничные паттерны по странам

Поэтому мониторинг должен смотреть не среднее, а пик:

Пиковое использование CPU и памяти
Количество соединений к БД, длина очередей
Количество одновременных подключений, сессий

«В обычный день всё в порядке» – не спасает в новогодние дни.

8. Состояние зависимых сервисов

Сервер может быть в порядке, но если зависимые сервисы падают, сервис тоже остановится.

Например:

Redis / Memcached
Message brokers (Kafka, RabbitMQ, SQS и т.д.)
Внешние API (платёжные, аутентификационные, уведомления)
Хранилище файлов/изображений

В новогодние дни эти сервисы тоже проходят проверки, деплои и плановые работы. Проверьте страницы состояния и каналы оповещений.

9. Проверка, действительно ли приходят уведомления об ошибках

Наличие системы оповещений – не то же самое, что они приходят.

Имитируйте ошибку
Проверьте, приходят ли email/Slack/Webhook
Убедитесь, что фильтры Severity не игнорируют

Самая частая причина новогодних инцидентов – «никто не заметил».

10. Документ «откуда начать, если возникнут проблемы»

Последний пункт – не настройка, а документ.

Список ключевых сервисов
Способы подключения к серверу/контейнеру
Места логов (nginx, приложение, БД, очередь)
Способы перезапуска/отката
Приоритеты действий в экстренной ситуации

Наличие такой страницы может изменить сложность реагирования с «тяжёлый» на «нормальный».

Проверочный список к Новому году

Ниже простая таблица, чтобы можно было быстро проверить всё.

Пункт	Что проверяем	Как проверить	Рекомендуемое состояние
Использование диска	Свободное место, логи	`df -h`, размер `/var/log`	>20 % свободного места
Ротация логов	Периодичность	`logrotate`, настройки Docker	Регулярная ротация
Резервные копии	Наличие и восстановление	Восстановление в тестовой среде	Успешное восстановление за 24–48 ч
SSL‑сертификаты	Сроки, автообновление	`certbot`, логи	>30 дней до истечения
Брандмауэр	Открытые порты	`ufw`, `iptables`	Минимум, удалены лишние порты
SSH	Аутентификация, ключи	`sshd_config`, список ключей	Логин по ключу, удалены лишние ключи
Планировщики	Ошибки	Логи cron/systemd	Нет ошибок за последние 24 ч
Пиковые нагрузки	CPU, память, соединения	Мониторинг, `htop`	Пиковые нагрузки в пределах лимитов
Зависимые сервисы	Состояние, оповещения	Страницы состояния, каналы	Быстрое обнаружение сбоев

Если вы прошли все пункты, можно спокойно отдыхать. Но большинство администраторов всё равно берут ноутбук в багаж, чтобы в случае непредвиденного события иметь доступ.

Мы делаем всё, чтобы вероятность инцидента была минимальной, а если всё же возникнет, то знать, как реагировать.

Пусть ваш Новый год будет спокойным и без неожиданных сбоев.

Dev cheking operating server