10 настроек сервера, которые стоит проверить к Новому году
(чтобы ничего не случилось)
“Нужно ли проверять серверы к Новому году?” Ответ прост: да.
Новый год не делает серверы особенными. Но люди меняются.
- Сокращение персонала из‑за отпусков
- Перемена паттернов трафика
- Снижение напряжённости
Поэтому к Новому году риск инцидентов обычно самый высокий. Эта статья – не «обязательный чек‑лист» по «почему» к Новому году, а реалистичный список проверок, чтобы ничего не произошло во время праздников.
1. Использование диска и скорость роста логов
Новый год не уменьшает количество логов.
Особенно важно проверить:
- Использование
/var/log - Настройки ротации логов приложений
- Размер логов Docker‑контейнеров (не бесконечный рост json‑логов)
Сервер с заполненным диском прекратит работу без предупреждения. То, что в обычный день «поймёт» себя, в праздники может стать причиной сбоя.
2. Не только наличие резервных копий, но и их восстановление
Наличие файлов резервного копирования – не главное.
«Можно ли действительно восстановиться?»
Перед Новым годом сделайте хотя бы один раз:
- Проверку наличия последнего резервного файла
- Быструю проверку целостности архива
- Восстановление в тестовую среду
Чтобы в первый рабочий день нового года не обнаружилось «копия повреждена».
3. Дата истечения SSL/TLS сертификатов
В период новогодних и новогодних праздников часто происходят инциденты с истечением сертификатов.
- Работает ли автоматическое обновление Let’s Encrypt
- Не отключён ли
cronилиsystemd timer - Нет ли ошибок в логах обновления
«Автоматическое обновление – всё в порядке» – типичный триггер сбоя.
4. Правила брандмауэра и «временные» открытые порты
За год на сервере накопилось:
- Порты, открытые для тестов
- Временные IP‑адреса
- Порты, которые больше не нужны
Такие временные настройки со временем становятся «памятными дырками». Новый год – идеальное время, чтобы их убрать.
5. Методы доступа по SSH и управление ключами
В период праздников попытки взлома часто остаются незамеченными.
Поэтому настройте SSH как можно более строго:
- Отключение логина по паролю
- Удаление неиспользуемых ключей
- Удаление ключей бывших сотрудников и подрядчиков
- Минимальные привилегии для администраторов
Оптимистичный взгляд «никто не будет интересоваться нашим сервером» почти всегда ошибочен.
6. Тихие неудачи планировщика cron
cron, systemd timer и другие планировщики могут тихо падать.
- Нет ли ошибок в последних логах выполнения
- Нет ли давно неработающих задач
- Нет ли задач, которые больше не нужны
Планировщик, сломанный к Новому году, останется сломанным и в следующем году.
7. Использование ресурсов по «пиковой» нагрузке, а не по среднему
Трафик в новогодние дни более переменный.
- Внезапные всплески в определённые периоды
- Ненормальный доступ ботов/краулеров
- Праздничные паттерны по странам
Поэтому мониторинг должен смотреть не среднее, а пик:
- Пиковое использование CPU и памяти
- Количество соединений к БД, длина очередей
- Количество одновременных подключений, сессий
«В обычный день всё в порядке» – не спасает в новогодние дни.
8. Состояние зависимых сервисов
Сервер может быть в порядке, но если зависимые сервисы падают, сервис тоже остановится.
Например:
- Redis / Memcached
- Message brokers (Kafka, RabbitMQ, SQS и т.д.)
- Внешние API (платёжные, аутентификационные, уведомления)
- Хранилище файлов/изображений
В новогодние дни эти сервисы тоже проходят проверки, деплои и плановые работы. Проверьте страницы состояния и каналы оповещений.
9. Проверка, действительно ли приходят уведомления об ошибках
Наличие системы оповещений – не то же самое, что они приходят.
- Имитируйте ошибку
- Проверьте, приходят ли email/Slack/Webhook
- Убедитесь, что фильтры Severity не игнорируют
Самая частая причина новогодних инцидентов – «никто не заметил».
10. Документ «откуда начать, если возникнут проблемы»
Последний пункт – не настройка, а документ.
- Список ключевых сервисов
- Способы подключения к серверу/контейнеру
- Места логов (nginx, приложение, БД, очередь)
- Способы перезапуска/отката
- Приоритеты действий в экстренной ситуации
Наличие такой страницы может изменить сложность реагирования с «тяжёлый» на «нормальный».
Проверочный список к Новому году
Ниже простая таблица, чтобы можно было быстро проверить всё.
| Пункт | Что проверяем | Как проверить | Рекомендуемое состояние |
|---|---|---|---|
| Использование диска | Свободное место, логи | df -h, размер /var/log |
>20 % свободного места |
| Ротация логов | Периодичность | logrotate, настройки Docker |
Регулярная ротация |
| Резервные копии | Наличие и восстановление | Восстановление в тестовой среде | Успешное восстановление за 24–48 ч |
| SSL‑сертификаты | Сроки, автообновление | certbot, логи |
>30 дней до истечения |
| Брандмауэр | Открытые порты | ufw, iptables |
Минимум, удалены лишние порты |
| SSH | Аутентификация, ключи | sshd_config, список ключей |
Логин по ключу, удалены лишние ключи |
| Планировщики | Ошибки | Логи cron/systemd | Нет ошибок за последние 24 ч |
| Пиковые нагрузки | CPU, память, соединения | Мониторинг, htop |
Пиковые нагрузки в пределах лимитов |
| Зависимые сервисы | Состояние, оповещения | Страницы состояния, каналы | Быстрое обнаружение сбоев |
Если вы прошли все пункты, можно спокойно отдыхать. Но большинство администраторов всё равно берут ноутбук в багаж, чтобы в случае непредвиденного события иметь доступ.
Мы делаем всё, чтобы вероятность инцидента была минимальной, а если всё же возникнет, то знать, как реагировать.
Пусть ваш Новый год будет спокойным и без неожиданных сбоев.

Комментариев нет.