年末サーバー点検チェックリスト：10項目の必須設定

年末に一度は確認したいサーバー設定10項目

(何も起こらないようにするため)

「年末だから特に点検しなければならないものはあるのか？」結論から言うと、あります。

年末だからサーバーが特別になるわけではありません。代わりに、運用する側の状況が普段と変わるということです。

休暇・連休で運用スタッフが減る
トラフィックパターンが乱れる
緊張感が緩む

そのため年末は、起きる確率以上に被害が大きくなりやすい時期です。この文は「年末だから必ずやるべき」という強迫的なチェックリストではなく、 連休中に何も起こらないようにするための現実的な点検項目 です。

1. ディスク使用量とログ増加速度

年末だからログが減るわけではありません。

特に次の項目は必ず確認しておきましょう。

/var/log の使用量
アプリケーションログローテーション設定
Docker コンテナログのサイズ（JSONログが無限増加していないか）

ディスクがいっぱいになると 予告なしに停止します。普段は「少し耐えればいい」状況も、連休中はそのまま障害に発展しやすいです。

2. バックアップが「ある」かではなく「復旧できる」か

バックアップファイルがあることより重要なのは、

「これで本当に復旧できるか？」

年末前に最低でも一度以下を試してみましょう。

最新バックアップファイルの存在確認
圧縮ファイルが壊れていないか簡易検証
テスト環境に直接リストアしてみる

新年最初の業務が「バックアップが壊れていた」と知るのを防ぐためです。

3. SSL/TLS証明書の有効期限

年末・年始は証明書失効事故が特に多発します。

Let’s Encrypt の自動更新が実際に動いているか
cron や systemd timer が無効化されていないか
最近の更新ログにエラーがないか

「自動更新だから大丈夫」という思いが 年末の代表的な障害トリガー です。

4. ファイアウォールルールと「一時的に」開放している設定

1年間サーバーを運用しているとこうしたものが蓄積します。

テスト用に開放しているポート
特定の状況で一時的に開放していたIP
もう使っていないサービスポート

こうした一時設定は時間が経つと 存在理由を誰も覚えていないセキュリティホール になります。年末はこれらを整理するのに最適な時期です。

5. SSHアクセス方式とキー管理

連休中に試みられる侵入は 発見が遅れやすい です。

そのため SSH 設定は特に保守的に行うのが安全です。

パスワードログインの無効化
使っていない SSH キーの削除
退職者・外注先のキー削除
管理者アカウントが最小権限のみを持っているか

「結局誰も関心を持たないだろう」という楽観はセキュリティ面ではほぼ常に誤りです。

6. cron/スケジューラの静かな失敗

cron や systemd timer、ジョブスケジューラは 失敗しても気づきにくいものです。

最近の実行ログにエラーがないか
長期間失敗しているジョブがないか
もう不要なジョブが継続して動いていないか

年末に壊れたスケジューラは新年も同じ状態で残ります。

7. リソース使用量は「平均」ではなく「ピーク」基準で

年末トラフィックは普段より変動が大きいです。

特定期間だけトラフィックが急増
ボット/クローラの異常アクセス
特定国の休日パターン

そのためモニタリングも 平均値ではなくピーク を一度は確認しておく必要があります。

CPU・メモリピーク使用量
DB接続数、キュー長
同時接続者数、セッション数

「普段は大丈夫」という言葉は年末にはあまり慰めになりません。

8. アプリケーションの依存サービス状態

サーバーが健全でも、依存サービスが落ちていればサービスは同じように停止 します。

例：

Redis / Memcached
メッセージブローカー（Kafka, RabbitMQ, SQS 等）
外部 API（決済、認証、通知等）
ファイル/画像ストレージ

年末はこれらのサービスも 点検・デプロイ・定期作業 が多いです。障害が起きても「ログに異常が見えない」という状況が頻繁に起こります。依存サービスのステータスページや障害通知チャネルも併せて確認しておくと良いです。

9. エラー通知が本当に「届く」かテスト

エラー通知システムがあることと 通知が実際に届くこと は全く別問題です。

エラーを意図的に一度発生させてみる
メール/Slack/Webhook 通知が実際に届くか確認
重大度（Severity）フィルタで無視されていないか

年末障害の最大の問題はしばしばこれです。

「障害が起きたことに誰も気づかなかった」

10. 「問題が起きたらどこから見るか」を整理したドキュメント一枚

最後の項目は設定ではなく ドキュメント です。

主要サービス一覧
サーバー/コンテナへの接続方法
ログ位置（nginx, app, DB, キュー等）
再起動/ロールバック方法
緊急対応順序

このドキュメント一枚があるかないかで年末障害対応の難易度が ハードモード ↔ ノーマルモード に変わります。