2025-12-19
Потеря градиента (Vanishing Gradient) – почему глубокое обучение страдает от «кратковременной амнезии»
Проблема потери градиента в глубоких нейронных сетях объяснена: как сигмоида и цепное правило приводят к исчезновению сигналов, и как ReLU и ResNet решают эту проблему, включая практические советы по применению.