MIKI BLOG

2026-03-03

ONNX Runtime GPU：需要自行构建的原因与方法

本文详细阐述了在 aarch64 环境下为何需要自行构建 ONNX Runtime GPU，以及从 CUDA 13、cuDNN 安装到 CMake 参数配置、wheel 包生成与验证的完整步骤，为 DGX‑Spark 用户提供了实用的构建指南。

#gpu #深度学习 #onnxruntime #aarch64 +2

2025-12-19

梯度消失（Vanishing Gradient）——深度学习为何会出现“短期记忆障碍”

本文阐述深度学习中梯度消失（Vanishing Gradient）现象的根源，解析 Sigmoid 与链式法则如何导致梯度衰减，并详细介绍 ReLU 与 ResNet 如何有效解决该问题，提供实战应用建议。

#深度学习 #反向传播 #梯度消失 #relu +2

2025-12-19

反向传播（Backpropagation）：AI如何追踪错误的“罪魁”，以及链式法则的妙用

本文以通俗易懂的方式阐述了反向传播（Backpropagation）如何帮助 AI 找出错误根源，链式法则（Chain Rule）与 PyTorch Autograd 自动计算梯度的原理，以及深度网络中梯度消失（Vanishing Gradient）问题的成因与解决思路。

#ai #深度学习 #反向传播 #pytorch autograd +2

2025-12-17

为什么深度学习需要微分？（线性代数吗？）

我从开发者的视角，解释了为什么在深度学习中“求导”是必不可少的。在线性代数与非线性函数组合而成的模型中，导数就像一只指针，用来告诉我们如何调整方向以减小误差，并通过梯度下降和反向传播高效完成训练。文章还分步骤说明了导数如何更新参数，以及如何帮助我们在非线性带来的复杂损失曲面上更好地优化模型。

#深度学习 #微分 #线性代数 #梯度下降 +3

2025-12-17

深度学习代码中常见的 NumPy 与 PyTorch：真正关系与学习顺序指南

深度学习开发者常常困惑 NumPy 与 PyTorch 的关系。本文阐明 NumPy 主要用于 CPU 计算、数据预处理与可视化，而 PyTorch 则专注于 GPU 上的张量运算与自动微分。了解两者的内存共享与转换方式，可帮助你在实际项目中高效切换。

#pytorch #gpu #深度学习 #numpy +3

2025-12-16

NumPy基础运算在深度学习中的应用：+、-、*、/、**、比较、sum/mean/max/min 与 axis

NumPy的基本运算（+、-、*、/、**）、比较运算、聚合函数（sum、mean、max、min）以及axis概念，从深度学习角度进行详细说明。通过原子运算、标量运算、掩码使用、feature-wise与sample-wise统计计算等实战示例，帮助你快速将NumPy与PyTorch张量运算自然衔接，实现损失、准确率、归一化等核心计算。

#深度学习 #numpy #axis #基本运算 +3