0 前言 在初次接触神经网络的时候,不知道有没有人像我一样,对梯度计算的过程很模糊。可能大体上知道是使用链式法则来做,但是平常接触的都是一元复合函数的求导,像神经网络中这种对参数矩阵求导的具体细节完全不了解。 这篇文章从多元复合函数求导(矩阵求导的重要基础)入手,通过简单的例子进行切入,展示矩阵求导的完整细节。希望这篇文章对想要了解神经网络梯度计算细节的人有所帮助。 1 多元复合函数求导 首先我们先来介绍多元复合函数求导,这是矩阵求导的重要基础。 1.1 问题切入 问:考虑三个函数:, 以及 ,假设偏导都存在,我们…