Andrew Ng Deep Learning Tutorial中Softmax分类器梯度求导过程

2019-11-06 08:35:34

字体：大中小

来源：转载

供稿：网友

Andrew Ng的deep learning tutorial 中 Softmax分类器求梯度的过程省略了，他直接给出Δθ(k)J(θ)=−∑i=1mx(i)((y(i)=k)−exp(θ(k)Tx(i)∑Kj=1exp(θ(j)x(i)))(*) $/Delta_{/theta^{(k)}}J(/theta) = -/sum_{i=1}^m x^{(i)}/bigl(/mathcal{I} (y^{(i)} = k) - /frac{exp({/theta^{(k)T}}x^{(i)}}{/sum_{j=1}^K exp(/theta^{(j)}x^{(i)})}/bigr) /tag{*}$ 但一眼无法看出结果,所以自己求了一下，几次算错。网上查的时候也有人很少有人推导或推错。折腾一下终于知道怎么推了。推导过程如下： J(θ)=−⎡⎣⎢⎢∑i=1m∑k=1K{y(i)=k}logexp(θ(k)⊤x(i))∑Kj=1exp(θ(j)⊤x(i))⎤⎦⎥⎥(1) $/begin{align}J(/theta) = - /left[ /sum_{i=1}^{m} /sum_{k=1}^{K} /mathcal{I}/left/{y^{(i)} = k/right/} /log /frac{/exp(/theta^{(k)/top} x^{(i)})}{/sum_{j=1}^K /exp(/theta^{(j)/top} x^{(i)})}/right]/end{align} /tag{1}$ P(y(i)=k|x(i);θ)=exp(θ(k)⊤x(i))∑Kj=1exp(θ(j)⊤x(i))(2) $P(y^{(i)} = k | x^{(i)} ; /theta) = /frac{/exp(/theta^{(k)/top} x^{(i)})}{/sum_{j=1}^K /exp(/theta^{(j)/top} x^{(i)}) } /tag{2}$ 把(2)代入(1)得：J(θ)=−∑i=1m∑j=0K(y(i)=j)⎡⎣⎢⎢θ(j)x(i)−log∑p=1Kexp(θ(p)Tx(i))⎤⎦⎥⎥ $把(2)代入(1)得：//J(/theta) = -/sum_{i=1}^{m}/sum_{j=0}^K/mathcal{I}(y^{(i)} = j) /left[ /theta^{(j)}x^{(i)} - log /sum_{p=1}^{K}exp(/theta^{(p)T}x^{(i)})/right]$ 可以看出，根据j值的两种可能，所求得的导数不同。接下来分类讨论：I.当j=k时： $可以看出，根据j值的两种可能，所求得的导数不同。接下来分类讨论： I. 当j= k时：$ J(θ)=−∑i=1m⎡⎣⎢⎢θ(k)x(i)−log∑p=1Kexp(θ(p)Tx(i))⎤⎦⎥⎥∂J(θ)∂θ(k)=−∑i=1mx(i)(1−P(y(i)=k|x(i);θ))(3) $J(/theta) = -/sum_{i=1}^{m}/left[ /theta^{(k)}x^{(i)} - log /sum_{p=1}^{K}exp(/theta^{(p)T}x^{(i)})/right]///frac{/partial J(/theta)}{/partial /theta^{(k)}}=-/sum_{i=1}^{m}x^{(i)}/left(1-P(y^{(i)} = k | x^{(i)} ; /theta)/right) /tag{3}$ II:当j≠k时，为使过程清晰不妨设j=q，则J(θ)=−∑i=1m⎡⎣⎢⎢θ(q)x(i)−log∑p=1Kexp(θ(p)Tx(i))⎤⎦⎥⎥ $II:当j/neq k时，为使过程清晰不妨设j = q，则//J(/theta) = -/sum_{i=1}^{m}/left[ /theta^{(q)}x^{(i)} - log /sum_{p=1}^{K}exp(/theta^{(p)T}x^{(i)})/right]$ ∂J(θ)∂θ(k)=−∑i=1mx(i)(−P(y(i)=k|x(i);θ))(4) $/frac{/partial J(/theta)}{/partial /theta^{(k)}}=-/sum_{i=1}^{m}x^{(i)}/left(-P(y^{(i)} = k | x^{(i)} ; /theta)/right) /tag{4}$ . 综合式(3)(4)可得出结果式(*) 。附上andrew ng softmax回归的链接 http://ufldl.stanford.edu/tutorial/supervised/SoftmaxRegression/。

上一篇：[线段树最长上升序列] BZOJ 2957 楼房重建

下一篇：Zedboard的启动流程

学习交流

索泰发布一款GTX 1070 Mini迷你版本:小机

索泰发布一款GTX 1070 Mini迷你版本:小机箱大爱...

热门图片

猜你喜欢的新闻

猜你喜欢的关注