本文共 888 字,大约阅读时间需要 2 分钟。
z = (y - Xw )T (y - Xw) // y 列向量 X 矩阵 w 列向量dz / dw = d{ ( y - Xw )T (y - Xw) } / dwdz / dw = d( tr{ ( y - Xw )T (y - Xw) } ) / dw // 由展开的计算公式而来,tr()为矩阵的迹dz / dw = d( tr{ yTy - wTXTy - yTXw + wTXTXw } ) / dw// 定理 (AB)T = BTATdz / dw = d( tr{ yTy } ) / dw - d( tr{ wTXTy } ) / dw - d( tr{ yTXw } ) / dw + d( tr{ wTXTXw } ) / dw// 由迹的定理 dz / dw = - d( tr{ wTXTy } ) / dw - d( tr{ yTXw } ) / dw + d( tr{ wTXTXw } ) / dw// 去掉0项dz / dw = - XTy - d( tr{ yTXw } ) / dw + d( tr{ wTXTXw } ) / dw// 定理 d(tr{ATB}) / dA = d(tr{BAT}) / dA = Bdz / dw = - XTy - d( tr{ (yTXw)T } ) / dw + d( tr{ wTXTXw } ) / dw// 定理 tr(A) = tr(AT)dz / dw = - XTy - XTy + d( tr{ wTXTXw } ) / dw// 由前面定理dz / dw = - XTy - XTy + d( tr{ wIwTXTX } ) / dw// 定理 tr(AB) = tr(BA),其中补齐I为单位阵dz / dw = - XTy - XTy + XTXw + XTXw// 定理 d( tr{ABATC} ) / dA = CAB + CTABT// 其中A = w,B = I,C = XTXdz / dw = -2XTy + 2XTXw = 2XT(Xw - y)// 合并
转载地址:http://buwji.baihongyu.com/