作者回复: 不记得哪里提到了:)如果是模型复杂,数据不足,确实可能导致“过拟合”。如果模型学习能力较弱,数据复杂,那么可能导致“欠拟合”。
作者回复: 梯度计算得到的,形式如同:dy/dx (x^2) = 2x。这个x就是你提到的 x_j^{(i)} 。不过这里是多因子,所以有下标j。