Machine Learning

Stanford Univ, Coursera


Solving the Problem of Overfitting


The Problem of Overfitting

Cost Function

Regularized Linear Regression

Reqularized Logistic Regression


3-8 test

腫瘍を悪性か良性かをclassifyする医学診断問題を考える。 「$h_{\theta}(x)$ がtraining setにoverfitした」というのはどういうこと?

3-9 test

regularized linear regression において、$J(\theta)$を最小jにする$\theta$ を選ぶ。
$\displaystyle J(\theta) = \frac{1}{2m} [ \sum_{i=1}^{m}(h_{\theta}(x^{(i)}) - y^{(i)})^2 + \lambda \sum_{j=1}^{n} \theta_{j}^{2} ] $
$\lambda$ が大き過ぎると(たとえば $\lambda=10^2$とか)どうなるか? ← [自分へのメモ] $\theta$が小くなるので、結果としてunderfittingになる。

3-10 test

$m>0$ 個のtraining set で gradient descentを行う。 lerning rate $\alpha$は比較的小さく、 regularization parameter $\lambda > 0$ はある値を選ぶとする。 update ruleは次の式である。
$\theta_j := \theta_j (1-\alpha \frac{\lambda}{m}) + \alpha\frac{1}{m}\sum_{i=1}^{m}( h_{\theta}(x^{(i)}) - y^{(i)} )x_j^{(i)}$
$(1-\alpha\frac{\lambda}{m})$ の項について正しいのはどれ?

3-11 test

regularized logistic regression を使うとき、gradient descent が正しく動いているのを確認するのに最もよい方法は?
Yoshihisa Nitta

http://nw.tsuda.ac.jp/