一、數據擬合實驗室:從欠擬合到過擬合
真實規律 觀測資料 模型預測 診斷:—
訓練 MSE (對觀測資料)
—
泛化 MSE (對真實規律)
—
參數
3
10^-2
1.8
12
提示:當樣本數為 12 時,最高 11 次多項式可「完美穿點」。
查看係數與複雜度 (L2 範數)
觀念速讀與指引
操作指引:
- 感受複雜度:將「正規化強度 λ」設為最低,然後拖動「多項式次數」從 0 到 11。
- 觀察 過擬合:次數增加,「訓練 MSE」下降,但曲線劇烈扭曲,「泛化 MSE」飆升。
- 感受 正規化:在高次數時,增加 λ 可「拉回」曲線,使其更平滑。
- 理解 奧卡姆剃刀:在多個解釋中,選擇最簡單的那個(如 3 次多項式),通常泛化能力更好。
本頁真實函數:f(x) = 15 + 10·sin(2π·(x-3)/12)
二、「找規律」心理測驗
過擬合的核心是忽略「複雜度」。以下問題的答案,本質上是心理學,而非數學。
題目 A: 1, 3, 5, 7, ?
—
題目 B: 2, 4, 8, 16, 31, ?
— 此數列 n=1~8 的完整輸出為:提示:查看完整數列
1, 2, 4, 8, 16, 31, 57, 99
三、生活中的過擬合與啟示
- 考試刷題:過度鑽研題庫細節,將特例當通則,反而在真實考試中缺乏靈活性。
- 刻板印象:根據少量接觸,對某群體形成複雜固定的看法,忽略了個體差異。
- 歷史解釋:用完美理論解釋過去一切,聲稱「歷史必然」,卻常在預測未來時失準。
學習心法
- 學而不思 → 欠擬合:模型過簡,抓不到趨勢。
- 思而不學 → 過擬合:硬湊複雜理論,對未來表現差。
- 允許誤差是代價:追求「完美解釋過去」常以犧牲「預測未來」為代價。