CS229 - Supervised Learning Overview
课程信息
- 课程:CS229 (Machine Learning)
- 主题:Supervised Learning Overview
- 状态:已完成第一版
1. 核心问题
监督学习目标:学习一个映射 $f_\theta(x) \to y$,使模型在未见样本上也能表现良好。
2. 问题类型
- 回归:预测连续值
- 分类:预测离散标签
3. 统一视角
数据
- 训练集:$(x^{(i)}, y^{(i)})$
- 验证集:调参用
- 测试集:最终评估
目标
最小化经验风险:
泛化
真正目标不是训练误差最小,而是测试误差可控。
4. 常见模型
- Linear Regression:回归基线模型
- Logistic Regression:二分类基线模型
- SVM:最大间隔思想
- Neural Networks:高表达能力
5. 评估指标
- 回归:MSE / MAE / $R^2$
- 分类:Accuracy / Precision / Recall / F1 / AUC
6. 易错点
- 只看训练集准确率,不看泛化表现。
- 数据泄漏(测试信息进入训练阶段)。
- 指标选错(类别不平衡只看 Accuracy)。
7. 我的理解
CS229 的主线是“建模 + 优化 + 泛化”。
后续每个模型都可以用同一模板分析:
- 假设是什么
- 损失函数是什么
- 如何优化
- 为什么能泛化
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.