CS188 - Course Overview
课程信息
- 课程:CS188 (Introduction to Artificial Intelligence)
- 主题:Course Overview
- 状态:已完成第一版
1. 核心问题
CS188 关注“智能体如何在环境中做决策”。
可以分成三类问题:
- 已知规则下的最优搜索
- 不确定环境下的概率推断
- 交互环境下的序列决策(MDP / RL)
2. 课程主线
搜索
- 无信息搜索:DFS、BFS、UCS
- 有信息搜索:A*(核心是启发函数)
对抗与约束
- 博弈搜索:Minimax、Alpha-Beta Pruning
- 约束满足问题:Backtracking + Heuristics
概率图模型与推断
- Bayes Net
- HMM
- 精确推断与采样推断
决策与学习
- MDP + Bellman Equation
- Value Iteration / Policy Iteration
- Q-Learning
3. 学习建议
- 搜索部分重点掌握“状态、动作、代价”的建模。
- MDP 部分重点掌握状态价值与最优策略关系。
- RL 部分重点掌握“探索与利用”的权衡。
4. 一个最小例子:网格路径
把迷宫看成图:
- 节点:坐标位置
- 边:可行动作
- 代价:每步代价或风险
若边权相同,BFS 常可找到最短步数路径;若边权不同,优先考虑 UCS / A*。
5. 易错点
- 混淆“最短步数”和“最小总代价”。
- 把启发函数写成高估,导致 A* 失去最优性保证。
- MDP 中把即时奖励和长期回报混在一起。
6. 我的理解
CS188 的价值不只在算法本身,而在于“统一建模视角”:
- 搜索解决“如何找路径”
- 概率解决“信息不完整怎么办”
- RL 解决“边试边学怎么做”
后续笔记会按这个结构展开。
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.