课程信息

  • 课程:CS188 (Introduction to Artificial Intelligence)
  • 主题:Course Overview
  • 状态:已完成第一版

1. 核心问题

CS188 关注“智能体如何在环境中做决策”。

可以分成三类问题:

  1. 已知规则下的最优搜索
  2. 不确定环境下的概率推断
  3. 交互环境下的序列决策(MDP / RL)

2. 课程主线

搜索

  • 无信息搜索:DFS、BFS、UCS
  • 有信息搜索:A*(核心是启发函数)

对抗与约束

  • 博弈搜索:Minimax、Alpha-Beta Pruning
  • 约束满足问题:Backtracking + Heuristics

概率图模型与推断

  • Bayes Net
  • HMM
  • 精确推断与采样推断

决策与学习

  • MDP + Bellman Equation
  • Value Iteration / Policy Iteration
  • Q-Learning

3. 学习建议

  • 搜索部分重点掌握“状态、动作、代价”的建模。
  • MDP 部分重点掌握状态价值与最优策略关系。
  • RL 部分重点掌握“探索与利用”的权衡。

4. 一个最小例子:网格路径

把迷宫看成图:

  • 节点:坐标位置
  • 边:可行动作
  • 代价:每步代价或风险

若边权相同,BFS 常可找到最短步数路径;若边权不同,优先考虑 UCS / A*。

5. 易错点

  • 混淆“最短步数”和“最小总代价”。
  • 把启发函数写成高估,导致 A* 失去最优性保证。
  • MDP 中把即时奖励和长期回报混在一起。

6. 我的理解

CS188 的价值不只在算法本身,而在于“统一建模视角”:

  • 搜索解决“如何找路径”
  • 概率解决“信息不完整怎么办”
  • RL 解决“边试边学怎么做”

后续笔记会按这个结构展开。