CS188 - Course Overview

Created2026-03-13|Updated2026-03-13|AI

|Post Views:

课程信息

课程：CS188 (Introduction to Artificial Intelligence)
主题：Course Overview
状态：已完成第一版

1. 核心问题

CS188 关注“智能体如何在环境中做决策”。

可以分成三类问题：

已知规则下的最优搜索
不确定环境下的概率推断
交互环境下的序列决策（MDP / RL）

2. 课程主线

搜索

无信息搜索：DFS、BFS、UCS
有信息搜索：A*（核心是启发函数）

对抗与约束

博弈搜索：Minimax、Alpha-Beta Pruning
约束满足问题：Backtracking + Heuristics

概率图模型与推断

Bayes Net
HMM
精确推断与采样推断

决策与学习

MDP + Bellman Equation
Value Iteration / Policy Iteration
Q-Learning

3. 学习建议

搜索部分重点掌握“状态、动作、代价”的建模。
MDP 部分重点掌握状态价值与最优策略关系。
RL 部分重点掌握“探索与利用”的权衡。

4. 一个最小例子：网格路径

把迷宫看成图：

节点：坐标位置
边：可行动作
代价：每步代价或风险

若边权相同，BFS 常可找到最短步数路径；若边权不同，优先考虑 UCS / A*。

5. 易错点

混淆“最短步数”和“最小总代价”。
把启发函数写成高估，导致 A* 失去最优性保证。
MDP 中把即时奖励和长期回报混在一起。

6. 我的理解

CS188 的价值不只在算法本身，而在于“统一建模视角”：

搜索解决“如何找路径”
概率解决“信息不完整怎么办”
RL 解决“边试边学怎么做”

后续笔记会按这个结构展开。

Author: Ziqi Huang

Link: https://wardell-h.github.io/ai/cs188/01-course-overview/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

CS188 Search MDP RL