Chap 1 人工智能概述
1.2 人工智能代表性技术选讲
符号流派
对于一个问题,首先要将它符号化,然后对于我们的可能的结果以及操作化成符号语言,最后再来进行符号化的方法 1.方案一:能冲三就冲三,防住对手的冲三,其余情况下随机落子 (1)符号表征: 棋盘格子:Cell(i,j),$1\geq i,j \leq 3$ 棋盘状态:TTT(n)(Cell(i,j))->{1,0,-1}; o:Cell(i,j)=-1; X:Cell(i,j)=0; 初态:$\forall i,j,TTT(0)(Cell(i,j))=0$ 落子:$\forall n,\exists i,j, such that TTT(n-1)(Cell(i,j))=0 and TTT(n)(Cell(i,j))=1,-1$ 先下:$\exists i,j, TTT(1)(Cell(i,j))=1$ 胜负判定:$\forall n, if \exists i, such that \forall j, TTT(n)(Cell(i,j))=1, then winner(TTT(n))=o and Halt(TTT(n))$ (2)方案一的逻辑表征: as to 1, exists i, TTT(n)(Cell(i,1))=TTT(n)(Cell(i,2))=1 and TTT(n)(Cell(i,3))=0, set TTT(n+1)(Cell(Cell(i,3)))=1(对于其余的情况类似)guard as to 2, exists i, TTT(n)(Cell(i,1))=TTT(n)Cell(i,2)=-1 and TTT(n)(Cell(i,3))=0, set TTT(n+1)(Cell(i,3)=1)guarding as to 3, randomly set TTT(n+1)(Cell(i,j)) 2.相关的一些改进方案:如加上一些的相关的方案,以促进胜利 3.搜索算法:深搜,广搜,启发式搜索(根据当前的情况判断先进行什么搜索,生成搜索树:每次选择可以胜利/不败的落子,)
统计流派
1.对于每一次的搜索算例过大,而关键在于判断当前状态下如何选择下一步的行动 蒙特卡洛方法:模拟近似整个空间,在当前的状态s下,随机选择n局游戏,k局胜利,则有Value(s)=k/n;并由此种方法继续
连接学派的神经网络方案
使用神经网络学习策略,将多步的反馈传到当前步骤