《K不确定性》PPT课件.ppt

上传人:赵** 文档编号:64395026 上传时间:2022-11-29 格式:PPT 页数:30 大小:568.50KB
返回 下载 相关 举报
《K不确定性》PPT课件.ppt_第1页
第1页 / 共30页
《K不确定性》PPT课件.ppt_第2页
第2页 / 共30页
点击查看更多>>
资源描述

《《K不确定性》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《K不确定性》PPT课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou不确定性不确定性(并非世界不完美,只是我们的知识有限)R&N:Chap.3,Sect 3.6+Chap.13人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou课程到目前为止,都是基于如下“完美”假设:世界(问题)的状态都是完全可以观察的 当前状态是明确知道的所执行的动作(决策)的描述是清楚的下一步到达的状态是可以明确预测的现在我们研究一个智能体如何去应对所谓的“非完美”信息有时候,我们还需要考虑动态的问题世界人工智能原理2008年春季 广西大学 计算机学院 Dr.OuIntroductory ExampleGoalA rob

2、ot with imperfect sensing must reach a goal location among moving obstacles(dynamic world)人工智能原理2008年春季 广西大学 计算机学院 Dr.Ouair bearinggas tankair thrustersRobot created atStanfords ARL Labto study issues in robot control and planning in no-gravityspace environment人工智能原理2008年春季 广西大学 计算机学院 Dr.OuModel,Sen

3、sing,and Control The robot and the obstacles are represented as disks moving in the planeThe position and velocity of each disc are measured by an overhead camera every 1/30 secx xyrobotobstacles人工智能原理2008年春季 广西大学 计算机学院 Dr.OuExperimental RunTotal duration:40 secX人工智能原理2008年春季 广西大学 计算机学院 Dr.OuExperim

4、ental Run人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou还可能有其他意外还可能有其他意外例如:推进器堵塞机器人没气了,又或者没电了做实验用的大桌子突然跨塌了等等.毫无疑问的不确定性!人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou另外一个例子:不确定性下的决策智能体相信:P(A25 gets me there on time|)=0.04 P(A90 gets me there on time|)=0.70 P(A120 gets me there on time|)=0.95 P(A1440 gets me there on time|)=0.9999 那么

5、到底应该选择哪一个动作呢?可能要根据误机的承受程度对比无聊候机的厌恶程度(效用)来进行决策,人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou不确定性的来源不确定性的来源Sources of Uncertainty人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou第一个不确定性的来源第一个不确定性的来源:描述世界的表示语言描述世界的表示语言当前的知识表示技术下,真实问题世界的状态要远多于表示语言的表达能力范畴表示语言描述的一种状态,在真实问题世界了可能对应多个不同的状态(表达能力的限制),于是智能体无法区分这些不同的状态表示语言描述的动作也可能不够准确,智能体会无所适从AB

6、CABCABCOn(A,B)On(B,Table)On(C,Table)Clear(A)Clear(C)人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou第二个不确定性来源:第二个不确定性来源:无法完美的对世界进行观察无法完美的对世界进行观察对问题世界的观察可能会是:部分的 Partial,例如视觉传感器无法穿透障碍物(感知信息缺少)R1R2机器人在R1时无法看到R2是否有灰尘人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou人工智能原理2008年春季 广西大学 计算机学院 Dr.OuObservation of the world can be:对问题世界的观察可能会是:

7、部分的 Partial,例如视觉传感器无法穿透障碍物不明确 Ambiguous,例如,感知信息可能有多种解释不正确 Incorrect第二个不确定性来源:第二个不确定性来源:无法完美的对世界进行观察无法完美的对世界进行观察人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou第三个不确定性的来源:第三个不确定性的来源:无知,惰性,效率无知,惰性,效率一个动作可能会有很长的前提清单,例如:Drive-Car:P=Have(Keys)Empty(Gas-Tank)Battery-Ok Ignition-Ok Flat-Tires Stolen(Car).可能由于惰性,也可能基于效率,智能体设

8、计者往往不愿意去把这些所有的前提都表示出来于是执行动作的结果可能会是不正确的执行(动作的效果与描述不一样),也可能执行动作会得到多个不同的结果人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou不确定性的表示不确定性的表示有许多不确定性模型我们课程考虑其中一种最重要的模型:概率模型 Probabilistic model:不确定性可表示成概率分布人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou信度状态信度状态信度状态 belief state 是智能体所认为的该问题世界每一种状态的可能性不确定性的概率模型中,每种状态的概率是对实际状态的可能性的量测0.20.30.40.1人

9、工智能原理2008年春季 广西大学 计算机学院 Dr.Ou概率意味着什么概率意味着什么?概率很自然的可以理解为频率智能体相信如果能够重复多次同一个信度状态,则实际的状态发生的频率会遵循概率分布0.20.30.40.1This state would occur 20%of the times人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou例子例子考虑这样一个问题世界:牙医智能体D碰到了一位新患者D只对一件事情感兴趣:P是否有牙洞(命题Cavity)在对患者进行任何的检查(观察)之前,D的信度状态是:即意味着D认为有某一部分的人有牙洞(的疾病)Cavity Cavityp1-p人工智

10、能原理2008年春季 广西大学 计算机学院 Dr.Ou概率怎么得到概率怎么得到?基于过去的观察,得到的频率数据系统理论的分析得到,例如:滚动骰子,每一面的概率位1/6主观给出,例如:如果在限速120公里的高速公路上开到时速180公里,那么被交警开罚单的概率位0.6无差别原则 Principle of indifference:如果对这些可能没有相关的知识,那么给所有的可能分配一个均等的概率人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou概率理论基本知识概率理论基本知识人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou随机变量Random variables例子:离散随机变

11、量Weather,有如下值域.sunny 为 Weather=sunny 的缩写P(Weather=sunny)=0.72,P(Weather=rain)=0.1,etc.可记为:P(sunny)=0.72,P(rain)=0.1,etc.其他类型的随机变量:布尔随机变量 ,值域为,例如,Cavity(布尔随机变量是离散随机变量的特例)连续随机变量,连续的值域,例如 Temp人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou命题 对随机变量赋值,即构成基本的命题:e.g.,Weather=sunny,Cavity=false(简写为cavity)复杂的命题由基本命题与逻辑连接符构成e

12、.g.,Weather=sunny Cavity=false人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou原子事件原子事件:不确定世界所有状态的完整的具体描述,例如:Cavity=false Toothache=falseCavity=false Toothache=trueCavity=true Toothache=falseCavity=true Toothache=true原子事件是互斥的,是穷尽的人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou先验概率先验(无条件)概率P(sunny)=0.72,P(rain)=0.1,etc.概率分布给出了所有可能值的概率:

13、P(Weather)=和为1人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou联合概率随机变量组合的概率:表中所有项的和为问题领域内的所有查询都可以由联合概率得到一个命题的概率为该命题所包含的原子事件的概率的和P(cavity)=0.1 add elements of cavity rowP(toothache)=0.05 add elements of toothache columnToothache ToothacheCavity0.040.06 Cavity0.010.89人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou条件概率P(cavity)=0.1 和 P(

14、cavity toothache)=0.04 均为先验(无条件)概率一旦有了新的证据(之前概率未知的随机变量)例如 toothache,则有了一个后验(条件)概率,例如P(cavity|toothache)P(A|B)=P(A B)/P(B)P(cavity|toothache)=0.04/0.05=0.8Toothache ToothacheCavity0.040.06 Cavity0.010.89ABUA B人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou条件概率的定义:P(A|B)=P(A B)/P(B)乘法法则:P(A B)=P(A|B)P(B)=P(B|A)P(A)也可写

15、为如下形式:P(Weather,Cavity)=P(Weather|Cavity)P(Cavity)链式法则可由连续应用乘法法则得到:P(X1,Xn)=P(X1,.,Xn-1)P(Xn|X1,.,Xn-1)=P(X1,.,Xn-2)P(Xn-1|X1,.,Xn-2)P(Xn|X1,.,Xn-1)=条件概率人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou贝叶斯法则Bayes RuleP(A|B)=(P(B|A)P(A)/P(B)P(disease|symptom)=P(symptom|disease)P(disease)P(symptom)用于由原因概率得到诊断概率:P(Cause|

16、Effect)=P(Effect|Cause)P(Cause)/P(Effect)Imagine disease=SARS,symptom=coughingP(disease|symptom)对于SARS来说,流行区与非流行区该概率是不一样的P(symptom|disease)相对是稳定的(由病理分析)更容易得到P(symptom|disease)P(symptom)如何得到呢?使用条件(见下页)人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou条件思想:使用条件概率代替联合概率P(A)=P(A B)+P(A B)=P(A|B)P(B)+P(A|B)P(B)例子:P(symptom)=P(symptom|disease)P(disease)+P(symptom|disease)P(disease)更一般的:P(Y)=z P(Y|z)P(z).

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁