模式识别与人工智能
“人工智能”复习提纲及重点提示
、 知识原则和知识门槛,知识表示的构成;知识表示的工作假设和符号结构应满足的主要特性;知识表示性能的评价;知识表示的常见方式;程序性和陈述性知识。
答:
(1)知识原则(P15-16)
Lenat和Feiganbaum于IJCAI-10提出了知识原则:一个系统展示高级的智能理解和行为,主要是因为拥有应用领域特有的知识:概念、事实、表示、方法、模型、隐喻和启发式。
(2)知识门槛(P16)
系统拥有的知识和其性能(问题求解能力和效率)的关系可以表示为二维曲线(请参见书中P16中的“图2.1 知识门槛”),图中W,C,E称为知识门槛。其中,
使能门槛W。超过此门槛时,系统就拥有了为执行任务所需的最低限度知识;低于此门槛,系统无足够的知识去解决问题。
胜任门槛C。到达C点时,系统成为在某应用领域中求解问题的专家,胜任只有专家才能解决的问题求解任务。
全能门槛E。到达E点时,由于知识量的空前增加(丰富),使系统能解决该应用领域内几乎所有的问题,成为全能专家。
(3)知识表示的构成(P17)
知识表示在人工智能体的建造中起到关键的作用,正是以适当的方式表示了知识,才导致智能体展示出智能行为。识别表示可视为数据结构及其处理机制的综合,即
知识表示 = 数据结构 + 处理机制
其中,恰当的数据结构用于存储要解决的问题、可能的中间解答和最终解答,以及解决问题涉及之世界的描述。存储这些描述(符号)的数据结构也称为符号结构,它导致了知识的显式表示。然而,仅有符号结构并不能体现出系统具有知识,因为符号结构本身并不构成意义,只有对其做适当的处理才构成意义。所以,要使系统显示出有知识,不仅要定义适当的数据结构(即符号结构),还须定义配套的处理机制去使用它们。
(4)知识表示的工作假设和符号结构应满足的主要特性(P21-22)
Brian Smith在他的博士论文中提出了关于知识表示的一个基本的方法论设想,称为知识表示假设。该假设声称:
任何机械设置(装置?)的智能过程均由结构成分组成,人们作为外部观察者,自然地引用这些结构对该智能过程展示的知识作陈述性描述;独立于这样的外部语义,它们在产生显示(显式?)的行为中起到基本的作用。
上述“结构成分”就是KB系统中的符号结构,它满足2个主要特性:
可解释为表示知识的命题。
在KB系统的行为中起因果作用。
基于这一假设,设计任何KB系统均包括2个方面:知识表示和领域特有的知识。知识表示提供表示语言和推理机制,表示语言以符号结构描述获取到的领域知识,而推理机制则应用这些知识实现智能行为。
(5)知识表示性能的评价(P23-24)
Woods提出应从两个方面评价知识表示的性能,包括表示的充分性和表示法效用:
表示的充分性:是指作重要区分和避免不必要区分的能力。一种表示方式无论怎样有效,若不能表示必要的区别,也是没有用处的。只有具备表示的充分性,知识表示系统才能恰当地描述问题求解涉及的事物,以及智能体对于外部世界的信念、目的和猜测等。
表示法效用:是指表示知识的元素和处理这些元素的操作应能有效地支持使用知识的推理活动。它又分为2个方面:
i) 概念效率。指知识表示方式应能有利于知识库以自然的方式吸收随意的新信息,新知识的加入和老知识的更新不会引起知识库发生大的变化。
ii) 计算效率。主要指推理的有效性,如推理的速度、结论的正确性和有效性等。
要兼顾概念效率和计算效率往往比较困难,因为前者要求表示知识的符号结构与知识的获取和知识库维护相容(即知识应以接近于人的思维方式表示),而后者则要求与推理机相容(即知识应以接近于计算机目标代码的方式表示)。解决上述矛盾的一种可取方法是,提供2套符号结构,分别面向知识获取和机器推理,并设计自动转变程序来实现两者间的映射。
(6)知识表示的常见方式(P25-26)
常见的知识表示方式可归纳为4类:一阶谓词逻辑、产生式系统、语义网络、框架系统。
a) 一阶谓词(P25)。
b) 产生式系统(P25-26)。
c) 语义网络(P26)。
d) 框架系统(P26)。
重点提示:
一阶谓词逻辑具有很好的表示充分性,从而使得基于这种表示方式的归结定理证明方法能适用于各种应用领域。然而,归结原理不能应用启发式知识控制推理,因为它有知识库较大时推理效率极低的缺点。
产生式系统由规则库、综合数据库和控制子系统3个部分组成。产生式规则最适合于表示各种启发式知识以指示事物间的经验性关联,故广泛应用于专家系统的设计中。
语义网络注重表示对象间的关系,而框架系统更强调对象的内部结构。
(7)程序性和陈述性知识(P27-28)
智能体拥有的知识可按存储方式区分为2大类:程序性知识和陈述性知识。
程序性知识 —— 隐含于使用它的计算机程序中。
陈述性知识 —— 独立于应用它的程序而清晰地存储。
重点提示:
程序性知识(如搜索算法、控制策略等)隐含于推理机中。
陈述性知识的共同特点是:能清晰地存储于独立定义的符号结构中;可由应用该知识的程序存取。
陈述性知识在设计智能系统中处于突出而重要的地位,其优点:易于修改;可应用于多重目标;易于扩展;支持自我意思。
陈述性知识是以牺牲效率来换取灵活性。
2、知识表示和推理间的制约关系:不完全知识,关系数据库、逻辑程序设计、语义网络、框架描述语言设计中的权衡。
答:
(1)不完全知识(P30-31)
(2)关系数据库(P31-32)
当完全消除表示不完全知识的能力时,知识库就退化为关系数据库。
(3)逻辑程序设计(P32-33)
逻辑程序设计是一种一阶逻辑的受限表示形式,典型例子为Prolog语言。
逻辑程序与数据库一样,只允许表示关于领域世界的完全知识,不同之处仅在于逻辑程序允许经由推理回答问题。
从某种意义上说,逻辑程序设计并未给推理系统提供任何计算上的优点,因为决定知识库中显式表示的知识隐含着什么是不可判定的。
(4)语义网络(P33-34)
语义网络等价于数据库加上特性继承机制。
不能表示特性继承机制无法处理的不完全知识。
特性继承超出真值理论的范畴。
语义网络提供了集结信息的结构化描述手段。
总之,语义网络通过限制表示能力来换取有效的推理方式——图搜索,但不便于表示启发式推理规则(如Prolog语言或产生式系统那样),难以展开演绎推理。
(5)框架描述语言设计中的利弊权衡(P34-35)
框架表示机制可视为语义网络的精化,使语义网节点(称为框架)具有更丰富的结构化描述。
……
(6)几点结论(P34)
表示能力和易处理性之间存在制约关系。
知识表示的性能无绝对衡量标准,应依据手头实际的问题求解任务权衡所需的表示能力和易处理性。
删除不必要的表示能力,将会明显提高推理的有效性。
现有知识表示语言均可视为一阶谓词逻辑的受限情况。
混合系统促进表示性能。
3、知识级分析:知识级组成和结构,合理性原则,知识的本性,知识的表示。
答:
(1)知识级组成(P38-39)
知识级组成包括3个成分:
部件 —— 目标集、动作集和一个知识体;
媒介 —— 就是知识,自治体通过知识作为媒介,以决定为达到某目标应采用什么动作;
行为法则 —— 即合理性原则,指导选择合适的动作去达到自治体的目标。
(2)知识级结构(P39-40)
一个自治体的知识级结构由动作集、目标集和一个知识体组成:
动作集 —— 导致了自治体与它所处环境的交互作用,并由此使人感觉到它的存在。
知识体 —— 包含自治体拥有的知识,并可通过动作来增加体中的知识。知识体仅是知识级的一个部件而已,用于容纳知识,不考虑内部结构。
目标集 —— 阐述自治体在所处环境中事务的知识。
(3)合理性原则(P40)
控制自治体并预言其行为的法则称为合理性原则,其精确定义:
若一个自治体有关于它动作之一会导致达到某一目标的知识,则该自治体将选择那个动作。
重点提示:
合理性原则把知识、目标和动作联系在一起,而不需要任何具体的物理关联机制。
合理性原则是属于认知科学的,不同于任何物理和机械学中的法则,不不同于计算机系统其它级的行为法则。
合理性并不包含优化选择的概念,只要动作能达到目标,选择该动作就是合理的。
仅有合理性原则对于选择动作去达到目标是不充分的,因为常会遇到多个不同动作能达到同一目标的情况。
不能唯一地确定系统行为是知识级不同于其它计算机系统级的又一显著不同。
知识级只能确定系统行为的范畴和轮廓,行为的完全确定必须在符号级实现。
(4)知识的本性(P41)
重点提示:
知识只能由自治体的行为来表现。
符号信息的集合并不表示有知识,要使系统表现出有知识,不仅必须有存放符号信息的数据结构,还要有相应的处理过程。
不存在存放知识的物理结构(难道人的大脑不是用于存放知识的物理结构吗?!),知识是通过行为来体现的。
(5)知识的表示(P41-42)
重点提示:
知识级分析确保系统的可行性和总体性能,但其操作化必须在符号级实现。这是知识级系统向符号级系统归约的问题,知识的表示就是归约的实现方式。归约意指知识级的构成元素可由下层符号级的元素来定义或加以具体实现。
自治体 —— 对应于整个符号级系统。
动作 —— 定义为相应的符号处理程序,包括输入输出和其它为执行动作所需的操作。
知识体 —— 通过定义符号结构和相应的处理程序来表示。
目标 —— P42。
合理性法则 —— P42。
基于上述归约的定义,可把知识的表示定义为在符号级编码知识体。
4、符号推理的高级技术,规则库大时产生式系统的缺点,组织问题求解的事务表法和黑板法。
答:符号推理的高级技术有(P50):
假设与约定, 从属和辨证,约束满足和元推理等。
规则库大时产生式系统的缺点(P56):
难以扩展
选择规则的底效性
不灵活的控制策略
单一的表示形式
事务表法(P57) : 事务表是一张应由系统执行的列表,也称为任务表,是面向动作的问题求解组织方式之一。从组织问题求解的角度,事务表方法的意义也在于它允许各个推理模块经由事务表相互通信,以求协调它们在事务求解中的合作关系。(P57)
黑板法(P57-59): 黑板法与事务表都是面向动作的组织方式,适合黑板法解决问题应有以下的特点:
大的解答空间;
不精确,不完全和不可靠的数据;
需要处理和集成众多异质的信息;
需众多知识源合作求解问题;
需使用多种不同的推理方法;
解答渐增性地生成。
5 KB系统的体系结构原则,手工知识获取过程及其自动化,KB系统开发步骤,KB系统开发工具和环境的分类。
答:
KB系统的体系结构原则………………………………………………………………….......p63
体系结构研究的核心问题在于如何根据应用领域的特征和问题求借任务的要求来组织问题求借和推理控制,并由此决定表示知识的符号结构和推理的机制。尽管基于知识的问题求解允许有多种多样的实施方法,但仍可以归纳出某些组织求解的原则。作为一个术语,体系结构学定义为设计KB系统的科学和方法,体系结构的合理性将影响到问题求解的效率、完备性和可靠性。
手工知识获取过程及其自动化………………………………………………………………..p67
手工知识获取过程:
领域专家
知识工程师
知识获取界面
推理机
知识库
知识获取的自动化:
领域专家
智能知识
的取界面
推理机
知识库
KB系统开发步骤
KB系统开发工具和环境的分类……………………………………………………………….p185