贝叶斯推理相关 第2页


贝叶斯推理相关 第2页
2 应用
2.1一个心理学研究中常被引用的例子:
参加常规检查的40岁的妇女患乳腺癌的概率是1%。如果一个妇女有乳腺癌,则她有80%的概率将接受早期胸部肿瘤X射线检查。如果一个妇女没有患乳腺癌,也有9.6%的概率将接受早期胸部肿瘤X射线测定法检查。在这一年龄群的常规检查中某妇女接受了早期胸部肿瘤X射线测定法检查。问她实际患乳腺癌的概率是多大?
设H[,1]=乳腺癌,H[,2]=非乳腺癌,A=早期胸部肿瘤X射线检查(以下简称“X射线检查”)
已知P(H[,1])=1%,P(H[,2])=99%,P(A/H[,1])=80%,P(A/H[,2])=9.6%,求P(H[,1]/A)。
根据贝叶斯定理,P(H[,1]/A)=(1%)(80%)/[(1%)(80%)+(99%)(9.6%)]=0.078
心理学家所关心的是,一个不懂贝叶斯原理的人对上述问题进行直觉推理时的情形是怎样的,并将他们的判断结果与贝叶斯公式计算的结果做比较来研究推理过程的规律。因此有关这类问题的推理被称为贝叶斯推理。

2.2归纳推理
归纳推理是一种由特殊或个别性的前提推出一般性结论的推理。其推理的一般形式如下:
  A是G
  B是G
  C是G ……前提
  A、B、C都是D
  所以D是G……………结论
推理中的前提是论据,结论是论点。比如论证"自学能成才":
  高尔基是个人才
  华罗庚是个人才
  张海迪是个人才 ……论据(前提)
  他们都是靠自学成才的
  所以说自学能成才  ………论点(结论)
  在实际应用中可以省略成分,如上边那种形式可变成:高尔基、华罗庚、张海迪不都是自学成才的吗?
  归纳推理可分为完全归纳推理和不完全归纳推理。不完全归纳推理又可分为简单枚举归纳推理、科学归纳推理、概率预测推理和统计推理。除完全归纳推理之外,其余的全是前提与结论之间没有蕴涵关系的或然性推理。

3 贝叶斯推理研究概况
3.1 基础概率忽略现象的发现与争论
  Kahneman和Tversky开辟了概率推理这一重要的研究领域。他们在20世纪70年代初期的研究首先发现,人们的直觉概率推理并不遵循贝叶斯原理,表现在判断中往往忽略问题中的基础概率信息,而主要根据击中率信息作出判断。他们一个经典性的研究[3]是:告知被试100人中有70人是律师,30人是工程师,从中随机选出一人,当把该人的个性特征描述得象工程师时,被试判断该人为工程师的概率接近0.90。显然被试忽略了工程师的基础概率只有30%。后来他们还采用多种问题验证基础概率忽略现象,如让被试解决如下出租车问题:一个城市85%的出租车属于绿车公司,15%属于蓝车公司,现有一出租车卷入肇事逃逸事件,根据一目击者确认,肇事车属于蓝车公司,目击者的可靠性为80%。问肇事车是蓝车的概率是多少。结果大多数被试判断为80%,但如果考虑基础概率则应是41%。
  这一研究结果引发了20世纪70年代以来的大量研究。有研究支持其结论,如Eddy用前述乳腺癌问题让内科医生判断,结果95%的人判断介于70%~80%,远高于7.8%。Casscells等人的研究结果表明,即使哈佛医学院的工作人员对解决如乳腺癌和与之相类似的问题都出现同样的偏差。
  但也有研究发现,在许多条件下,被试对基础概率的反应是敏感的。例如,如果问题的措辞强调要理解基础概率与判断的相关性或强调事件是随机抽样的,则基础概率忽略现象就会减少或消除。另一个引人注意的是Gigerenzer和Hoffrage1995年的研究,他们强调概率信息形式对概率判断的影响。采用15个类似前述乳腺癌的文本问题进行了实验,问题的概率信息用两种形式呈现,一种沿用标准概率形式(百分数);一种用自然数表示的频率形式,如“1000名妇女中有10名患有乳腺癌,在患有乳腺癌的妇女中8名妇女接受早期胸部X射线测定法检查,在没有患乳腺癌的990名妇女中有95名接受早期胸部X射线测定法检查”。结果在频率形式条件下,接近50%的判断符合贝叶斯算法,而在标准概率条件下只有20%的判断符合贝叶斯算法。
  而另一些研究者对此也提出异议,有人认为他们在改变信息形式的操作中,同时也改变了其他的变量。如Lewis和Keren提出这种概率信息的改变使原来的一般性问题变成了当前单个情境的具体问题,因而问题变得容易,被试判断的改善不能说明他们的计算与贝叶斯计算一致。另外Fiedler认为,他们进行频率形式的操作为所有数据提供了一个共同的参照尺度——即所有数据都是相对于总体(1000名妇女)而言的,依靠它所有的数据变得容易比较。很明显,接受X射线检查并患乳腺癌的妇女的数量(8)与接受X射线检查并无乳腺癌的妇女的数量(95)相比或与接受X射线检查的妇女总数(103)相比都是非常小的。相反,在标准概率条件下,没有共同的参照尺度,表面上击中率(80%)远高于误报率(9.6%),但它们是相对于大小不同的亚样本,而不是相对于总体,不能在同一尺度上进行数量比较。于是他们用4个问题进行了2(数据比较尺度:共同尺度/非共同尺度)×2(数据形式:标准概率/频率)的被试间设计,实验结果表明:不管采用哪一种数据形式,被试在非共同参照尺度条件下,判断准确性都低,在共同参照尺度下,判断准确性高。所以判断准确性与数据形式无关。
  可见,人们在概率判断中忽略基础概率是不是一种普遍现象,不同的研究之间存在较大分歧。这将促使研究者们采用各种方法对人们的概率判断推理过程进行更深入的探讨。
3.2 贝叶斯推理问题的研究范式
  为了探讨上述问题,人们采用了不同的研究范式。从已有的研究看,贝叶斯推理的研究范式主要有两种,一种是文本范式,一种是经验范式。
  文本范式是实验中的问题以文本的形式直接提供各事件的基础概率和击中率、误报率等信息,让被试对某一出现的事件作出概率大小的判断。如前述的乳腺癌问题,工程师问题,出租车问题等的研究就是采用这一范式。
  然而,在实际生活中,人们进行概率判断需要从自己经历过的事件中搜集信息,而不是像文本范式那样被动得到这些信息。经验范式便克服了文本范式的这一缺陷。经验范式就是在实验中让被试通过经历事件过程,主动搜集信息来获得基础概率、击中率和误报率等各种情况的信息,然后作出概率判断。
  例如,Lovett和Schunn为了探讨基础概率信息和特殊信息对被试解决问题策略的影响,利用建筑棒任务(Building  Stick  Task,BST)进行了实验设计。对于一个给定的BST问题来说,计算机屏幕下方提供3条不同长度(长、中、短)的建筑棒并在上方显示一条一定长度的目标棒,要求被试用建筑棒通过加法(中棒+短棒)策略或减法(长-中或短棒)策略制造目标棒。被试只能凭视觉估计每条棒的长度,迫使他们不能用代数方法而只能用策略尝试来解决问题。基础概率是两种策略解决问题的基本成功率;特殊信息是建筑棒与目标棒的接近类型对选择策略的暗示性和所选策略成功的预见性:长棒接近目标棒则暗示使用减法策略,中棒接近目标棒则暗示使用加法策略,如果暗示性策略成功表明该策略具有预见性,否则为非预见性。问题设计时,在200个任务中控制两种策略基本成功率(偏向:一策略高(如70%),另一策略低(如30%);无偏向:两策略各50%)和暗示性策略对成功预见性的比例(有预见性:暗示性和非暗示性策略成功率分别为80%和20%;无预见性:暗示性和非暗示性策略成功率各50%)。研究者对被试在尝试上述任务前后分别用10个建筑棒任务进行了测试,发现被试在尝试前主要根据特殊信息选择策略,在尝试后主要依据两种策略的基本成功率信息选择策略。说明人们在尝试200个任务后对尝试中的基础概率信息的反映是敏感的。
  经验范式的优点在于,实验操作过程非常接近人们在日常生活中获得概率信息以作出判断的情况,较为真实地反映了人们实际的表征信息和作出概率判断的过程。所以许多研究者采用了这一范式。
  但研究范式的变化并没有能消除前述的争论,在不同的研究范式下都存在人们对基础概率信息的忽略或敏感现象,并出现了各种对基础概率信息忽略或敏感现象进行解释的理论。

4结束语
该研究首次发现儿童能够解决贝叶斯推理问题。该结果提示,儿童的推理依赖于适当的信息表征形式,通过给儿童提供适当的信息表征形式,可以大大提高他们的问题解决能力。
贝叶斯推理在过去近30年中得到了较为广泛的研究,特别自Kahneman和Tversky发现人们直觉的概率判断忽略基础概率现象以来,出现了许多理论和研究方法的更新,这些都深化了对这一问题的研究。这些研究既揭示了人们概率估计中常见的认知错误,也为人们进行贝叶斯推理至少提供了以下启示:首先,必须注意事件的基础概率,基础概率小的事件,即使某种击中率较高,其出现的总概率仍然是较小的。如现实生活中中奖的机会等就是小概率事件。其次,应该对信息的外部表征作理性的分析,不应受一些表面特征所迷惑。如击中率的高低并不决定该事件出现概率的高低。第三,不能过分相信经验策略(如代表性启发和可得性启发)。虽然经验策略有时能减轻人们的认知负荷并导致正确的概率估计,但也在许多情况下会误导我们的判断。如不要因为舆论经常宣传癌症对人们生命的威胁就认为癌症致死的概率比心脏病致死的概率更高。当然,贝叶斯推理问题仍然值得做更进一步的研究,如人们对概率信息的内部加工过程及其特点,对基础概率、击中率或误报率的敏感或忽略及其所依存的条件以及研究方法和手段的改进等。

参考文献
[1] 拉塞尔,诺文 人工智能:一种现代方法(第二版)人民邮电出版社  2006
[2]Estes  W  K,Campbell  J  A,Hatsopoulos  N,et  al.Bae-rateneglects  in  category  learning:A  compari on  of  parallel  networkand  memory 
[3] Zhu, Liqi., Gerd Gigerenzer, Children Can Solve Bayesian Problems: The Role of Representation in Computation., Cognition, 98(2006)287-308 (SSCI, IF=3.444)

上一页  [1] [2] 

  • 上一篇文章:
  • 下一篇文章:
  • Copyright © 2007-2012 www.chuibin.com 六维论文网 版权所有