博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
概率图模型(PGM)模式推断与概率图流
阅读量:4260 次
发布时间:2019-05-26

本文共 2349 字,大约阅读时间需要 7 分钟。

我们依然使用“学生网络”作为例子,如图1。

 

图1

首先给出因果推断(Causal Reasoning)的直觉解释。

可以算出来

即学生获得好的推荐信的概率大约是0.5.

但如果我们知道了学生的智商比较低,那么拿到好推荐信的概率就下降了:

进一步,如果又同时知道了考试的难度很低,那么他拿到好的推荐信得概率又上升了,甚至还能超过最初的概率:

上述这个过程就是因果推断,你看它是顺着箭头的方向进行推断。

 

其次给出信度推断(Evidential Reasoning)的直觉解释。如图2.

图2

本来已知考试难度高和学生很聪明的概率分别为0.4和0.3

现在我们忽然知道这个悲剧的同学考试里得了C等。

那么现在考试难度高的概率就上升了,学生很聪明的概率就下降了:

上述这个过程就是信度推断,你看它是逆着箭头方向进行推断的。

 

再次给出交叉因果推断(Intercausal Reasoning)的直觉解释,如图3.

图3

信度推断指出,在已知该同学考了C等之后,他很聪明的概率下降到0.08了,

如果此时我们又知道这次考试很难,那么他很聪明的概率会有一个轻微的上升,到0.11:

交叉因果推断的特点是Difficulty顺着箭头到了Grade,又逆着箭头影响到了Intelligence.

 

为什么会这样?我们考虑一个最简单的情况,如图4.

图4

一开始可以看到,X1和X2是完全独立的,同时有若已知Y=1

然而,当我们已知X1=1之后,X2=1的概率下降了:

 

再来看看这个同学考了B是什么效果,如图5.

图5

本来学生很聪明的概率是0.3,后来知道了他考了B,那么他很聪明的概率下降到了0.175.

现在又知道了,这门考试其实蛮难的。那么他很聪明的概率又上升到了0.34,居然超过了原始的0.3.

 

现在再考虑一个情况:这个同学在SAT测验中得了A,如图6.

图6

这对考试很难以及学生很聪明的概率有什么影响吗?回到那位考了C的悲剧同学。

这个同学考了C,所以考试很难的概率为0.63,学生很聪明的概率降到0.08

现在,忽然又知道了这个同学蛮厉害的,在SAT中考了A

于是,考试很难的概率达到了0.76,学生很聪明的概率达到了0.58,两者都大大超过了他们本来的概率。这是因为,同学的SAT成绩为A改变了我们对其智商的认识,从而影响到了在他考了C时,对其考试难度的认识。

 

通过上述直观分析,我们发现概率图中的节点是能够相互影响的,下面做具体分析。如图7.

图7

设随机变量X和Y,在什么情况下是可以相互影响的呢?

1.X与Y直接相连时他们可以相互影响。

比如告诉你考试很简单,那么你得分高的概率自然上升。告诉你得了C,那么考试很简单的概率就会下降。

 

2.X与Y中间隔了一个W,在连接箭头方向不变的情况下,X与Y能够相互影响。

比如告诉你这个同学得到了一封不错的推荐信,那么考试简单的概率就上升了。告诉你考试难度很大,那么他能得到好推荐信的概率就下降了。

 

3.X与Y之间隔了一个W,如果其中箭头是指向外的方向,X与Y能够相互影响。

比如同学的SAT成绩显然和他的Grade是相互影响的。这就像一个人每次模拟考试都能拿高分,我们自然有理由相信他能力很强,足以在高考中获得好成绩。

 

4.X与Y之间隔了一个W,如果其中箭头是指向内的方向,那么X与Y就不能相互影响了。

比如告诉你考试很难,但这跟同学的智商有什么关系呢?反之亦然。

 

总之,如果一条关系链中没有形如的结构,那么这条关系链就能把影响传递下去。

 

以上讨论的都是我们对中间环节W一无所知的情况。

如果我们知道关于中间环节W的信息呢,X与Y之间的相互影响是否会因此而发生改变呢?我们用Z集合表示我们知道相关信息的意思。如图8.

图8

分栏左侧就是我们上面讨论的情况:我们对W一无所知。

右边栏是指我们已经知道W的概率了。再来观测X与Y之间的影响。

 

神奇的事情出现了:如果我们知道了W的概率,会把之前通畅的关系链给打断了;而把之前堵塞的关系链打通了。

具体地:同学SAT得了A,但是我们已知这个同学智商其实超级笨,那么他考试拿高分的概率会因为他SAT的狗屎运而增多吗?不会的,根据定义,考试成绩只与他的智商和考试难度有关,跟他碰巧考好的SAT没有任何关系。因为我们已经知道他实际上很笨了,SAT不过是个意外。

而之前堵塞的链接现在却通了。比如说考试很难,这和同学智商没有任何关系,但是如果我知道了考试很难,同学考了A,那么我们非常有理由相信,同学应该很聪明啦。

 

这张图中,S-I-G-D这条路径在I不知道、G知道的情况下才能通畅无阻。

 

Tips:其实这个结论还应该扩展一下。

已知试卷很难,不知道考了多少分,但是我们知道这个同学利用这个分数拿到了一封很好的推荐信,我们就有理由相信,他应该考得不错,进而相信他应该是个挺聪明的童鞋。

 

总之。如果一条关系链中在每个形如的结构里,我们知道Xi或者至少知道他的某一个子节点的概率(就像我们虽然不知道Grade,但是我们知道了Letter的概率),那么这条关系链就能把影响传递下去。

 

独立性

独立性的定义可以有以下3种描述:

 

类似地,条件独立也可以这么写

 

下面直观感受一下条件独立性,如图9

图9

有2枚硬币,一只均匀,另一只不均匀而且又90%的概率能正面朝上。当然,两枚硬币外观是完全一样的。

 

现在让你抽出一枚,准备扔2次。

你先扔了第一次,发现正面朝上,那么可以相信,第二次还是正面朝上的概率肯定增加了,这样第二次投硬币的结果受到了第一次投硬币的影响。

而我现在告诉你其实你刚刚投的是均匀硬币(或者不均匀,无所谓的),那么你第二次投硬币的概率和第一次投出来的结果就失去了联系。

这就说明了条件有时会使变量之间的相关性丧失

你可能感兴趣的文章
C/C++输入输出
查看>>
泸州NGN属南气矿工程----华为s2600磁盘阵列问题解决
查看>>
泸州属南气矿----配置S2600磁盘阵列报错:There is no master controller.
查看>>
SQL 调优1
查看>>
OA报账规范(出差专用)
查看>>
生产库快速关闭数据库
查看>>
差异增量备份和累积增量备份的差别
查看>>
ASM 无法发现候选磁盘组----grid 11.2.0.3 asm 自检通不过 prvf-5184
查看>>
ASM 无法发现候选磁盘组----丢失的ASM磁盘组 ASM的磁盘组无法挂载
查看>>
Oracle 10g配置单向stream流复制,完整记录
查看>>
ORA-00845 MEMORY_TARGET not supported on this system
查看>>
ORA-00257: archiver error --11GR2 RAC 设置归档路径和开启flashback
查看>>
奕新集团项目--Oracle 源RAC ---目标 RAC GG 搭建 11.2.3 版本 双向同步
查看>>
What is SCAN in Oracle 11g R2 RAC
查看>>
关于Recycle Bin是什么以及实验
查看>>
Linux搭建时间同步服务器
查看>>
ORA-12541: TNS:no listener
查看>>
mysql数据库存储路径更改 数据文件位置
查看>>
Could not fetch specs from https://rubygems.org/
查看>>
oracle日志分析工具LogMiner使用
查看>>