第一章 因果关系之梯
除非你能想象出事情的结果,否则寻问事情的原因就是徒劳的。反过来说,你不能声称是夏娃导致你吃了树上的苹果,除非你可以想象一个世界,在那个世界里,情况与事实相反,她没有给你那个苹果。
好的预测无须好的解释,就像猫头鹰不明白老鼠为何总是从A点跑到B点,但这不改变它仍然是一个好猎手的事实。
从统计学中学到的任何方法都不足以让我们明确表述类似”如果价格翻倍将会发生什么”这样简单的问题,更别说回答它们了。
反事实与数据之间存在着一种特别棘手的关系,因为数据顾名思义就是事实。数据无法告诉我们在反事实或虚构的世界里会发生什么,在反事实世界里,观察到的事实被直截了当地否定了。然而,人类的思维却能可靠地、重复地进行这种寻求背后解释的推断。当夏娃把”蛇欺骗了我”作为她的行动理由时,她就是这么做的。这种能力彻底地区分了人类智能与动物智能,以及人类与模型盲版本的人工智能和机器学习。
因果模型可用于回答此类反事实问题,建构因果模型所带来的回报是巨大的:找出犯错的原因,我们之后就能采取正确的改进措施;找出一种疗法对某些人有效而对其他人无效的原因,我们就能据此开发出一种全新的疗法;“假如当时发生的事情与实际不同,那会怎样?”对这个问题的回答让我们得以从历史和他人的经验中获取经验教训,这是其他物种无法做到的。难怪古希腊哲学家德谟克利特(公元前460—前370)说:“宁揭一因,胜为波斯王。”
不过,我们可以回答一个略微容易一些的问题:机器(和人)如何表示因果知识,才能让自己迅速获得必要的信息,正确回答问题,并如同一个三岁的儿童一样对此驾轻就熟呢?事实上,这正是本书所要回答的主要问题。
例如,当我们说”鲁莽驾驶会导致交通事故”或”你会因为懒惰而挂科”时,我们很清楚地知道,前者只是增加了后者发生的可能性,而非必然会让后者发生。鉴于此,人们便期望让概率提高准则充当因果关系之梯第一层级和第二层级之间的桥梁。然而,正是这种直觉导致了数十年失败的探索。
阻碍这一探索获得成功的不是这种直觉本身,而是它被形式化表述的方式。哲学家几乎无一例外地使用了条件概率来表示”X提高了Y的概率”,记作P(Y|X)>P(Y)。你肯定注意到了,这种解释是错的,因为”提高”是一个因果概念,意味着X对Y的因果效应,而公式P(Y|X)>P(Y)只涉及观察和手段,表示的是”如果我们观察到了X,那么Y的概率就提高了”。但是,这种概率提高完全可能是由其他因素造成的,比如Y是X的因,或者其他变量(Z)是它们二者的因——这就是症结所在!这一形式表述将哲学家们打回原点,让他们不得不再一次尝试消除可能存在的”其他原因”
我热衷于关注哲学家对诸如因果关系、归纳法和科学推断逻辑等模糊概念的讨论。哲学家的优势在于能够从激烈的科学辩论和数据处理方面的现实困扰中解脱出来。相比其他领域的科学家,他们受统计学反因果偏见的毒害较少。他们有条件呼吁因果关系这一传统思想的复归,这种思想至少可以追溯到亚里士多德时代。谈起因果关系,他们也用不着不好意思,或者躲在”关联”标签的背后。
在此,我想说明的主要观点是:概率能将我们对静态世界的信念进行编码,而因果论则告诉我们,当世界被改变时,无论改变是通过干预还是通过想象实现的,概率是否会发生改变以及如何改变。