因果关系分析

【2023-07-29】

@whigzhou: 几周前读了Judea Pearl 的《为什么》,这书的导言和前几章很有欺骗性,让人感觉作者像个神棍,我差点就放弃了,幸亏现在年纪大了比较有耐心,而且刚好人在外面,iPad里也没有更好选择,就捏着鼻子读了下去,结果发现其实是本很不错的书,介绍的东西很有意思,也很重要,

他说的其实是这么个东西(这是我的解读,其他读者的理解可能完全不同,这也得怪作者,他的表达方式确实很有问题):

1)一项科学研究大概有这样几个步骤构成:提出一个(或一组)因果假设,采集实验或观察数据,用数学工具处理数据,分析检验处理结果是否支持假设,

2)问题是,在早先(大概二三十年前吧),数据处理部分与其他步骤在数学上是脱节的,它们没有被纳入一个统一的数学程序中,这是因为处理数据所用的经典统计学,系统性的排除了因果关系这个概念,

3)正因此,因果分析只存在于研究的非数学部分,通常是用自然语言表达的,未数学化的,这也意味着,提出假设这一步,并不能直接的导出对后续步骤的严格指引:该采集何种数据,该如何处理,该如何以处理结果验证假设,

4)这种脱节也意味着,没有明确的方法来识别和认定诸如共因关系和中介因子等在因果分析中极为关键的因素,

5)并不是说,科学研究因为这种脱节就没法做了,统计学毕竟只是研究者所用的数据工具之一,虽然各部分可能是脱节的,但人类理性能力可以把他们接合起来,这个过程就是所谓的“分析”,

6)问题是,这样的话,科学探索就没法自动化(因为各步骤没有被纳入统一的数学模型),而这正是强人工智能所需要的,一个真正的智能系统应该能自行探索世界,提出假设,采集数据,验证假设,并据此调整信念,而这一连串步骤须在一个统一的数学框架指导下持续迭代,唯如此,其对世界的认识才能在没有人工输入的情况下持续改进,

7)解决方案就是把因果关系以严格的数学语言(比如因果图)表示出来,并且置入用于处理数据、检验假设的数学模型中,比如把一般的贝叶斯网络换成因果贝叶斯网络(非因果的贝叶斯网络中,节点只表示状态,连接是无方向的,而在因果贝叶斯网络中,节点可以表示行动(或干预,或Pearl的do算子),连接是有向的),

Pearl自称,在促成上述转变的发展中,他和他的学生们做出了大量关键贡献,这我并不怀疑,但他的叙述方式总让人感觉这个转变被他说的比实际更具革命性,说的好像在此之前的研究者要么不关心因果关系,要么根本不知道怎么分析因果关系,这当然不可能是真的,只是早先没有办法把因果分析放进标准的统计工具包里而已,

相关文章

标签: | | |
9150
【2023-07-29】 @whigzhou: 几周前读了Judea Pearl 的《为什么》,这书的导言和前几章很有欺骗性,让人感觉作者像个神棍,我差点就放弃了,幸亏现在年纪大了比较有耐心,而且刚好人在外面,iPad里也没有更好选择,就捏着鼻子读了下去,结果发现其实是本很不错的书,介绍的东西很有意思,也很重要, 他说的其实是这么个东西(这是我的解读,其他读者的理解可能完全不同,这也得怪作者,他的表达方式确实很有问题): 1)一项科学研究大概有这样几个步骤构成:提出一个(或一组)因果假设,采集实验或观察数据,用数学工具处理数据,分析检验处理结果是否支持假设, 2)问题是,在早先(大概二三十年前吧),数据处理部分与其他步骤在数学上是脱节的,它们没有被纳入一个统一的数学程序中,这是因为处理数据所用的经典统计学,系统性的排除了因果关系这个概念, 3)正因此,因果分析只存在于研究的非数学部分,通常是用自然语言表达的,未数学化的,这也意味着,提出假设这一步,并不能直接的导出对后续步骤的严格指引:该采集何种数据,该如何处理,该如何以处理结果验证假设, 4)这种脱节也意味着,没有明确的方法来识别和认定诸如共因关系和中介因子等在因果分析中极为关键的因素, 5)并不是说,科学研究因为这种脱节就没法做了,统计学毕竟只是研究者所用的数据工具之一,虽然各部分可能是脱节的,但人类理性能力可以把他们接合起来,这个过程就是所谓的“分析”, 6)问题是,这样的话,科学探索就没法自动化(因为各步骤没有被纳入统一的数学模型),而这正是强人工智能所需要的,一个真正的智能系统应该能自行探索世界,提出假设,采集数据,验证假设,并据此调整信念,而这一连串步骤须在一个统一的数学框架指导下持续迭代,唯如此,其对世界的认识才能在没有人工输入的情况下持续改进, 7)解决方案就是把因果关系以严格的数学语言(比如因果图)表示出来,并且置入用于处理数据、检验假设的数学模型中,比如把一般的贝叶斯网络换成因果贝叶斯网络(非因果的贝叶斯网络中,节点只表示状态,连接是无方向的,而在因果贝叶斯网络中,节点可以表示行动(或干预,或Pearl的do算子),连接是有向的), Pearl自称,在促成上述转变的发展中,他和他的学生们做出了大量关键贡献,这我并不怀疑,但他的叙述方式总让人感觉这个转变被他说的比实际更具革命性,说的好像在此之前的研究者要么不关心因果关系,要么根本不知道怎么分析因果关系,这当然不可能是真的,只是早先没有办法把因果分析放进标准的统计工具包里而已,


暂无评论

发表评论