含有〈统计〉标签的文章(18)

“XX差异中,50%可归因于YY”是什么意思?

我在上上个帖子里提到“性格差异中,50%左右可归因于遗传”,这里我所引用的是Matt Ridley的说法(见《先天,后天》),后来看到几位该领域的牛人说法类似,我由此判断该说法是主流。

李敖之提到的双胞胎研究,Matt Ridley在他的书里做了详细介绍,显然,他是不会错过这一类信息的。

这里我想澄清的是统计学概念,说“性格差异中,50%左右可归因于遗传”,并不意味着:假如两个人具有完(more...)

标签: |
395

我在上上个帖子里提到“性格差异中,50%左右可归因于遗传”,这里我所引用的是Matt Ridley的说法(见《先天,后天》),后来看到几位该领域的牛人说法类似,我由此判断该说法是主流。

李敖之提到的双胞胎研究,Matt Ridley在他的书里做了详细介绍,显然,他是不会错过这一类信息的。

这里我想澄清的是统计学概念,说“性格差异中,50%左右可归因于遗传”,并不意味着:假如两个人具有完全相同基因基础,其他条件随机,则其性格相似度为50%,或者性格相似度为50%+p,p=0-0.5的随机数。

不是这样的,“XX差异中,50%可归因于YY”这一命题,仅仅意味着:若剔除YY的影响,则样本集的均方差减小一半。

这个均方差,或许原本就很小,或许,人类的性格原本就共同特征远多于个体差异,所以,一对被分开领养的同卵双胞胎,其性格相似度远大于50%,这与我介绍的说法没有冲突。

关于哈佛医学院考题,赞牛友

我多次向朋友宣扬:平均来说,牛博读者的水平比牛博作者高,而且高不少。看来此言不虚——咦?貌似这句话不适合用在自己头上?呵呵,偶尔犯一下戒。

牛友们很少简单的回答0.95,这已经大大超出哈佛水平啦,而我个人认为,答得最好的是foo,他不仅给出了正确的解法和答案,还正确的指出了假阴性率也是个相关变量,我在看到他的答复之前就没意识到这一点,惭愧。(不过就本题而言,假阴性率的高低对计算结果影响极微。)

在屏蔽交流机会的闭卷考试中,大部分错误答案(more...)

标签: |
435

我多次向朋友宣扬:平均来说,牛博读者的水平比牛博作者高,而且高不少。看来此言不虚——咦?貌似这句话不适合用在自己头上?呵呵,偶尔犯一下戒。

牛友们很少简单的回答0.95,这已经大大超出哈佛水平啦,而我个人认为,答得最好的是foo,他不仅给出了正确的解法和答案,还正确的指出了假阴性率也是个相关变量,我在看到他的答复之前就没意识到这一点,惭愧。(不过就本题而言,假阴性率的高低对计算结果影响极微。)

在屏蔽交流机会的闭卷考试中,大部分错误答案都是0.95,得出这个错误的原因是,答题者没有意识到自己无意中错误地把假阳性率理解为“得到阳性结果的样本中实际无病样本的比例”(定义A),而不是它的正确定义“得到阳性结果且实际无病的样本占总无病样本数的比例”(定义B)。

对于我这个认定,有朋友可能会问:既然你没有给出假阳性率的定义,凭什么我不能这么理解?对此我的回答是:如果采用定义A,那么假阳性率这个概念就不可能具有任何统计学意义。试想:假如我用一个已知全部无病的样本集去做这个测试,得到一个阳性样本子集,那么,无论这个测试的误差程度如何,按定义A的假阳性率都将是100%。显然,这样定义的概念是无意义的,这很像罗素的理发师悖论里给出的那种定义。

基于此,我认为不需要流行病学知识,只需要统计学知识,就可以排除定义A,并且得到正确答案。

正如laoyao所说,这个例子表明,在概率问题上,我们的直觉往往会犯错,我记得另一个更有趣的例子是关于三扇门的后面的羊和车的题目,曾经骗倒大批聪明人,包括数学教授。

【花絮】:据说,即使在美国,许多医生在这个问题上都没有搞清楚,因而常常给病人传达错误信息,导致一些不必要的过度恐慌甚至自杀。

出给哈佛医学院60位师生的一道题

据说只有18%的人答对:

If a test [to detect a disease whose prevalence is 1/1000] has a false positive rate of 5%, what is the chance that a person found to have a positive result actually has the disease, assuming you kn(more...)

标签: |
438

据说只有18%的人答对:

If a test [to detect a disease whose prevalence is 1/1000] has a false positive rate of 5%, what is the chance that a person found to have a positive result actually has the disease, assuming you know nothing about the person's symptoms or signs?

注:1)方括号是我加的,避免断句错误,2)false positive=假阳性。