Archive for October 2010

要听他连续说多少次“我爱你”才能相信

要听他连续说多少次“我爱你”才能相信

——怎样判断一枚硬币是不是公平的?

(有些公式神马的看不到,见PDF版本)

PDF Version Here: 要听他连续说多少次我爱你

抛硬币是生活中最常被拿来举例子的Bernoulli(贝努力)试验。这也是一个最简单的概率事件,只有两个选项,正面或者反面(假设不存在立着的情况)。这个例子也可以推广到很多二分变量(binary variables)的取值概率问题。支持或者反对,使用或者不用等等。

一枚硬币如果是公平的话,每次抛硬币得到正反面的机会各等于二分之一。现在我们假定说抛硬币得到正面的概率是p,得到反面的概率是q=(1-p)。

现在我们有一枚硬币,抛了100次,得到了55次正面。那么,我们知道,在这100次里面,我们得到正面的概率是55/100=.55。但我们都抛了100次了,知道了p=.55,又怎么样呢?我们想知道的是,下次以及每次抛这个硬币,得到正面的概率p的估计值p-hat是多少。

这么想的话,上面所说的p=.55是指我们抛了的100次我们知道的抛硬币得到正面的概率是.55,也就是我们的样本(sample)里的p=.55。我们想知道的是通过我们的样本推测到总体(population)的抛这枚硬币得正面的估计值p-hat是多少呢?

从样本统计量p推算总体估计值p-hat就要考虑置信区间(Confidence Interval)。下面这枚公式就能推算,从我们这个抛了100次的样本,估计抛这枚硬币得正面的概率是:

(公式一)

这里的n就是我们抛的次数,也就是样本量(sample size)。这里的是一个统计量,根据不同的置信度(Confidence Level, 如90%,95%,99%等)有不同的固定的取值。这个是另外一个故事了。有兴趣的同学可以去维基百科看“Confidence Interval(置信区间)”这个词条http://en.wikipedia.org/wiki/Confidence_interval。当然了,这个取值还隐藏了另外一个关于正态分布的假设,那也是另一个故事了。

如果我们采用95%的置信度,对应的就等于1.96。我们这100次硬币来估算这枚硬币被抛得正面的概率就是一个区间(.452, .648)。也就是说,如果我们再抛100次硬币,我们有95%的机会得到正面的次数在45次到65次之间。

好吧好吧。我承认我有些罗嗦了。上面这些其实不是我想说的重点。我想说的重点是,我们要连续抛多少次正面,在95%的置信度上,才有根据不否定硬币是不公平的(有点绕,嘿嘿)?

下面就是一个假设检验的问题了。假设检验的一般就得提出一个零假设(Null Hypothesis, H0)和一个备择假设(Alternative Hypothesis,H1)。

我们这里的零假设就是硬币是公平的,也就是每次抛硬币得到正面的概率是1/2。

H0:p-hat=.5

我们这里的备择假设就是硬币是不公平的,也就是每次抛硬币得到正面的概率不是1/2。

H1:p-hat<>.5

我们说的每次抛多少次正面才够的意思是,我们已经确定了p1=1,我们想知道的是n的最小值。我们的问题可以等价地转换成我们估算的p-hat1和假定硬币公平的p-hat2之间的差,怎么就等于0。

这里,H0可以等价地转换为p-hat1-p-hat2=0。

H1可以等价地转换为p-hat1-p-hat2<>0。

怎么算两个比例之差p1-p2的区间估计呢?我们要用到下面这个公式:

(公式二)

这里,我们的p1=1,p2=.5是知道的,在95%的置信度条件下=1.96,代入公式二,就可以得到区间是:

我们的零假设也就转换成:

0必须落在这个区间内。也就是:

通过计算,也就说是n<=3.92的时候,零假设才可能成立。只要n>3.92的时候,我们就可以拒绝零假设,然后在置信度95%的条件下,认为这枚倒霉的硬币是不公平的。

哈哈哈哈。

最后,再让我来说一下so what的问题。如果我们假定你的男人跟你说“我爱你”和说“我不爱你”是等概率事件,机会各一半一半。那么,如果你的男人连续四次跟你说“我爱你”。你选择相信他这句话。你应该有95%的把握。哈哈。可是,你会觉得你男人说“我爱你”和说“我不爱你”不是等概率事件。好吧。那你觉得概率多大你才满意?p=.999999999? 好吧,你还说,置信度95%不够,要99%才差不多。我告诉你,在99%的置信度条件下=2.56。这样的话,你能算出,你男人要连续说多少次“我爱你”,你才能相信他(说“我爱你”不是偶然的)了吧???