Posts Tagged ‘统计’

Elo 排名系统

Sunday, November 15th, 2009

看到这篇文章中提到的世界足坛埃罗排名系统(The World Football Elo Rating System),尝试研究了一下这个足球排名系统:

Elo Rating System 根据评价值进行排名,评价值的计算方式如下:

Rn = Ro + K × (W – We)

Rn 表示新的评价值

Ro 表示原来的评价值

K 表示比赛的权重,如:
世界杯决赛圈比赛,K取60;
洲级杯赛决赛圈比赛取50;
世界杯和洲级杯赛外围赛取40;
其他锦标赛取30;
友谊赛取20。
根据净胜球数,K 值还要进行调整,增加的比例为3/4 + (N-3)/8,其中 N 为净胜球数。
如世界杯决赛圈比赛净胜3球,K=60 × (1 + 3/4 + (3-3)/8) = 105

W 表示比赛的结果,胜取1,平取0.5,负取0

We 表示预期结果,计算公式为:
We = 1 / (10^(-dr/400) + 1)

dr 表示双方排位的差距

如果不嫌复杂的话,完整的公式可以写作:
Rn = Ro + K × (W – 1 / (10^(-dr/400) + 1))

以今天凌晨法国队客场与爱尔兰的世界杯外围赛附加赛为例,假设爱尔兰队以3:1获胜:
法国队目前的评价值是1856,排名第10;
爱尔兰队目前的评价值是1742,排名第27;

世界杯外围赛附加赛净胜2球的权重分 K = 40 × (1 + 3/4 + (2-3)/8) = 65

法国队的新评价值计算如下:
Rn = 1856 + 65 × (0 – 1 / (10^(-17/400) +1)) = 1822

爱尔兰队的新评价值计算如下:
Rn = 1742 + 65 × (1 – 1 / (10^(-17/400) +1)) = 1773

假如其他球队今天没有比赛,则爱尔兰队可以升至第18位,而法国队会跌至第14。

Elo 排名系统的排名看上去未必就比 FIFA 世界排名靠谱,比如现在这支中国队竟然排名可以高过塞内加尔、南非、乌兹别克斯坦、伊拉克,实在是没有天理。

为什么住得远反而到得早?

Monday, March 24th, 2008

身为一个通常都不会迟到的好人,常常会奇怪,为什么无论是上学还是上班的时候,总是住家比较远(比如在下)的人反而到的很早,步行几分钟就可以赶到的人却往往是刚好踩点呢?

为此,我想用统计分析的方法找到其中的原因。

首先第一步的工作,就是:

伪!造!数!据! 囧 :023:

2个对象合计1200次的实地统计要1年多才可以完成啊,为了证明我一点也不宅,所以可耻地用伪造的正态分布曲线代替了。这样读者也可以看得轻松一点不是吗?(读者:喂!我们是要看没有操守的你被教授持刀追杀啦!

以下就是伪造的到达时间统计表,其中时间差表示到达时间和准点时间的差值,右侧两列则分别是住处离目的地距离较远和距离较近的到达次数统计值。
假设条件是,路上的耽搁使得到达时间分布扩散,但仍基本符合正态分布规律。距离越远的,分布扩散越明显

Photobucket

然后是相对应的曲线图。

Photobucket

现在假设迟到的时间点设置在+3之前(如红线所示),则距离较近者会有14+2=16次迟到(灰色部分),而不幸的距离较远者会有48+35+24+15+8+4+2+1+1=138次迟到。23%的迟到率,这显然也会被教授或老板拿着刀追砍。
距离较远者要达到16次以下的迟到次数,迟到时间点应定在+7之前才较为合适,即推迟4分钟。而现在,他必须为这缩减的4分钟付出代价,也就是比先前整体早到4分钟,才能达到+3时间点的要求。

于是经过调整之后的到达时间统计表就成了如下所示,两个人的迟到次数终于扯平了:

Photobucket

相应的曲线图变成了这样,距离较远者的统计曲线左移了4个横轴单位:

Photobucket

从第2个曲线图中可以明显的看到,距离较远者不但早到的次数远远超出,而且提早时间的最大值也从之前的7分钟变为了11分钟——即平移的时间,如果你有兴趣,还可以算一算距离较近者发现对方比自己到得早的概率有何变化。

综上所述,假如距离越远,在路上耽搁时间的事件发生几率越高,则距离较远者必须比原始的方案越提早到达,才能保证迟到的可能性与距离较近者差不多。当然,这一结论完全是建立在一厢情愿的假设和无耻的伪造数据上的,是不是符合事实,就要等人实际验证了。何况有的人对迟到和被追杀完全不在意,又或者在遭遇麻烦时有超强的时间掌控能力

OMI

Thursday, November 8th, 2007

OMI=Open Mind Index,由 Musickum 根据 Last.Fm 提供的数据进行统计分析得出的“音乐开放指数”,基本上听歌的风格越杂,该指数就会越高。

我的指数只有126…

而目前的平均指数是94.48:

中国大陆的用户 OMI 平均指数是103.32,台湾是91.96,香港则是87.39。

更多统计结果见我的统计页面