预测世界杯新工具——大数据
最近,有报道称,一些公司利用大数据成功地预测了世界杯8分之1决赛的结果。不少人提出疑惑:若大数据预测世界杯靠谱,那谁会乐翻天?
一、有公司声称场场预测准确
近日,对于利用大数据预测世界杯的报道屡见不鲜。 有公司声称他们利用大数据预测世界杯的结果准确率貌似很高。
例如谷歌。其产品营销经理本杰明·贝托谢姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前为止,谷歌的云计算平台已成功预测了世界杯16强比赛每场比赛的胜利者。注意:是16强(即8分之1决赛)比赛胜利者。
谷歌称,他们使用了来自Opta Sports的数据,评估了每个职业足球联盟过去多个赛季的情况,以及世界杯小组赛期间的统计数据。这一系统还使用了由BigQuery工程师乔丹·提加尼(Jordan Tigani)开发的实力排行榜系统,同时考虑了观众热情程度数据,以计算主队优势。
不过,谷歌也承认,他们并不是唯一做出完美预测的公司,而世界杯16强比赛中也没有冷门出现。“没有冷门出现”这很关键。当然,如果实力均衡,也不算什么冷门,那要预测准确也不容易。
其实,刚看了下百度的8分之1决赛的预测,也全部命中。这说明,谷歌还真不是谦虚。因为想想:若大数据预测世界杯之类的球赛结果非常准确的话,那么谁会乐翻天?至少体彩参与者会!
二、说全都能预测准确不会靠谱
问题,对于预测,无论用不用大数据,多数情况下都不能保证百分之百的准确度。如果都能准确预测,那么体彩、股票、基金甚至战争,都可能有人大赚特赚。
即使是利用大数据准确预测的典型案例中,也难觅百分之百准确率的。例如,微软纽约研究院经济学家 David Rothschild 通过大数据分析,成功预测了2014年奥斯卡24项奖项中的21项,还有3项没预测对。
同样是他,成功预测了 2013 年奥斯卡的获奖名单,他以 24 个中预测对了 19个。在 2012 年美国总统大选中,David Rothschild 正确预测了 51 个选区中 50 个地区的选举结果,也还有1个没预测对。
所以,不想妄想利用大数据就能做到观测百发百中。然而,预测跑的是概率。利用大数据预测比不利用大数据预测准确度要高。只是,对于足球而言,要看是否有其他偶然因素,例如伤病、运气及误判等因素。
三、说预测完全不靠谱也不靠谱
这样说来,大数据预测世界杯之类的比赛结果还是很有价值的。有些大数据的分析依赖于海量的数据,预测的结果可能也会相对更精准,甚至超出你的预测结果。至少,大数据预测世界杯要比大嘴乌鸦贝利、章鱼保罗、熊猫宝宝及乌贼刘要靠谱得多。
据了解,除了谷歌及百度在预测世界杯,还有高盛、德银及科隆体育等机构,甚至还有科学家霍金。
霍金的许多关于足球的预测还挺有数据感,例如:提到点球大战,霍金认为助跑必须不少于三步,如果速度上不去,进球几率只有58%。瞄准上角的点球有84%的命中率,金发和秃头的球员射中的概率达到更高的84%,前锋的进球概率超过80%,中场与后卫递减。
说到这里,我们不妨看看谷歌及百度对于4分之1决赛结果的预测:
谷歌预测的结果是——巴西对哥伦比亚:巴西胜概率为71%;法国对德国:法国胜概率为69%;荷兰对哥斯达黎加:荷兰胜概率为68%;阿根廷对比利时:阿根廷胜概率为81%。 百度预测的结果是——巴西对哥伦比亚:巴西胜概率为71%;法国对德国:德国胜概率为58%;荷兰对哥斯达黎加:荷兰胜概率为82%;阿根廷对比利时:阿根廷胜概率为63%。
好吧,这样PK一下,谷歌与百度在法国对德国比赛的结果预测是相反的。它们二者至少有一方4分之1决赛预测准确度将最多是75%。
不过,所有的预测不能单独看8分之1决赛或4分之1决赛的准确度,甚至不能仅看这一次世界杯的准确度,要在更大范围里观察预测结果。
其实,最令人吃惊的是,霍金曾经预测过:“世界将在两百年之后灭亡”,这个预测结果可能比任何一场比赛的结果要更让你揪心吧!
作者:陈永东,中国十大IT博主,新媒体研究者
原创文章,作者:王琪,如若转载,请注明出处:https://www.prnasia.com/blog/archives/8885