您的位置:
首页 > 足球 > 足球新闻

编辑推荐结合 PageRank 算法预测欧冠冠军,四强皇马、马竞、尤文、摩纳哥谁能夺冠?

结合著名的算法,我们可以计算出今年谁将夺得欧冠冠军……

1.为什么算法适合足球?

截至我撰写本文时,本赛季欧冠联赛刚刚结束四分之一决赛:

客场欧冠进球算胜负吗_欧冠客场进球什么意思_欧冠客场进球算2个

别想太多,上面的图片只是按字母顺序排列的

如上图所示,排名前四的球队分别是皇家马德里、马德里竞技、尤文图斯、摩纳哥。

能打进四强的球队显然都不是好对付的。对于谁能夺冠,大家都给出了自己的猜测:有的认为上届冠军皇马实力强劲,有望卫冕;有的认为马竞在过去三年中已经两次闯入决赛,是时候打破魔咒夺冠了;尤文图斯这几年展现出的实力有目共睹,今年甚至战胜过巴萨;当然还有摩纳哥,虽然看起来无法和以上三家相比,但黑马总是令人畏惧的,谁知道会不会出现大冷门呢?

菠菜公司:其实我更看好尤文图斯……

你可能以为,看这四支球队的联赛成绩就能分出高下。但事情不一定那么简单。欧冠联赛往往被认为代表着足球竞技的最高水平,参赛球队均为欧洲各大联赛的顶尖球队。强队之间的对话,究竟谁会占上风,并不能单纯以联赛成绩来判断。键盘侠的世界里,一直有一个观念(也可能是迷信):联赛靠欺凌(尽量打败弱队拿分,毕竟打谁都得3分),欧冠靠死守(对阵强队,即便不一定占据绝对优势,也不能轻易被打垮)。此外,由于打法、喜好,甚至专注度都不同,每支球队擅长对付的对手也不同。因此,有的球队被誉为劫富济贫、攻强击强的专家,而有的球队则被嘲讽为主场霸凌者……

我一开始是拒绝这个说法的,直到2013-14赛季的结果颠覆了我的观念。13/14赛季,皇马是欧冠冠军,他们击败了众多强敌杀入决赛,然后在决赛中战胜马竞,夺得了队史第十个冠军;然而在同赛季的西甲联赛中,皇马的表现实在不太好,最后只排名第三,而西甲冠军则是马竞。

这或许是一个典型的例子,马竞一个赛季连胜,却在最后时刻败给了皇马。那么,马竞是不是传说中欺负弱敌的能手,而皇马却擅长战胜强敌呢?

于是我想到了著名的网页排名算法,这是一种用来识别网页重要性的方法。比如我搜索了关键词“西甲”,当然,全世界有几万个网页包含这两个词,应该先推荐哪一个给我呢?算法的思路是,如果我们要评估网页A的重要性,就需要看有多少个网页(n)引用了网页A;一般来说,n越大,这n个网页的重要性越高,A就越重要。也就是说欧冠客场进球算2个,网页A的重要性是由所有引用它的网页的重要性决定的。由于网页数量众多,经过几次迭代链接,我们就可以得到一组收敛的分数,也就是所有网页的数值。

这个道理放在足球比赛中似乎很适用,我们可以认为一支球队的实力是由所有输给它的球队的实力决定的,当其他球队输给它一次,就相当于给它加了血。一支球队的实力(),就是通过递归计算所有输给它的球队的重要性得到的。

简而言之,该团队:

1. 不仅赢得更多,实力也更强——这是大联盟的积分标准

2.而且打强队赢的次数越多越好,这就是综合实力

好的,这就是团队算法的理论基础。

2. 2013/14 赛季实验

因为刚刚我们讲到了13/14赛季西甲联赛的奇怪现象,所以我们就以这个赛季为例吧,由于条件有限,我用了R来实现这个过程,但其实底层语言可能要方便很多。

感谢数据时代(或者博彩业),现在要找到比赛数据要容易得多。如果你不是痴迷于斯洛文尼亚三级联赛,你应该可以在网上找到。我的数据来源是,它可以提供过去 19 年欧洲 22 场联赛的比赛结果,包括半场结果、全场结果、角球、点球等(看到这个,你应该知道它服务于哪个行业)。

欧冠客场进球什么意思_欧冠客场进球算2个_客场欧冠进球算胜负吗

一些代码,不难

我先简单说一下思路:

1.处理源数据。

从那个网站得到的比赛数据非常复杂欧冠客场进球算2个,我只保留了两支球队的名字和进球数。同时,我认为一个赛季的表现并不能令人信服:从实力提升到欧冠突破往往需要几个赛季的时间,而很多球队都在其中一个环节失败了。因此,我选择了2010/11赛季到2013/14赛季四个赛季的数据。最理想的一点是,在这四个赛季中,皇马和马竞各自有一位执教3年的主教练,这样可以保证球队发展的连续性。关于主客场比赛,我选择忽略可能出现的差异。

经过简单的处理,数据就变成了“A队-B队-A队进球数-B队进球数”的格式,每场比赛一条记录。

2.将数据转换成有向图。

在网页算法中,如果网页 A 引用了网页 B,那么我们可以假设存在 A->B 关系;说得更形象一点就是“A 将其重要性的一部分贡献给了 B”。我觉得用图的思维方式来思考非常简洁有效,即如果 A 队输给了 B 队,那么我们可以假设存在 A->B 关系,A 将其重要性的一部分贡献给了 B。

这样,我们可以画出一个有向图:

客场欧冠进球算胜负吗_欧冠客场进球什么意思_欧冠客场进球算2个

抱歉有点丑

3. 计算

西甲联赛每个赛季有20支球队,但此前4个赛季共有26支球队参加比赛。计算值如下:

欧冠客场进球算2个_客场欧冠进球算胜负吗_欧冠客场进球什么意思

我很纳闷为什么我的 R 顺序不严格...但很明显,从 4 年的时间来看,巴塞罗那和皇家马德里是西甲的两大巨头,而马德里竞技仍然落后。事实上,在那些赛季里,马德里竞技确实处于崛起的过程中,但可能还没有晋升成为老将,所以在关键的决赛中无法与皇家马德里竞争也是正常的。

欧冠客场进球算2个_欧冠客场进球什么意思_客场欧冠进球算胜负吗

这原本是一张图片,可惜无法显示,请注意左下角的两支西超球队

我不想把这个问题搞得太复杂,但这样可能会让一些部分失去应有的复杂性。不过足球中有很多东西是无法量化的。这里我只是提出一个可能的想法,希望对大家有所帮助。

另外,在我漫长的计算过程中,我发现单赛季的联赛排名和实际排名差别非常小,经过几个赛季的实验,冠军位置并没有发生改变。——所以,联赛不能单靠欺凌。

3. 本赛季欧冠赛程预测

上面说了,今年欧冠四强是皇马、马竞、尤文和摩纳哥,不过说实话,摩纳哥真的很尴尬,去年连欧冠小组赛都没进……同样,第二部分的联赛数据,尤文图斯也有很多无法重复的数据。

我考虑过要不要把欧洲五大联赛的数据混合起来,但要知道每个联赛的中下游球队之间根本就没有交手的机会,上游球队每年可能只有两次交手机会。如此巨大的数据差异,很难得到客观的结果。此时,我的想法是使用欧冠联赛最近四年(2013/14 - 2016/17 四分之一决赛)的数据,尽量保证参赛节点的稳定性。

为了偷懒,我觉得可以先试试皇马、马竞和尤文的直接对战数据,虽然绝对数量少得可怜,但他们四个赛季交手10次(不算今年没来得及碰面的那场),这在欧洲球队中已经是非常可观的数字了。结果如下:

注:结果以90分钟计算。

好吧...三支球队差距不大,但皇马略胜一筹。不过这样说似乎有些敷衍了事,我们来试试从2013-14赛季初到现在的欧冠全数据吧。过程我就不细说了,结果如下(还是没能正确排序,悲哀):

客场欧冠进球算胜负吗_欧冠客场进球什么意思_欧冠客场进球算2个

黑马摩纳哥在这个算法中当然处于劣势,我们先不管它,直接给出答案:皇马>马竞>尤文图斯。

我认为我们也可以尝试单独淘汰赛的结果,参赛队伍数量减少到29支:

客场欧冠进球算胜负吗_欧冠客场进球算2个_欧冠客场进球什么意思

(如图,当选择皇马时,会高亮显示为其贡献过经验值的球队)

我们先来看看最大的几支球队:皇马、拜仁、马竞、巴萨、尤文……西甲这几年确实很强,具体比分如下:

欧冠客场进球算2个_欧冠客场进球什么意思_客场欧冠进球算胜负吗

我们关注的三支球队的排名顺序依然是皇马>马竞>尤文图斯。如此看来,淘汰赛小有建树的皇马夺冠的几率还是比较大的。

不过,和任何算法一样,这个算法也有不完美之处。比如……咳咳,请大家看看德甲的另外两支球队,沃尔夫斯堡的得分比多特蒙德高,但谁会想到前者比后者更有竞争力呢?回想起来,其实是因为这支球队在过去几年只参加过一场欧冠淘汰赛,而且意外战胜过皇马一次……所以得分一下子就上去了。

因此,请享受游戏的乐趣,并理解算法的精神。毕竟欧冠客场进球算2个,如果算法可以预测比赛结果,那为什么还要踢足球呢?足球的魅力就在于它的不确定性。

其实足球场上还有那么多的潜在(挑战),比如:梅西和C罗,谁是霸道小王子,谁是硬仗高手?英超真的如他们所言,联赛内部竞争太激烈,欧战实力不足吗?阿森纳为什么能挤进欧冠排名前十,却连淘汰赛都打不过塞维利亚?……感觉马上就要收到太阳报的offer了,得先去办签证了。

尖端:

在研究过程中对我帮助最大的 R 包是:、dplyr 和,最后一个简直就是绘制交互式图形的神奇工具。

关于我们

我们是毕马威专业数据挖掘团队,在微信公众号()每周六晚八点准时推送一篇原创文章,文章均由拥有丰富项目经验的博士和资深咨询师精心编写,内容也是理论应用与实际业务经验的结合。欢迎关注我们的微信公众号,关注数据挖掘原创文章。如果您想联系我们,也可以直接在公众号中发送您想说的话与我们进行交流。

本文标签: [编辑推荐结合PageRank算法预测欧冠冠军][四强皇马、马竞、尤文、摩纳哥谁能夺冠?]

顶部

顶部