足球,一直被认为是数据分析最抵触的运动。
几十年来,对于足球数据,所有人都公认的,最有用的一项数据,就是最终的比分。
除此之外,几乎毫无用处。
哪怕是在点球成金的方法论风靡整个北美,数据分析的飓风迅速席卷世界足坛时,依旧有非常多的人持有类似的观点。
因为足球参与的人数最多,比赛内容最为复杂,根本难以被量化。
或者说,往往只能量化其中的一小部分。
在圈子里,关于足球数据的争议,往往会引出一个很有趣的问题。
如何评估足球运动员的技术?
这看起来好像非常简单。
各种身体数据,各种比赛指标,各种各样的高阶数据和模型……
再想想,如何评估足球运动员的技术?
就拿最基础的盘带和传球来说。
盘带能力能不能被量化成数据?
在全世界范围内,没有哪一家数据公司在这方面能拿出有说服力的成果。
哪怕是最专业的数据公司,也只能告诉你,这名球员过了几次人,成功率多少,几次尝试,失败原因是什么……
可哪怕是再详细的现场数据,都无法准确地评估出,这名球员的带球速度、突破对手的次数,变速变向频率……
最重要的是,他的下一次,下下次突破,能成功吗?
因为它每一次都是不一样的!
正如王硕之前所说的,同样的完全复刻的一次爆趟,随时可以是真的,随时也可以是假的。
为什么?
可能就因为防守球员的双脚站位稍稍偏差了几公分。
或者是球员的身体姿态在肉眼难辨的情况下稍稍偏一点点。
这放大到一座足球场里,怎么量化?
优秀的突破手,面对不同的对手,会采取不同的突破策略。
甚至会根据自身和对手的体能消耗程度,采取不同的策略。
怎么量化?
全世界所有的数据分析公司都给出了答案:没办法!
盘带和突破无法被量化,那如何评估一名足球运动员的技术?
就算评估出来了,全面吗?准确吗?
从90年代到现在,数据一直都在用,也一直都是毁誉参半。
它既会让弗格森错误地盘掉斯塔姆,也帮助了很多球队精准找到了引援目标。
数据分析的玩法也在变得越来越高级。
而且每年都会有无数的创业者,前赴后继地投入这个行业。
他们会根据自身和团队的专业能力,挖掘出市场的需求,专精于某一个领域。
这就导致,当下的足球数据公司要么就是OPTA这种大而全,但不够专精,要么就是一些业务范围很小,但钻研得很深的小公司。
王硕返回到伦敦,回到科尔尼训练基地后,听到的第一件事情就是来自萨德·福塞特。
阿森纳准备收购一家叫做StatDNA,总部位于美国的数据分析公司。
这家公司有什么特别之处呢?
他们成立于2009年,创始人叫做杰森·罗森菲尔德,之前从未在足球行业里面工作过。
95到09年在麦肯锡工作,是麦肯锡内部智库,麦肯锡全球研究院的重要成员。
期间还自己创办了一家电子商务企业,主要运营在墨西哥和中国。
还有一家公益性企业数字鸿沟数据DDD公司,目前在柬埔寨和老挝的运营中心,拥有总计超过1千个社会弱势群体雇员。
09年出来创办了这家StatDNA数据公司。
这家数据公司最具革命性的就是,他们建立起了一套专门用来分析传球的模型。
背靠着DDD公司在柬埔寨和老挝的运营中心,他们通过最原始的逐场分析,来获取比赛的数据,目前只提供巴西甲级联赛、意甲和英超三个联赛的业务。
他们在2011年得出了一个结论:在创造进球方面,完成难度传球,远比控球更加重要。
过去这一年,他们逐场分析了10/11赛季英超123场比赛样本,收集了12万个观测点,428名球员的传球数据。
而且这份数据非常细致,远远超过普通的数据统计。
例如,他们会对每一次助攻的分析细致到,传球是否可以让前锋,不需要打乱步点,就能够直接完成射门?
传球的落点是否在接应者的惯用脚上、守门员的站位是否合理……
而在数据模型里,他们把一脚普通的传球,解构成各种数据。
例如传球压力,他们会根据最近的防守球员的位置与传球者的距离,以及双方的行为来判定压力等级。
例如最高档的压力就是防守球员主动抢球,并跟传球者发生了身体对抗。
往下就是防守球员距离持球者5码(4.572米)之内。
再往下就是10码之内,最后就是没有压力的宽松环境。
他们还会根据传球线路,如防守球员在球与球门之间的站位位置,来给传球赋上各种分值。
例如最高一档就是直传球给下一个持球者单刀面对球门。
总而言之,他们就是通过各种各样的场景、压力、位置、线路,甚至还包括传球所触发的下一步动态,给一脚传球进行各种赋分。
最后得出一个传球的分值。
王硕参加了StatDNA公司首席执行官杰森·罗森菲尔德到阿森纳科尔尼训练基地的业务洽谈会,了解了这家专门研究传球的数据分析公司的业务内容。
叹为观止!
但有点眼熟。
因为当年他还在多特蒙德的时候,沈青禾不就是拿着一套类似的数据模型去研究他的射门,进而说服多特蒙德跟他签下一份重磅合同?
只是当时的那个模型还很粗糙。
可现在,人家这个是最专业的。
但王硕也感到很讶异。
……
“没想到,数据分析行业怎么看都是高大上,高精尖的技术型工种,怎么就硬生生被干成了劳动力密集型行业了?”
开完会,王硕、温格、帕特·莱斯、萨德·福塞特等人自己开小会。
王硕的一句话,让所有人尽皆失笑了起来。
谁说不是呢?
按照杰森·罗森菲尔德的说法,他们之所以能够逐场分析比赛,拿到详细的比赛数据,依靠的就是在柬埔寨和老挝的运营中心,足足有过千人呢。
这不就是妥妥的劳动力密集型行业吗?
“王,之前我就跟你说过,我们干的都是累死累活的辛苦钱,你偏不信,现在信了吧?”
阿森纳的比赛分析师本·克纳普冲着王硕就是一通抱怨。
这位戴着眼镜的斯文哥是87年的,现在才25岁,从09年就开始在阿森纳工作了。
“其实,大家对数据分析还是有很大的误解,或者说,不能叫误解。”
本·克纳普主动解释了一下缘由。
“你们别看OPTA数据公司宣传得多么高大上,说得他们好像多牛逼,什么光学追踪技术,什么通过多角度摄像机追踪球员和足球的运动轨迹……”
“但实际上,他们依旧招聘了一大堆经过专业培训的数据采集员,人工实时标注依旧是他们数据可靠性的基础。”
王硕这下是真的相信了。
OPTA最早的数据就是来自于人工标注。
简单点说就是,安排数据采集员坐在看台上,射一次门就标注一下。
所以最早的数据都是一些比较简单的,容易被采集的数据。
后来慢慢改进标注的工具、软件之类的,开始采集到更多更复杂的数据。
最简单的一点,贝克汉姆当年的那个跑动纪录为什么被那么多人质疑?
说到底,就是人工标注的问题。
人工是如何确定球员的跑动距离的?
注意看比赛场地的草皮,颜色是不一样的,他们就会通过这种方式,大概推测出一个跑动数据出来。
而那场比赛就只有贝克汉姆一个人的跑动数据。
那所谓的光学追踪就可靠吗?
想想都知道,目前来说,也不是很靠谱。
所以,OPTA的数据现在基本都是两条腿走路,甚至依旧高度依赖于人工实时标注。
区别就在于人工标注所使用的工具。
所以,说是劳动力密集型,或许有些夸张,但还真没说错。
“王,从新赛季开始,杰森·罗森菲尔德的团队会开始常驻科尔尼,同时也是跟踪我们的比赛,到时候你要尽量配合一下他们的工作。”
温格叮嘱道。
这也是王硕作为球队队长的工作范围。
“加齐迪斯跟我说,克伦克非常推崇比利·比恩的数据驱动理念,坚信数据可以改变足球,而俱乐部这次收购StatDNA公司的目的,就是要组建我们的专属数据库。”
“不仅仅是现有的球员,还有比赛和对手的分析,更有全球范围内青少年的数据库,便于我们日后选材和引援。”
王硕当然没什么意见,他只需要配合一下就好了。
“对了,给你看看这个。”
说着,温格从沙发上站起来,走到了办公桌前,从一叠文件当中抽出了其中一份,走过来递给了王硕。
“这是StatDNA公司对你的分析报告。”
王硕饶有兴趣地打开一看,别说,还真就眼前一亮。
进球数,英超第一!
助攻数,英超第一!
场均传球次数,英超同位置第一!
场均关键性传球,英超第一!
创造绝佳机会能力,英超第一!
场均射门,英超第一!
场均射正,英超第一!
射正率,英超第一!
进球率,英超第一!
把握机会能力,英超第一!
传球成功率,英超同位置第一!
场均过人,英超第一!
场均被侵犯次数,英超第一!
赛季评分,英超第一!
这还只是目录,接下来还有非常详细的,逐项细致分析。
看到这份报告的时候,王硕是真的很想给对方加一根鸡腿。
还有就是……
“教授,拿这个过去,能谈一谈涨薪的事情吗?”王硕开玩笑地问。
众人也都一阵莞尔失笑。
这要是被加齐迪斯听到,估计又要破防了!
而说到涨薪,温格跟王硕透露了一条消息。
亚历山大·宋的续约合同基本谈妥了。
具体多少,温格没有透露,只说会比阿扎尔低一些。
那大概就是在15万英镑的周薪左右。
当然,这里说的是税后。
从目前来看,阿森纳的续约工作进行得有条不紊,问题不大。
枪手的薪水支出在目前英超球队里面,大概是输给曼城、切尔西和曼联,但要比利物浦和托特纳姆热刺高一些。
但整体依旧还是控制得不错。
2011/12赛季,阿森纳的薪水支出大概是1.45亿英镑,这是包含球员、教练和雇员的薪水支出,包括纳税。
到12/13赛季,大概是涨到1.65亿英镑,也就是涨了差不多2千万英镑。
这样可以控制在球队营收的55%左右,整体还是比较健康的。
最大头的就是王硕。
沈青禾之前就跟王硕提过,阿森纳接下来必须要尽快提升整体营收,否则的话,再过两年,等到王硕的合同来到了续约节点,枪手怕是拿不出钱来续约了。
毕竟现在王硕的税后是1500万英镑,税前的话,就是3千万英镑。
当然,王硕带来的成绩和赞助费收入提升,阿森纳肯定是不会亏的。
问题是,下一份合同给开多少薪水?
当然,这些都是后话了。
英超新赛季的赛程已经出炉了。
温格和教练组需要根据这份赛程,制定整个赛季的比赛攻略。
对于阿森纳来说,整个英超赛程里,有两个非常关键的时间节点。
一个是9月份。
在9月,除了欧冠小组赛开战之外,阿森纳要在第3轮客场踢利物浦,第4轮主场踢南安普敦,第5轮客场踢曼城,第6轮主场踢切尔西。
第四轮和第五轮之间,还有欧冠小组赛,第6轮之后,也是欧冠小组赛。
而第5轮和第6轮之间,就是英格兰的联赛杯。
这就对枪手提出了一个非常高的要求。
还有一个魔鬼赛程是在2013年的1月。
在经历圣诞节赛程后,进入1月份,阿森纳将先后踢曼城、切尔西和利物浦。
连续3轮都是苦战。
而1月是英格兰国内杯赛的重要时间点。
如果阿森纳能在杯赛中坚持到1月,那到时候肯定也是连场苦战。
萨德·福塞特来到球队已经有1年时间了。
过去这一年,阿森纳的整个训练都发生了巨大的变化。
而且经过了过去一个赛季的经验,萨德·福塞特对阿森纳,对英超也有了全新的认识。
这次,他也是要改进上赛季所犯下的种种失误,出现的各种问题。
萨德·福塞特更是拍胸脯保证,一定为球队的体能保驾护航。
顺带一提的是,今年夏季,阿森纳的后勤保障团队也出现了一个比较重大的改变。
在萨德·福塞特的推动下,新设了一个医疗主管的职位。
顾名思义,医疗主管就是掌管球队医疗中心、康复理疗等方面工作的主管级雇员。
安迪·罗尔斯,今年才38岁,但已经有着很丰富的英超经验。
世纪初就在切尔西工作了三年,之后去了沃特福德,09年被西汉姆联挖到了东伦敦。
在铁锤帮的这3年时间里,他的工作成绩得到了一致认可。
上赛季,阿森纳的伤病很多,包括像阿尔特塔、沃尔科特、维尔马伦等人,都经历过伤病,更不用说像威尔希尔、迪亚比等直接赛季就没怎么出场过的案例。
而且,在上赛季,球队那座耗资数百万英镑的全新医疗中心正式投入使用。
在几经挑选后,安迪·罗尔斯来到了科尔尼训练基地,开始全面接掌阿森纳的医疗事务。
……
跟温格等人见完面后,王硕就去健身房,自己加练了一段时间。
之后他又在训练场上自己训练了一阵。
虽说,在休息期间,他依旧还是每天都坚持训练,但毕竟没有正规训练的强度,而且也缺乏比赛的刺激,所以他现在的整个状态都还不够兴奋。
这需要一段时间的调整,还有热身赛的刺激。
训练结束之后,王硕回更衣室美美地洗了个澡,坐了一会儿,顺便进入球神系统。
之前赛季结束时,他连续破了多项纪录,得到了一笔丰厚的奖励。
现在总共有537点被动值。
他决定投入500点,再升级一项被动技能,解锁一项领域技能。
这能让他对接下来的新赛季更有信心。
而且,他已经选好了目标。
“是否使用500点被动值,把被动技能【先机】从洲际级提升到世界级?”
王硕毫不犹豫地选择了“是”。
“恭喜你,成功把被动技能【先机】提升到世界级,解锁领域技能:预演者。”
预演者?
“预演者:【先机】晋级世界级后的领域技能。”
“在比赛中,精神高度专注时,通过预判周围对手的动作,在脑海中瞬间构建一个以自身为中心的局部战术沙盘。”
“在这个沙盘中,能同时推演出接下来3-5秒,周围10米内对手和队友的行动路线和技术动作,迅速找到传球和进攻的最优解。”
乖乖!
这是什么概念?
被动技能【先机】提升的是预判能力,料敌先机,针对的是个体。
升级到世界级后,预判能力本身就已经很强了。
例如王硕的单刀,几乎就没有出现过差错。
凭借的就是【先机】的精准预判。
现在更是直接就形成了一个所谓的战术沙盘,通过预判对手的动作,推演未来几秒内会发生的事情。
但最重要的是最后一条,迅速找到传球和进攻的最优解。
这简直牛逼上天了!
王硕第一反应就是【球感】。
【球感】的领域技能是【掌控者】,在周围5米内出现2名以上防守球员时,极大降低被剥夺球权的概率。
如果把【掌控者】和【预演者】放到一起,别人抢不到球,王硕却能够第一时间找到最优解,那岂不是就不怕被包围了?
当然,通过实战,王硕发现,【掌控者】的所谓降低被剥夺球权的概率,还存在一种情况,就是被封堵。
这也不难理解。
如果真不会被剥夺,那对方两个人堵在面前,自己岂不是要穿过去?
这不现实。
所以,破坏【掌控者】的方法还是有的,包括像犯规这一类。
但已经是足够牛逼了。
那要是再结合【预演者】呢?
绝对是一加一大于二的效果。
尤其是【掌控者】的控球,加上【预演者】的最优解,加上【猎杀者】的速度……