
大数据火热,大数据可以改变职业体育。电影《点球成金》告诉我们,数据科学家能解决球队老板用钱解决不了的问题:打造一支冠军球队。“这并不奇怪”,哈佛大学定量社会科学研究院的主任Gary King说,“如果你总结一下那些数据分析能够起到巨大作用的行业的特点,你就会发现,职业体育行业基本具备了这些特点,这也就是为什么数据分析在职业体育中具有如此重要的作用的原因。”文中所说职业体育的特点就是可定量,而大数据则是通过定量的数据比对,来找到解决问题的方法。这一点对于世界第一运动的足球尤为重要,先来说说马云要来搅局的中超。
大数据是有能力帮助提升一个联赛的水平。2004年创立的中超,只是模仿英超取个名字,可是水平不怎么样,但差在什么地方,要从哪些方面来看提升,好像没有太明确的方向。当方向不确定的时候,出现笑话也就再所难免,我们在追求足球风格时,曾经提出了一个莫须有的“欧洲拉丁派”,甚至提出要锻炼 “叉腰肌”,而大数据时代则大不同了。
以前,关于足球的数据统计只有角球、任意球、红黄牌和射门次数,大数据时代,联赛水平的体现有了许多直观的参数,如跑动距离、有效比赛时间、移动轨迹、控球时间、传球次数等等。以跑动距离、有效比赛时间作比即可一分高下,2010年国际足联的相关统计,职业足球运动员全场跑动距离平均为10000米,中超球员为7000米左右;有效比赛时间,2011年中超的实际有效时间为场均49分03秒,韩国联赛为56分09秒,欧冠联赛场均比赛有效时间为62分39秒。
再从大数据的角度来看,2012年和2013年的中超平均跑动距离都是超过万米;有效时间,2012年超过50分钟,2014年的目标是60分钟,中超的水平确实有了提升,要不也不会有场均1.8万人的现场观众,好歹也是亚洲第一,世界第十。
一个联赛的水平,不光体现在竞技水平上,还会体现在对媒体、对球迷的服务上,从这个方面再看大数据对已经高度职业化的NBA的帮助。NBA官方网站之前有内部的统计工具,只有一些授权的媒体可以使用做一些高级的深入数据分析,2012年,NBA与数据分析解决方案公司合作,NBA从得分、进攻、防守、做球等几大类统计了多达90多项技术指标,数据公司帮助处理NBA高达4500万亿条分割的统计数据。
累不累的训练
联赛水平的根基在于日常训练,这一点大家应该没有什么疑义。但这一切没有在大数据时,训练更多地是从精神层面来要求,比如“女排精神”“三从一大”(从难、从严、从实战出发,大运动量),这种口号好提但是具体怎么做却无从下手。
当年流行于中国的12分钟体测,之前一直说是提高运动员的体能,到最后足协官员也承认“无氧耐力法测试的是一种精神力量”。
正是由于训练中长期缺乏数据,尤其是大数据的指导,才会只沦落到精神层面为主导。现在训练中应用大数据的例子,在足球发达国家例子已经很多了,而这两年中超的球队也在注重训练中大数据的使用,广州恒大、山东鲁能、江苏舜天等等。
这套高科技系统对队员们在训练中的心率、速度,距离,加速度和减速度等指标进行记录、分析和监控,监控队员的训练量是否达到或超过相应的指标,同时,也能预防队员在训练中出现的伤病。通过科学的训练方法,对队员们训练提高和预防伤病起到很大的作用。
我们用GPS和心率测量仪来监测每个球员的状态。从体能的角度来说,最显著的数据是冲刺数量、冲刺距离和每个球员投入的高强度运动次数。我们这样监测一整个赛季下来,就能知道一个球员目前状态是否疲劳,以及他需要多久的休息时间。
说完了团体运动的足球,再来看看更侧重于个人的速度滑冰,虽然它不是那么的职业化,但是这种更强调个人技巧的运动,大数据对其的作用更大。
之后,人们从数据方面分析,发现韩国队的拐弯时候,速度比其他国家的要快。通过这个大数据的分析,再结合慢镜头,人们发现了韩国队的先进技术:在过弯时,通过身体重点心转移,步点的转换,达到一个不减速的效果,甚至还可以加速。
大数据已经很大程度上影响到职业体育的水平,另一方面,对于职业体育来说,所从事的运动不同对于大数据有不同的应用需求,例如,足球和篮球所遇到的大数据问题是不一样的,团体与个人的运动又会是大不同。海量数据处理的复杂性,对数据中心的计算能力提出了挑战,英特尔就正利用自己在计算领域长久的积累,从支撑计算的芯片产品,到实现分析的解决方案,在职业体育上发挥着不可替代的作用。 好教练难求,但是经过计算和处理的多维度的数据却是可以普及和借鉴的。大数据改变职业体育,并赋予职业体育全新的商业价值,并非一件遥不可及的事。
当然大数据也有其局限性,埃弗顿主教练马丁内斯和他的球探里弗斯和布朗都认为“光凭数据就能买进某个球员”这种想法是十分荒谬的,博尔顿的分析研究总监布莱恩·普莱斯迪奇甚至举出了一个反例:自从他们的守门员开始研究对方的点球手的数据以后,他的扑点球效率反而降低了,过去两个赛季只有9%的成功率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11