前面我们讲了概率、赔率、期望值和 EV。
如果读者已经理解了 EV,就会知道一件事:
足球量化真正关心的不是单场对错,而是长期平均是否合理。
但这里马上会出现一个新问题。
如果一个判断长期是正 EV,为什么短期还会连续不理想?
如果一个方法长期没有优势,为什么短期也可能连续看对?
如果一种分析逻辑长期有效,为什么过程中还会出现很难受的波动?
要理解这些问题,就必须学习一个新概念:
方差。
方差是足球量化里非常重要,但又很容易被忽略的概念。
很多人不是不懂概率,也不是完全不懂赔率,而是接受不了短期波动。
连续几场结果符合判断,就觉得自己掌握规律。
连续几场结果不理想,就觉得方法失效。
看到低概率结果发生,就觉得分析错了。
看到高概率结果没发生,就觉得概率没意义。
这些问题的根源,往往是没有理解方差。
一、方差到底是什么?
方差是一个数学概念。
但在足球量化入门阶段,不需要一上来记复杂公式。
你可以先这样理解:
方差衡量的是结果围绕平均值波动的程度。
或者更直白一点:
方差越大,结果越不稳定;方差越小,结果越稳定。
举一个生活例子。
有两条路都能让你平均每天走 10 分钟到公司。
第一条路:
每天基本都是 9 到 11 分钟。
第二条路:
有时候 5 分钟,有时候 20 分钟,有时候 30 分钟,平均下来也是 10 分钟。
这两条路的平均时间一样,都是 10 分钟。
但它们的体验完全不同。
第一条路波动小。
第二条路波动大。
这就是方差的直观含义。
平均值相同,不代表过程相同。
长期结果相似,不代表短期体验相似。
足球量化也是一样。
两种分析方法,长期期望可能差不多,但短期波动可能完全不同。
有的方法命中率高、赔率低,波动相对小。
有的方法命中率低、赔率高,波动可能很大。
有的方法长期有正 EV,但短期仍然可能经历连续不理想阶段。
如果不理解方差,就很容易误判这些波动。
二、先用抛硬币理解方差
我们先回到最简单的抛硬币。
一枚公平硬币:
正面概率 50%;
反面概率 50%。
理论上,长期正面比例接近 50%。
但如果你只抛 10 次,会发生什么?
可能是:
正面 5 次,反面 5 次
也可能是:
正面 7 次,反面 3 次
甚至可能是:
正面 2 次,反面 8 次
这些都不奇怪。
为什么?
因为短期有波动。
虽然长期概率是 50%,但短期结果不会机械地按照 50% 排列。
你不会看到这样的完美序列:
正、反、正、反、正、反。
现实中可能出现:
正、正、正、反、正、反、反、反、正、正。
这就是波动。
如果把正面看作“判断正确”,反面看作“判断不理想”,那么即使一个长期 50% 的事件,短期也可能连续出现几次正面或反面。
足球比赛比抛硬币更复杂,波动更大。
所以,短期连对或连错,在足球分析里非常常见。
三、方差和大数定律是什么关系?
前面讲过大数定律:
样本越多,实际结果越接近真实概率。
方差讲的是:
在接近长期平均之前,短期结果可能怎么波动。
这两个概念是配套的。
大数定律告诉你:
长期会趋近真实概率。
方差告诉你:
短期可能偏离真实概率,而且偏离幅度可能很大。
举个例子。
假设一种判断长期正确率是 55%。
如果样本足够大,比如 10000 场,它的实际正确率可能会比较接近 55%。
但如果只看 20 场,结果可能是:
20 场对 14 场,正确率 70%
也可能是:
20 场对 8 场,正确率 40%
这两种结果都可能出现。
如果你只看前一种,会觉得方法很强。
如果你只看后一种,会觉得方法很差。
但这可能都只是短期方差。
所以,大数定律解决长期问题,方差解释短期波动。
没有大数定律,你会看不到长期。
没有方差,你会承受不了短期。
四、足球比赛为什么方差特别高?
足球比赛的方差很高,主要有几个原因。
1. 足球是低比分运动
一场足球比赛通常只有几个进球。
很多比赛是:
1-0
1-1
2-1
0-0
2-0
进球少,意味着每一个进球都很重要。
一次红牌、一次点球、一次门将失误、一次折射,都可能改变结果。
篮球比赛有很多得分回合,强队可以通过大量回合逐渐体现优势。
足球比赛进球少,强队优势不一定每场都能完全兑现。
所以足球天然比很多高比分运动波动更大。
2. 单个事件影响极大
足球比赛里,一个关键事件可能改变全部结构。
比如:
第 10 分钟红牌;
第 20 分钟点球;
第 35 分钟门将失误;
第 70 分钟中卫伤退;
第 88 分钟定位球丢球;
补时阶段出现绝平。
这些事件会直接影响胜平负、总进球、比赛节奏和心理状态。
量化分析可以估计概率,但不能提前确定所有单场事件。
所以,即使赛前判断合理,赛中事件也可能让结果偏离预期。
这就是方差。
3. 平局让足球结果更复杂
很多运动只有胜负两个结果。
但足球常见分析里,胜平负有三个结果。
平局的存在让结果分布更复杂。
比如一场比赛:
主胜 45%
平局 30%
客胜 25%
主胜是最高概率,但它没有超过 50%。
如果只看主胜方向,很容易误以为“主队更可能赢”。
但实际上,主队不胜概率是:
30% + 25% = 55%
这类比赛结果分布很分散,方差自然更高。
4. 进球效率波动大
一支球队可能一场比赛创造很多机会却不进球。
也可能机会不多,却靠一次远射或定位球进球。
比如:
A 队全场 18 次射门,0 个进球。
B 队全场 4 次射门,1 个进球。
这在足球里并不少见。
机会质量和进球结果之间有关系,但不是一一对应。
短期进球效率会波动。
这也是足球方差高的重要原因。
五、为什么正 EV 也会短期连续不理想?
这是理解方差最关键的地方。
假设某个方向是真正的正 EV。
赔率是 2.20。
你的长期判断概率是 50%。
前面我们算过:
成功净收益是:
2.20 - 1 = 1.20
EV 是:
50% × 1.20 - 50% × 1 = +0.10
这是正 EV。
但注意:
成功概率只有 50%。
这意味着什么?
它长期有优势,但每一次仍然有 50% 的失败概率。
那么短期连续 3 次失败可能吗?
当然可能。
连续 3 次失败概率是:
50% × 50% × 50% = 12.5%
也就是说,大约每 8 次类似的 3 连组合中,就可能出现一次连续 3 次失败。
连续 4 次失败呢?
50% × 50% × 50% × 50% = 6.25%
也不是极端罕见。
所以,一个正 EV 判断,也可能短期连续不理想。
这不是矛盾。
因为正 EV 讲长期平均,方差讲短期波动。
六、低命中正 EV 的波动会更大
如果一个正 EV 方向命中率较低,但赔率较高,它的短期波动通常更大。
举个例子。
某个方向赔率是 4.00。
你判断真实概率是 30%。
成功净收益:
4.00 - 1 = 3.00
EV:
30% × 3.00 - 70% × 1 = 0.90 - 0.70 = +0.20
它是正 EV。
但成功概率只有 30%。
这意味着:
失败概率是 70%。
连续几次不理想,非常正常。
连续 3 次失败概率是:
70% × 70% × 70% = 34.3%
连续 5 次失败概率是:
70% × 70% × 70% × 70% × 70% ≈ 16.8%
也就是说,即使它是正 EV,短期连续 5 次不理想也并不罕见。
这就是高赔率、低命中结构的方差。
它可能长期有优势,但过程非常不平滑。
如果不理解方差,看到连续几次不理想,就会以为方法失效。
七、高命中负 EV 也可能短期很漂亮
反过来,高命中方向也可能是负 EV。
比如赔率 1.30。
假设真实概率是 70%。
成功净收益:
1.30 - 1 = 0.30
EV:
70% × 0.30 - 30% × 1 = 0.21 - 0.30 = -0.09
它是负 EV。
但它的成功概率是 70%。
这意味着它短期经常会发生。
连续 3 次成功概率是:
70% × 70% × 70% = 34.3%
连续 5 次成功概率是:
70% × 70% × 70% × 70% × 70% ≈ 16.8%
所以,一个负 EV 方向,也可能短期连续正确。
这就是低赔率方向最容易制造的错觉:
经常对,但长期未必好。
如果只看短期命中率,就会被它迷惑。
这也是为什么足球量化不能只看命中率,必须看 EV 和长期样本。
八、方差让“最近很准”变得不可靠
很多人喜欢说:
最近很准。
最近状态好。
最近连续看对。
最近这个方法很灵。
但量化思维会问:
样本是多少?
如果只是最近 5 场、10 场,意义有限。
因为短期连续正确可能只是方差。
比如一个完全没有优势、真实成功率 50% 的判断方式。
连续 5 次正确的概率是:
50% × 50% × 50% × 50% × 50% = 3.125%
3.125% 看起来不高。
但如果很多人、很多场、很多次都在尝试,短期连对迟早会出现。
这就是为什么平台上总会有人展示短期连红。
短期连对并不一定代表长期能力。
必须看:
样本量;
平均赔率;
EV;
ROI;
回撤;
长期稳定性。
否则,“最近很准”可能只是方差带来的短期高峰。
九、方差也让“最近很差”不一定代表方法失效
同样,短期连续不理想,也不一定说明方法完全失效。
假设一种方法长期成功率是 55%。
失败概率是 45%。
连续 4 次失败概率是:
45% × 45% × 45% × 45% ≈ 4.1%
不高,但会发生。
如果样本足够长,这种低谷一定会出现。
如果一个人不了解方差,他可能在低谷时直接否定方法。
但更理性的做法是:
先看这是否在正常波动范围内;
再看样本是否足够;
再看近期是否出现结构变化;
再看长期指标是否明显恶化;
最后再决定是否需要调整。
不能因为几场结果不理想,就直接推翻一套长期有效的方法。
当然,也不能用“方差”当借口逃避复盘。
如果长期持续偏离,那就不是正常波动,而可能是方法真的有问题。
十、方差不是借口,复盘仍然必须做
这一点非常重要。
理解方差,不是为了给所有错误找借口。
不能说:
反正足球有方差,所以错了也没关系。
这不是量化思维。
真正的量化思维是:
单场偏差可以接受,但长期偏差必须复盘。
比如一场强队被红牌影响,结果偏离预期,这是正常方差。
但如果你长期高估强队胜率,那就是系统性问题。
一场平局没判断出来,可能是正常波动。
但如果你长期低估平局概率,那就必须修正。
一场大比分没打出,可能是进球效率波动。
但如果你长期高估进球数,那就说明分析方法有偏差。
所以,方差只能解释短期波动,不能掩盖长期错误。
正确态度是:
单场看波动,长期看偏差。
十一、方差和样本量的关系
样本越小,方差影响越大。
样本越大,结果越稳定。
举个例子。
假设一种方法真实成功率是 55%。
如果只看 10 场,实际命中率可能是:
30%、40%、60%、70%、80%
都有可能。
但如果看 1000 场,实际命中率更可能接近 55%。
这并不是说一定刚好 55%。
而是说偏离幅度通常会变小。
所以,样本量越大,你越能看清真实水平。
样本量越小,你越容易被方差欺骗。
这就是为什么足球量化必须记录长期样本。
没有样本,就无法区分:
短期波动;
真实优势;
系统性错误;
偶然好运;
偶然低谷。
十二、方差和赔率结构的关系
不同赔率结构,方差不同。
1. 低赔率结构
低赔率通常意味着高命中、低收益。
比如赔率 1.30。
正确时赚 0.30。
错误时亏 1。
这种结构短期看起来比较平稳,因为它经常正确。
但一旦错误,损失会吃掉多次正确收益。
所以它的风险不是“经常错”,而是“偶尔错一次影响很大”。
2. 中等赔率结构
比如赔率 2.00 左右。
正确赚 1,错误亏 1。
这种结构更对称。
命中率略高于 50%,就可能出现正期望。
但短期波动仍然明显。
3. 高赔率结构
比如赔率 4.00、5.00 以上。
正确时收益高。
错误时仍然亏 1。
但成功概率通常较低。
这种结构可能长期有价值,但短期很容易连续失败。
所以高赔率结构方差更大。
如果不理解这一点,很容易在长期优势还没体现前就失去耐心。
十三、方差和心理误判
方差不仅是数学问题,也是心理问题。
短期波动会影响人的判断。
连续正确时
人容易:
过度自信;
扩大判断范围;
忽略风险;
相信自己进入“状态”;
把运气当能力。
连续不理想时
人容易:
怀疑全部方法;
情绪化调整;
频繁改变规则;
否定长期样本;
放弃原本合理的判断。
这两种都很危险。
量化思维要求你把短期情绪和长期数据分开。
连续正确时,不要膨胀。
连续不理想时,不要崩溃。
真正要看的是:
这段波动是否在预期范围内?
长期样本是否仍然支持原判断?
是否出现了新的结构性变化?
是否需要复盘,而不是情绪化调整?
十四、方差和最大回撤的关系
后面我们会专门讲最大回撤。
这里先简单说一下。
方差会带来波动。
波动会带来回撤。
最大回撤就是:
从某个阶段高点到后续低点的最大下滑幅度。
如果一种方法方差很大,它可能出现更深的回撤。
比如两个方法长期 EV 都为正。
方法 A:
命中率高,赔率低,波动小。
方法 B:
命中率低,赔率高,波动大。
长期看,两者都可能有价值。
但方法 B 的过程可能更痛苦:
连续不理想更多;
资金曲线波动更大;
最大回撤更深;
心理压力更强。
所以,理解方差,是理解最大回撤的前提。
十五、一个完整示例:两个方法期望相同,但体验完全不同
我们看两个假设方法。
方法 A
成功概率 70%。
成功净收益 0.50。
失败概率 30%。
失败损失 1。
EV:
EV = 70% × 0.50 - 30% × 1
EV = 0.35 - 0.30 = +0.05
方法 A 是正 EV。
它的特点是:
成功率较高;
单次收益较低;
失败时损失较大;
整体波动相对没那么剧烈。
方法 B
成功概率 35%。
成功净收益 3.00。
失败概率 65%。
失败损失 1。
EV:
EV = 35% × 3.00 - 65% × 1
EV = 1.05 - 0.65 = +0.40
方法 B 的 EV 更高。
但它的波动也更大。
因为失败概率是 65%。
连续几次失败很正常。
如果只看短期,方法 B 很容易让人怀疑。
如果看长期,方法 B 可能更有优势。
这说明:
EV 和方差必须一起看。
只看 EV,可能忽略过程痛苦。
只看命中率,可能忽略长期价值。
只看短期表现,可能被方差误导。
十六、足球分析中哪些场景方差更高?
1. 平局判断
平局本身概率通常不算最高,但赔率往往较高。
这类判断如果有价值,也通常方差较大。
因为平局命中率很难特别高。
2. 冷门判断
冷门属于低概率结果。
即使某些冷门有研究价值,短期也容易连续不出现。
这类分析方差很高。
3. 高赔率方向
高赔率意味着市场认为概率较低。
如果判断有价值,也通常需要长期样本才能体现。
短期波动大。
4. 总进球判断
进球数受红牌、点球、早早进球、比赛节奏影响很大。
所以总进球相关判断也有明显方差。
5. 杯赛和世界杯小组赛
这类比赛受战意、赛制、轮换、压力影响很大。
普通联赛规律不一定完全适用。
波动可能更明显。
十七、如何降低被方差误导的概率?
不能消灭方差,但可以减少被方差误导。
1. 记录足够样本
不要只看最近几场。
长期记录,才能看清真实水平。
2. 分开统计不同类型
不要把所有比赛混在一起。
低赔率、高赔率、平局、总进球、强弱对话、世界杯小组赛,应该分开看。
不同类型方差不同。
3. 同时看 EV、ROI、命中率和回撤
不要只看一个指标。
命中率高不代表好。
EV 高不代表过程舒服。
ROI 好也可能来自少数极端结果。
最大回撤能反映过程风险。
4. 给短期波动留空间
如果一种方法理论上波动大,就不要因为短期低谷轻易否定。
但如果长期持续恶化,就必须复盘。
5. 不要频繁改规则
很多人看到短期不理想就马上改方法。
这样会导致永远无法积累稳定样本。
合理做法是:
先记录,后复盘,再决定是否调整。
十八、方差的核心公式要不要掌握?
严格数学里的方差公式是:
方差 = 各结果与平均值差距的平方的平均值
如果写成数学形式,会比较抽象。
在这套入门教程里,不要求读者马上掌握完整公式。
你只需要理解:
方差越大,短期结果越容易偏离长期平均。
这就够用了。
后续如果进入更深入的量化研究,再去学习具体公式也不迟。
在足球量化入门阶段,更重要的是建立正确认识:
正 EV 也会短期不理想。
负 EV 也会短期很好看。
高赔率结构通常波动更大。
低赔率结构也有自己的风险。
长期样本才能区分优势和波动。
十九、这一章你需要掌握什么?
读完这一章,你应该掌握以下几点:
第一,方差衡量结果波动程度。
第二,足球比赛方差高,因为进球少、随机事件影响大。
第三,正 EV 不代表短期一定顺利。
第四,负 EV 也可能短期连续正确。
第五,低赔率结构容易制造安全错觉。
第六,高赔率结构通常波动更大。
第七,短期连对或连错,都不能直接证明方法好坏。
第八,方差不是错误借口,长期偏差仍然必须复盘。
第九,EV、ROI、命中率、最大回撤要结合看。
第十,足球量化必须同时理解长期优势和短期波动。
结语:理解方差,才能真正理解足球量化的过程
足球量化不是一条平滑直线。
即使方向正确,过程也可能波动。
即使长期有优势,短期也可能不理想。
即使某个方法没有长期价值,短期也可能表现很好。
即使一个结果概率很高,也可能失败。
即使一个结果概率较低,也可能发生。
这不是矛盾。
这就是方差。
方差告诉我们:
不要被几场结果冲昏头脑。
不要被几场波动彻底击垮。
不要用短期情绪替代长期样本。
不要用单场故事否定概率逻辑。
真正成熟的足球量化思维,不只是会算 EV。
还要能承受 EV 在短期里的波动。
因为长期价值不会每天都用直线方式呈现。
它会起伏。
会回撤。
会有连续不理想。
也会有短期高峰。
理解这一点,读者才算真正从“看结果”进入“看系统”的阶段。
本文仅供足球数据研究和理性观赛参考,不构成任何投注建议。
你可以继续查看稳狗足球足球量化平台,了解概率、EV、回测、最大回撤等量化指标在实际数据分析中的应用。
