很多人评估足球模型,第一反应还是看命中率。
模型最近 10 场中了 7 场。
某个策略命中率 65%。
某个结果方向长期命中率 70%。
某个推荐号说自己 80% 命中。
这些数字看起来都很直观。
但如果你真正做足球模型,就必须理解一个更重要的概念:
期望值。
因为命中率只回答一个问题:
对了多少次。
但它没有回答:
对一次带来多少收益?
错一次损失多少?
这个概率对应的回报结构是否合理?
长期平均下来到底是正还是负?
模型看对的那些场次,是否足以覆盖看错的成本?
所以,单独看命中率是不够的。
甚至在某些情况下,命中率很高,也可能没有长期价值。
这听起来反直觉,但数学上非常清楚。
这一章要讲的,就是足球模型里最容易被误解的一个问题:
为什么命中率高,不等于模型有价值。
一、什么是期望值?
期望值可以理解成:
如果一件事重复发生很多次,每次平均下来大概得到什么结果。
它不是看某一次。
它看长期平均。
最简单的公式是:
期望值 = 成功概率 × 成功结果 + 失败概率 × 失败结果
如果成功时结果是正的,失败时结果是负的,就可以写成:
EV = P(成功) × 收益 - P(失败) × 损失
其中:
EV = Expected Value,期望值
P(成功) = 成功概率
P(失败) = 失败概率
收益 = 成功一次得到的净结果
损失 = 失败一次损失的结果
如果:
EV > 0
表示长期平均是正的。
如果:
EV = 0
表示长期平均大致持平。
如果:
EV < 0
表示长期平均是负的。
这就是期望值最基本的含义。
二、一个简单例子:命中率 80%,也可能是负期望
假设有一个游戏。
每次成功,赚 1 元。
每次失败,亏 10 元。
成功概率是 80%。
失败概率是 20%。
很多人一看 80% 成功率,会觉得很好。
但算期望值:
EV = 80% × 1 - 20% × 10
换成小数:
EV = 0.80 × 1 - 0.20 × 10
计算:
EV = 0.80 - 2.00 = -1.20
也就是说,这个游戏虽然成功率 80%,但长期每次平均亏 1.20 元。
为什么?
因为失败一次的代价太大。
这个例子说明一个非常重要的原则:
命中率不能脱离收益和损失单独看。
命中率高,不代表长期结果好。
关键要看:
对一次赚多少;
错一次亏多少;
成功概率是否足够覆盖失败损失。
足球模型评估也是一样。
三、为什么足球模型里会出现“高命中率但没价值”?
在足球模型里,很多高命中率来自高概率低回报事件。
例如某个结果本来就很容易发生,所以模型经常能判断对。
但因为它本来就容易发生,外部定价也会很低。
这意味着:
对一次带来的回报很小;
错一次的损失可能抵消多次正确。
举一个通俗例子。
假设某类结果的平均赔率是:
1.25
如果按 1 个单位计算,成功一次的净收益是:
1.25 - 1 = 0.25
失败一次损失:
1
如果一个模型在这类结果上命中率是 80%。
看起来很高。
但期望值是:
EV = 80% × 0.25 - 20% × 1
换成小数:
EV = 0.80 × 0.25 - 0.20 × 1
计算:
EV = 0.20 - 0.20 = 0
也就是说,80% 命中率在平均赔率 1.25 的结构下,只是刚好持平。
如果实际命中率只有 78%,就会变成负的:
EV = 0.78 × 0.25 - 0.22 × 1
EV = 0.195 - 0.22 = -0.025
所以,高命中率并不自动代表正期望。
它必须配得上对应的回报结构。
四、盈亏平衡命中率:每个赔率都有最低要求
要判断一个命中率有没有价值,可以先看盈亏平衡命中率。
公式很简单:
盈亏平衡命中率 = 1 / 赔率
这个公式的意思是:
如果长期命中率刚好等于这个值,那么长期大致不赚不亏。
如果命中率高于这个值,才可能有正期望。
如果低于这个值,就是负期望。
举几个例子。
平均赔率 2.00
盈亏平衡命中率 = 1 / 2.00 = 50%
如果长期命中率超过 50%,才有正期望空间。
平均赔率 1.50
盈亏平衡命中率 = 1 / 1.50 = 66.7%
也就是说,命中率必须超过约 66.7%,才可能有正期望。
平均赔率 1.30
盈亏平衡命中率 = 1 / 1.30 = 76.9%
平均赔率 1.20
盈亏平衡命中率 = 1 / 1.20 = 83.3%
这组数字非常关键。
它告诉你:
平均赔率越低,对命中率要求越高。
所以,看到“命中率 70%”,不能直接说好。
要问:
它对应的平均赔率是多少?
如果平均赔率是 1.20,70% 很差。
如果平均赔率是 1.50,70% 略有空间。
如果平均赔率是 2.00,70% 非常强。
命中率必须放在赔率结构里理解。
五、同样 65% 命中率,结果可能完全不同
假设有三个模型,命中率都是 65%。
但它们对应的平均赔率不同。
模型 A:平均赔率 1.30
成功一次净收益:
1.30 - 1 = 0.30
65% 命中率的期望值:
EV = 65% × 0.30 - 35% × 1
换成小数:
EV = 0.65 × 0.30 - 0.35 × 1
EV = 0.195 - 0.35 = -0.155
负期望。
模型 B:平均赔率 1.60
成功一次净收益:
1.60 - 1 = 0.60
期望值:
EV = 0.65 × 0.60 - 0.35 × 1
EV = 0.39 - 0.35 = +0.04
略微正期望。
模型 C:平均赔率 2.00
成功一次净收益:
2.00 - 1 = 1.00
期望值:
EV = 0.65 × 1.00 - 0.35 × 1
EV = 0.65 - 0.35 = +0.30
明显更好。
三个模型命中率一样,长期价值完全不同。
所以,单独展示命中率是没有上下文的。
真正要看:
命中率 + 平均赔率 + 样本量 + 回撤 + 概率校准
缺任何一块,判断都不完整。
六、期望值和足球模型有什么关系?
足球模型本身输出的是概率。
例如:
主胜概率:58%
平局概率:26%
客胜概率:16%
这只是模型对比赛结果的估计。
如果只做足球数据研究,模型概率可以用于理解比赛结构。
比如:
主队优势是否明显;
平局风险是否高;
结果分布是否分散。
但如果要判断某个模型结果是否具有长期价值,就必须引入期望值概念。
因为长期价值不是看概率高低,而是看:
模型概率是否高于外部隐含概率
用普通话说:
如果模型认为某结果真实发生概率是 60%,但外部定价只相当于 50%,那说明模型和外部预期有差异。
这个差异是否真实可靠,需要长期验证。
如果模型认为概率是 60%,外部也认为是 60%,那就没有明显优势。
所以,模型概率本身不等于价值。
价值来自:
模型概率 - 外部隐含概率
但这个差值必须非常谨慎对待。
因为模型概率可能错。
如果模型过度自信,就会制造虚假的正期望。
七、为什么“最高概率结果”不一定最有价值?
很多人以为:
概率最高的结果,就是最有价值的结果。
这不一定。
假设一场比赛模型输出:
主胜:62%
平局:24%
客胜:14%
主胜是最高概率。
但如果外部预期已经把主胜看得非常高,主胜未必有价值。
再看另一种情况:
模型输出:
主胜:46%
平局:31%
客胜:23%
主胜仍然最高,但概率不厚。
如果外部预期把主胜看得更高,比如隐含概率接近 55%,那主胜甚至可能被高估。
还有一种情况。
模型输出:
主胜:45%
平局:32%
客胜:23%
平局不是最高概率。
但如果外部对平局的预期很低,而模型认为平局风险明显高于外部,那么平局在研究上更值得关注。
所以,价值不是看哪个结果概率最高。
而是看:
模型概率和外部预期之间是否存在可信差异
这就是期望值思维。
八、期望值公式如何用于模型概率?
假设某个结果的赔率是:
O
模型认为这个结果发生概率是:
p
成功时净收益是:
O - 1
失败时损失是:
1
那么期望值:
EV = p × (O - 1) - (1 - p) × 1
整理一下:
EV = p × O - 1
这是一个非常重要的简化公式。
其中:
p = 模型估计概率
O = 赔率
EV = 每投入1个单位的期望值
如果:
EV > 0
表示模型认为有正期望。
如果:
EV = 0
表示刚好持平。
如果:
EV < 0
表示负期望。
举例。
模型认为主胜概率:
p = 0.60
外部赔率:
O = 1.80
则:
EV = 0.60 × 1.80 - 1
EV = 1.08 - 1
EV = 0.08
也就是:
EV = +0.08
表示每 1 个单位长期期望为 +0.08。
但是,这个计算成立的前提是:
模型概率 60% 是可信的。
如果模型实际校准后只有 52%,那么:
EV = 0.52 × 1.80 - 1
EV = 0.936 - 1
EV = -0.064
就变成负期望。
所以,期望值高度依赖概率校准。
模型概率不可信,EV 也不可信。
九、为什么模型过度自信会制造假 EV?
这是足球模型里非常常见的问题。
假设模型实际没有那么准,但它经常把概率估得很高。
例如真实概率可能只有:
55%
但模型输出:
65%
如果外部赔率是:
1.70
用模型概率算:
EV = 0.65 × 1.70 - 1
EV = 1.105 - 1 = +0.105
看起来是正期望。
但真实概率如果是 55%:
EV = 0.55 × 1.70 - 1
EV = 0.935 - 1 = -0.065
实际上是负的。
这就是过度自信模型最危险的地方。
它会让你以为发现了价值。
但这个价值只是模型概率高估造成的幻觉。
所以,期望值计算必须建立在概率校准基础上。
没有校准,EV 可能只是数学幻觉。
十、为什么低赔率最容易制造“稳但没价值”的错觉?
低赔率结果通常发生概率高。
所以看起来更容易命中。
比如平均赔率:
1.25
它的盈亏平衡命中率是:
1 / 1.25 = 80%
也就是说,长期要超过 80% 命中率才可能有正期望。
如果某个模型在这类结果上命中率 78%,很多人会觉得很高。
但实际上:
EV = 0.78 × 1.25 - 1
EV = 0.975 - 1 = -0.025
仍然是负的。
低赔率的特点是:
命中率看起来高;
每次收益低;
一次错误抵消多次正确;
需要极高命中率才能正期望。
所以,低赔率不能简单理解成低风险。
它只是发生概率高。
是否有长期价值,要看模型概率是否超过赔率对应的盈亏平衡点。
十一、为什么高赔率也不一定有价值?
反过来,高赔率也不等于有价值。
假设某结果赔率是:
3.50
盈亏平衡命中率:
1 / 3.50 = 28.57%
如果模型认为真实概率是 25%,那期望值:
EV = 0.25 × 3.50 - 1
EV = 0.875 - 1 = -0.125
仍然是负的。
如果模型认为概率是 32%:
EV = 0.32 × 3.50 - 1
EV = 1.12 - 1 = +0.12
才是正的。
所以高赔率只是说明外部认为它发生概率低。
它不自动有价值。
高赔率结果命中率低,回撤可能大,方差也会更大。
判断价值仍然要回到:
模型概率 × 赔率 - 1
以及模型概率是否可信。
十二、期望值和方差不是一回事
很多人以为只要 EV 为正,就会稳定。
不是。
期望值回答的是长期平均。
方差回答的是过程波动。
一个正期望模型,也可能经历长时间低谷。
比如一个高赔率模型:
命中率:32%
平均赔率:3.50
期望值:
EV = 0.32 × 3.50 - 1 = +0.12
长期看是正的。
但失败概率是:
68%
这意味着它会经常错。
连续几场不理想很正常。
它有正期望,但过程波动大。
再比如低赔率模型:
命中率:84%
平均赔率:1.25
期望值:
EV = 0.84 × 1.25 - 1 = +0.05
长期略正。
但一次失败会抵消多次成功。
它看起来更平滑,但也有回撤。
所以,评估模型不能只看 EV。
还要看方差和最大回撤。
正期望不等于每天顺。
十三、为什么短期 EV 也会骗人?
假设某模型最近 20 场表现很好。
算出来 EV 很高。
这能说明长期有优势吗?
不一定。
因为样本太小。
20 场里可能刚好高概率结果频繁发生。
也可能低概率结果集中命中。
也可能赛程阶段较简单。
也可能模型刚好适合这段时间。
期望值需要长期样本验证。
不能用短期结果得出结论。
比如一个策略真实 EV 是 0。
也就是长期没有优势。
但在 20 场里完全可能表现很好。
同样,一个真实正期望策略,在 20 场里也可能表现很差。
所以,EV 评估必须有足够样本。
并且最好分:
联赛;
赛季;
时间段;
概率区间;
模型类型。
短期 EV 只能作为观察,不能作为结论。
十四、模型评估里,EV 应该怎么用?
在足球模型评估里,EV 可以作为一个参考维度,但不应该单独决定模型好坏。
更基础的评估仍然是:
LogLoss;
Brier Score;
概率校准;
分联赛表现;
分时间段稳定性;
模型是否过拟合;
是否存在未来数据泄漏。
为什么?
因为 EV 依赖外部价格和模型概率。
如果模型概率不校准,EV 不可信。
如果外部数据质量不稳定,EV 也不稳定。
如果只在某些筛选样本上看 EV,也可能被样本选择影响。
所以正确顺序是:
第一,先让模型概率可信。
第二,验证概率校准和回测稳定。
第三,再比较模型概率和外部预期。
第四,最后再计算 EV 作为研究指标。
不要反过来。
不要一开始就用 EV 指导模型训练,而忽略概率质量。
十五、期望值和“好比赛识别”的关系
期望值可以帮助识别哪些比赛更值得研究。
但不能只看 EV 数字。
一个模型可能在某场比赛上算出高 EV。
但如果这场比赛:
模型分歧很大;
数据缺失明显;
临场变量关键;
平局模型不稳定;
联赛样本不足;
概率校准较差;
那么这个 EV 就要谨慎看。
成熟系统应该同时看:
模型概率;
模型一致性;
概率校准;
外部预期差异;
比赛数据质量;
模型历史表现;
风险分层。
一个高 EV 但高不确定性的比赛,不一定是好比赛。
一个中等 EV 但模型高度一致、校准稳定的比赛,反而可能更适合研究。
所以,好比赛识别不是只看 EV。
EV 是其中一层。
十六、用一个完整例子理解 EV
假设有一场比赛,模型输出:
主胜概率:56%
平局概率:27%
客胜概率:17%
外部赔率假设为:
主胜赔率:1.75
平局赔率:3.40
客胜赔率:4.80
现在分别计算 EV。
主胜 EV
EV_home = 0.56 × 1.75 - 1
EV_home = 0.98 - 1
EV_home = -0.02
主胜虽然概率最高,但 EV 是负的。
平局 EV
EV_draw = 0.27 × 3.40 - 1
EV_draw = 0.918 - 1
EV_draw = -0.082
平局也是负的。
客胜 EV
EV_away = 0.17 × 4.80 - 1
EV_away = 0.816 - 1
EV_away = -0.184
客胜也负。
这说明:
虽然主胜概率最高,但在这个外部定价下,三个结果都没有正期望。
这很正常。
并不是每场比赛都有价值。
很多比赛模型和外部预期差不多,甚至模型认为没有优势。
模型真正应该做的是识别:
有价值的概率差异,而不是每场都强行输出结论。
十七、再看一个主胜不是最高 EV 的例子
模型输出:
主胜概率:48%
平局概率:30%
客胜概率:22%
外部赔率:
主胜赔率:1.95
平局赔率:3.80
客胜赔率:4.20
计算:
主胜
EV_home = 0.48 × 1.95 - 1
EV_home = 0.936 - 1
EV_home = -0.064
平局
EV_draw = 0.30 × 3.80 - 1
EV_draw = 1.14 - 1
EV_draw = +0.14
客胜
EV_away = 0.22 × 4.20 - 1
EV_away = 0.924 - 1
EV_away = -0.076
这里主胜概率最高,但主胜 EV 为负。
平局不是最高概率,但 EV 为正。
这说明:
最高概率结果不一定最有价值。
价值来自模型概率和外部预期之间的差异。
当然,这仍然要求模型的 30% 平局概率可信。
如果模型长期高估平局,这个 EV 就是假的。
十八、期望值为什么必须和概率校准绑定?
期望值公式很简单:
EV = p × O - 1
但这里最重要的是 p。
p 是模型概率。
如果 p 错,EV 就错。
举个例子。
模型认为平局概率:
p = 0.30
赔率:
O = 3.80
算出:
EV = 0.30 × 3.80 - 1 = +0.14
看起来不错。
但如果模型平局概率长期高估,真实概率只有:
p = 0.24
那么真实 EV:
EV = 0.24 × 3.80 - 1
EV = 0.912 - 1
EV = -0.088
正期望变负期望。
所以,模型概率不校准时,EV 没有意义。
这也是为什么在模型训练专题里,概率校准比短期结果更重要。
你不能拿一个不可信概率去算期望值。
那只是把错误包装成精确数字。
十九、期望值和模型训练目标的关系
很多人会问:
既然 EV 很重要,那模型训练目标是不是应该直接最大化 EV?
这个问题要谨慎。
在研究上,可以分析模型输出与 EV 的关系。
但模型训练阶段,更基础的目标应该是:
概率预测准确;
概率校准稳定;
LogLoss 和 Brier Score 合理;
时间回测稳定;
不同联赛表现可控。
原因是:
EV 依赖外部赔率;
外部赔率本身可能有变化;
不同数据源口径不同;
EV 容易被模型过度自信放大;
如果直接追求历史 EV,很容易过拟合到历史市场环境。
所以,基础模型应该先训练成一个可信概率模型。
然后再研究概率差异和期望值。
顺序不能倒。
先概率,后 EV。
二十、为什么“看对方向”不等于有价值?
在足球模型里,这句话非常重要。
比如模型经常判断主队方向。
结果很多场主队确实赢了。
但如果这些主胜都是低回报结构,并且模型概率没有超过外部预期,那长期未必有价值。
看对方向,只说明你判断了最高概率结果。
但期望值问的是:
这个结果的概率是否被低估?
如果一个结果本来就很热门,外部已经充分反映了它的概率,那么看对它并不等于有价值。
举个例子。
模型认为主胜 70%。
外部隐含概率也大约 70%。
那就没有明显概率差。
你看对了主胜,也只是看对了一个大家都知道的高概率结果。
长期价值不来自“看对热门”。
而来自“模型概率比外部预期更接近真实”。
这就是期望值思维和普通命中率思维的区别。
二十一、期望值和回撤的关系
一个正期望模型,仍然会有回撤。
假设某策略长期 EV 为:
+0.05
也就是每次平均正 0.05 个单位。
这听起来不错。
但单场结果仍然会波动。
如果命中率不是特别高,连续不理想很正常。
即使命中率较高,低回报结构下几次失败也会产生明显回撤。
所以,评估模型时不能只看 EV。
还要看:
最大回撤;
连续低谷;
收益曲线波动;
不同时间段表现;
样本量是否足够;
是否过度集中在某类结果。
EV 告诉你长期平均方向。
回撤告诉你过程有多难受。
没有回撤信息的 EV,是不完整的。
二十二、普通读者如何正确理解 EV?
如果读者不想记太多公式,只要记住四句话。
第一:
命中率高,不等于有价值。
第二:
每个赔率都有对应的最低命中率要求。
第三:
期望值取决于模型概率和外部定价之间的差异。
第四:
模型概率不校准,EV 就不可信。
如果能理解这四句,就不会被“高命中率”“最近很准”“低风险”“看对很多场”轻易误导。
二十三、本章实操检查清单
评估模型或某类策略的期望值时,可以检查:
1. 模型输出的是概率,还是硬判断?
2. 模型概率是否经过长期校准?
3. 是否知道对应外部赔率或隐含概率?
4. 是否计算盈亏平衡命中率?
5. 是否只看命中率,而没有看赔率结构?
6. 是否存在低赔率高命中错觉?
7. 是否样本量足够大?
8. 是否分联赛、分时间段评估?
9. 是否检查最大回撤?
10. 是否比较短期 EV 和长期 EV?
11. 是否存在模型过度自信导致的虚假 EV?
12. 是否把最高概率结果误认为最高价值结果?
这些问题比一句“命中率多少”重要得多。
本章小结
期望值衡量的是长期平均结果。
最基础公式是:
EV = P(成功) × 收益 - P(失败) × 损失
在赔率结构里,可以简化为:
EV = p × O - 1
其中:
p = 模型估计概率
O = 赔率
如果:
EV > 0
表示模型认为长期有正期望。
但这个结论成立的前提是:
模型概率 p 必须可信。
如果模型概率不校准,EV 也不可信。
命中率高不等于有价值。
低赔率高命中也可能长期没有优势。
最高概率结果不一定最有价值。
看对方向不等于有正期望。
正期望也不代表过程平滑。
足球模型真正要做的是:
先训练可信概率;
再比较外部预期;
再分析期望值;
最后结合方差、回撤和长期样本判断是否稳定。
下一章我们继续讲:
方差是什么?为什么足球模型短期表现会大起大落。
本文仅供足球数据研究和模型训练学习参考,不构成任何投注建议。
