期望值是什么?为什么命中率高不等于模型有价值
足球预测模型实战

期望值是什么?为什么命中率高不等于模型有价值

期望值衡量的是长期平均结果。足球模型不能只看命中率,还要看概率、回报结构和错误成本。

2026-05-16浏览 2
正文:17px

很多人评估足球模型,第一反应还是看命中率。

模型最近 10 场中了 7 场。
某个策略命中率 65%。
某个结果方向长期命中率 70%。
某个推荐号说自己 80% 命中。

这些数字看起来都很直观。

但如果你真正做足球模型,就必须理解一个更重要的概念:

期望值。

因为命中率只回答一个问题:

对了多少次。

但它没有回答:

对一次带来多少收益?
错一次损失多少?
这个概率对应的回报结构是否合理?
长期平均下来到底是正还是负?
模型看对的那些场次,是否足以覆盖看错的成本?

所以,单独看命中率是不够的。

甚至在某些情况下,命中率很高,也可能没有长期价值。

这听起来反直觉,但数学上非常清楚。

这一章要讲的,就是足球模型里最容易被误解的一个问题:

为什么命中率高,不等于模型有价值。


一、什么是期望值?

期望值可以理解成:

如果一件事重复发生很多次,每次平均下来大概得到什么结果。

它不是看某一次。

它看长期平均。

最简单的公式是:

期望值 = 成功概率 × 成功结果 + 失败概率 × 失败结果

如果成功时结果是正的,失败时结果是负的,就可以写成:

EV = P(成功) × 收益 - P(失败) × 损失

其中:

EV = Expected Value,期望值
P(成功) = 成功概率
P(失败) = 失败概率
收益 = 成功一次得到的净结果
损失 = 失败一次损失的结果

如果:

EV > 0

表示长期平均是正的。

如果:

EV = 0

表示长期平均大致持平。

如果:

EV < 0

表示长期平均是负的。

这就是期望值最基本的含义。


二、一个简单例子:命中率 80%,也可能是负期望

假设有一个游戏。

每次成功,赚 1 元。

每次失败,亏 10 元。

成功概率是 80%。

失败概率是 20%。

很多人一看 80% 成功率,会觉得很好。

但算期望值:

EV = 80% × 1 - 20% × 10

换成小数:

EV = 0.80 × 1 - 0.20 × 10

计算:

EV = 0.80 - 2.00 = -1.20

也就是说,这个游戏虽然成功率 80%,但长期每次平均亏 1.20 元。

为什么?

因为失败一次的代价太大。

这个例子说明一个非常重要的原则:

命中率不能脱离收益和损失单独看。

命中率高,不代表长期结果好。

关键要看:

对一次赚多少;
错一次亏多少;
成功概率是否足够覆盖失败损失。

足球模型评估也是一样。


三、为什么足球模型里会出现“高命中率但没价值”?

在足球模型里,很多高命中率来自高概率低回报事件。

例如某个结果本来就很容易发生,所以模型经常能判断对。

但因为它本来就容易发生,外部定价也会很低。

这意味着:

对一次带来的回报很小;
错一次的损失可能抵消多次正确。

举一个通俗例子。

假设某类结果的平均赔率是:

1.25

如果按 1 个单位计算,成功一次的净收益是:

1.25 - 1 = 0.25

失败一次损失:

1

如果一个模型在这类结果上命中率是 80%。

看起来很高。

但期望值是:

EV = 80% × 0.25 - 20% × 1

换成小数:

EV = 0.80 × 0.25 - 0.20 × 1

计算:

EV = 0.20 - 0.20 = 0

也就是说,80% 命中率在平均赔率 1.25 的结构下,只是刚好持平。

如果实际命中率只有 78%,就会变成负的:

EV = 0.78 × 0.25 - 0.22 × 1
EV = 0.195 - 0.22 = -0.025

所以,高命中率并不自动代表正期望。

它必须配得上对应的回报结构。


四、盈亏平衡命中率:每个赔率都有最低要求

要判断一个命中率有没有价值,可以先看盈亏平衡命中率。

公式很简单:

盈亏平衡命中率 = 1 / 赔率

这个公式的意思是:

如果长期命中率刚好等于这个值,那么长期大致不赚不亏。

如果命中率高于这个值,才可能有正期望。

如果低于这个值,就是负期望。

举几个例子。

平均赔率 2.00

盈亏平衡命中率 = 1 / 2.00 = 50%

如果长期命中率超过 50%,才有正期望空间。

平均赔率 1.50

盈亏平衡命中率 = 1 / 1.50 = 66.7%

也就是说,命中率必须超过约 66.7%,才可能有正期望。

平均赔率 1.30

盈亏平衡命中率 = 1 / 1.30 = 76.9%

平均赔率 1.20

盈亏平衡命中率 = 1 / 1.20 = 83.3%

这组数字非常关键。

它告诉你:

平均赔率越低,对命中率要求越高。

所以,看到“命中率 70%”,不能直接说好。

要问:

它对应的平均赔率是多少?

如果平均赔率是 1.20,70% 很差。
如果平均赔率是 1.50,70% 略有空间。
如果平均赔率是 2.00,70% 非常强。

命中率必须放在赔率结构里理解。


五、同样 65% 命中率,结果可能完全不同

假设有三个模型,命中率都是 65%。

但它们对应的平均赔率不同。

模型 A:平均赔率 1.30

成功一次净收益:

1.30 - 1 = 0.30

65% 命中率的期望值:

EV = 65% × 0.30 - 35% × 1

换成小数:

EV = 0.65 × 0.30 - 0.35 × 1
EV = 0.195 - 0.35 = -0.155

负期望。

模型 B:平均赔率 1.60

成功一次净收益:

1.60 - 1 = 0.60

期望值:

EV = 0.65 × 0.60 - 0.35 × 1
EV = 0.39 - 0.35 = +0.04

略微正期望。

模型 C:平均赔率 2.00

成功一次净收益:

2.00 - 1 = 1.00

期望值:

EV = 0.65 × 1.00 - 0.35 × 1
EV = 0.65 - 0.35 = +0.30

明显更好。

三个模型命中率一样,长期价值完全不同。

所以,单独展示命中率是没有上下文的。

真正要看:

命中率 + 平均赔率 + 样本量 + 回撤 + 概率校准

缺任何一块,判断都不完整。


六、期望值和足球模型有什么关系?

足球模型本身输出的是概率。

例如:

主胜概率:58%
平局概率:26%
客胜概率:16%

这只是模型对比赛结果的估计。

如果只做足球数据研究,模型概率可以用于理解比赛结构。

比如:

主队优势是否明显;
平局风险是否高;
结果分布是否分散。

但如果要判断某个模型结果是否具有长期价值,就必须引入期望值概念。

因为长期价值不是看概率高低,而是看:

模型概率是否高于外部隐含概率

用普通话说:

如果模型认为某结果真实发生概率是 60%,但外部定价只相当于 50%,那说明模型和外部预期有差异。

这个差异是否真实可靠,需要长期验证。

如果模型认为概率是 60%,外部也认为是 60%,那就没有明显优势。

所以,模型概率本身不等于价值。

价值来自:

模型概率 - 外部隐含概率

但这个差值必须非常谨慎对待。

因为模型概率可能错。

如果模型过度自信,就会制造虚假的正期望。


七、为什么“最高概率结果”不一定最有价值?

很多人以为:

概率最高的结果,就是最有价值的结果。

这不一定。

假设一场比赛模型输出:

主胜:62%
平局:24%
客胜:14%

主胜是最高概率。

但如果外部预期已经把主胜看得非常高,主胜未必有价值。

再看另一种情况:

模型输出:

主胜:46%
平局:31%
客胜:23%

主胜仍然最高,但概率不厚。

如果外部预期把主胜看得更高,比如隐含概率接近 55%,那主胜甚至可能被高估。

还有一种情况。

模型输出:

主胜:45%
平局:32%
客胜:23%

平局不是最高概率。

但如果外部对平局的预期很低,而模型认为平局风险明显高于外部,那么平局在研究上更值得关注。

所以,价值不是看哪个结果概率最高。

而是看:

模型概率和外部预期之间是否存在可信差异

这就是期望值思维。


八、期望值公式如何用于模型概率?

假设某个结果的赔率是:

O

模型认为这个结果发生概率是:

p

成功时净收益是:

O - 1

失败时损失是:

1

那么期望值:

EV = p × (O - 1) - (1 - p) × 1

整理一下:

EV = p × O - 1

这是一个非常重要的简化公式。

其中:

p = 模型估计概率
O = 赔率
EV = 每投入1个单位的期望值

如果:

EV > 0

表示模型认为有正期望。

如果:

EV = 0

表示刚好持平。

如果:

EV < 0

表示负期望。

举例。

模型认为主胜概率:

p = 0.60

外部赔率:

O = 1.80

则:

EV = 0.60 × 1.80 - 1
EV = 1.08 - 1
EV = 0.08

也就是:

EV = +0.08

表示每 1 个单位长期期望为 +0.08。

但是,这个计算成立的前提是:

模型概率 60% 是可信的。

如果模型实际校准后只有 52%,那么:

EV = 0.52 × 1.80 - 1
EV = 0.936 - 1
EV = -0.064

就变成负期望。

所以,期望值高度依赖概率校准。

模型概率不可信,EV 也不可信。


九、为什么模型过度自信会制造假 EV?

这是足球模型里非常常见的问题。

假设模型实际没有那么准,但它经常把概率估得很高。

例如真实概率可能只有:

55%

但模型输出:

65%

如果外部赔率是:

1.70

用模型概率算:

EV = 0.65 × 1.70 - 1
EV = 1.105 - 1 = +0.105

看起来是正期望。

但真实概率如果是 55%:

EV = 0.55 × 1.70 - 1
EV = 0.935 - 1 = -0.065

实际上是负的。

这就是过度自信模型最危险的地方。

它会让你以为发现了价值。

但这个价值只是模型概率高估造成的幻觉。

所以,期望值计算必须建立在概率校准基础上。

没有校准,EV 可能只是数学幻觉。


十、为什么低赔率最容易制造“稳但没价值”的错觉?

低赔率结果通常发生概率高。

所以看起来更容易命中。

比如平均赔率:

1.25

它的盈亏平衡命中率是:

1 / 1.25 = 80%

也就是说,长期要超过 80% 命中率才可能有正期望。

如果某个模型在这类结果上命中率 78%,很多人会觉得很高。

但实际上:

EV = 0.78 × 1.25 - 1
EV = 0.975 - 1 = -0.025

仍然是负的。

低赔率的特点是:

命中率看起来高;
每次收益低;
一次错误抵消多次正确;
需要极高命中率才能正期望。

所以,低赔率不能简单理解成低风险。

它只是发生概率高。

是否有长期价值,要看模型概率是否超过赔率对应的盈亏平衡点。


十一、为什么高赔率也不一定有价值?

反过来,高赔率也不等于有价值。

假设某结果赔率是:

3.50

盈亏平衡命中率:

1 / 3.50 = 28.57%

如果模型认为真实概率是 25%,那期望值:

EV = 0.25 × 3.50 - 1
EV = 0.875 - 1 = -0.125

仍然是负的。

如果模型认为概率是 32%:

EV = 0.32 × 3.50 - 1
EV = 1.12 - 1 = +0.12

才是正的。

所以高赔率只是说明外部认为它发生概率低。

它不自动有价值。

高赔率结果命中率低,回撤可能大,方差也会更大。

判断价值仍然要回到:

模型概率 × 赔率 - 1

以及模型概率是否可信。


十二、期望值和方差不是一回事

很多人以为只要 EV 为正,就会稳定。

不是。

期望值回答的是长期平均。

方差回答的是过程波动。

一个正期望模型,也可能经历长时间低谷。

比如一个高赔率模型:

命中率:32%
平均赔率:3.50

期望值:

EV = 0.32 × 3.50 - 1 = +0.12

长期看是正的。

但失败概率是:

68%

这意味着它会经常错。

连续几场不理想很正常。

它有正期望,但过程波动大。

再比如低赔率模型:

命中率:84%
平均赔率:1.25

期望值:

EV = 0.84 × 1.25 - 1 = +0.05

长期略正。

但一次失败会抵消多次成功。

它看起来更平滑,但也有回撤。

所以,评估模型不能只看 EV。

还要看方差和最大回撤。

正期望不等于每天顺。


十三、为什么短期 EV 也会骗人?

假设某模型最近 20 场表现很好。

算出来 EV 很高。

这能说明长期有优势吗?

不一定。

因为样本太小。

20 场里可能刚好高概率结果频繁发生。
也可能低概率结果集中命中。
也可能赛程阶段较简单。
也可能模型刚好适合这段时间。

期望值需要长期样本验证。

不能用短期结果得出结论。

比如一个策略真实 EV 是 0。

也就是长期没有优势。

但在 20 场里完全可能表现很好。

同样,一个真实正期望策略,在 20 场里也可能表现很差。

所以,EV 评估必须有足够样本。

并且最好分:

联赛;
赛季;
时间段;
概率区间;
模型类型。

短期 EV 只能作为观察,不能作为结论。


十四、模型评估里,EV 应该怎么用?

在足球模型评估里,EV 可以作为一个参考维度,但不应该单独决定模型好坏。

更基础的评估仍然是:

LogLoss;
Brier Score;
概率校准;
分联赛表现;
分时间段稳定性;
模型是否过拟合;
是否存在未来数据泄漏。

为什么?

因为 EV 依赖外部价格和模型概率。

如果模型概率不校准,EV 不可信。

如果外部数据质量不稳定,EV 也不稳定。

如果只在某些筛选样本上看 EV,也可能被样本选择影响。

所以正确顺序是:

第一,先让模型概率可信。
第二,验证概率校准和回测稳定。
第三,再比较模型概率和外部预期。
第四,最后再计算 EV 作为研究指标。

不要反过来。

不要一开始就用 EV 指导模型训练,而忽略概率质量。


十五、期望值和“好比赛识别”的关系

期望值可以帮助识别哪些比赛更值得研究。

但不能只看 EV 数字。

一个模型可能在某场比赛上算出高 EV。

但如果这场比赛:

模型分歧很大;
数据缺失明显;
临场变量关键;
平局模型不稳定;
联赛样本不足;
概率校准较差;

那么这个 EV 就要谨慎看。

成熟系统应该同时看:

模型概率;
模型一致性;
概率校准;
外部预期差异;
比赛数据质量;
模型历史表现;
风险分层。

一个高 EV 但高不确定性的比赛,不一定是好比赛。

一个中等 EV 但模型高度一致、校准稳定的比赛,反而可能更适合研究。

所以,好比赛识别不是只看 EV。

EV 是其中一层。


十六、用一个完整例子理解 EV

假设有一场比赛,模型输出:

主胜概率:56%
平局概率:27%
客胜概率:17%

外部赔率假设为:

主胜赔率:1.75
平局赔率:3.40
客胜赔率:4.80

现在分别计算 EV。

主胜 EV

EV_home = 0.56 × 1.75 - 1
EV_home = 0.98 - 1
EV_home = -0.02

主胜虽然概率最高,但 EV 是负的。

平局 EV

EV_draw = 0.27 × 3.40 - 1
EV_draw = 0.918 - 1
EV_draw = -0.082

平局也是负的。

客胜 EV

EV_away = 0.17 × 4.80 - 1
EV_away = 0.816 - 1
EV_away = -0.184

客胜也负。

这说明:

虽然主胜概率最高,但在这个外部定价下,三个结果都没有正期望。

这很正常。

并不是每场比赛都有价值。

很多比赛模型和外部预期差不多,甚至模型认为没有优势。

模型真正应该做的是识别:

有价值的概率差异,而不是每场都强行输出结论。


十七、再看一个主胜不是最高 EV 的例子

模型输出:

主胜概率:48%
平局概率:30%
客胜概率:22%

外部赔率:

主胜赔率:1.95
平局赔率:3.80
客胜赔率:4.20

计算:

主胜

EV_home = 0.48 × 1.95 - 1
EV_home = 0.936 - 1
EV_home = -0.064

平局

EV_draw = 0.30 × 3.80 - 1
EV_draw = 1.14 - 1
EV_draw = +0.14

客胜

EV_away = 0.22 × 4.20 - 1
EV_away = 0.924 - 1
EV_away = -0.076

这里主胜概率最高,但主胜 EV 为负。

平局不是最高概率,但 EV 为正。

这说明:

最高概率结果不一定最有价值。

价值来自模型概率和外部预期之间的差异。

当然,这仍然要求模型的 30% 平局概率可信。

如果模型长期高估平局,这个 EV 就是假的。


十八、期望值为什么必须和概率校准绑定?

期望值公式很简单:

EV = p × O - 1

但这里最重要的是 p。

p 是模型概率。

如果 p 错,EV 就错。

举个例子。

模型认为平局概率:

p = 0.30

赔率:

O = 3.80

算出:

EV = 0.30 × 3.80 - 1 = +0.14

看起来不错。

但如果模型平局概率长期高估,真实概率只有:

p = 0.24

那么真实 EV:

EV = 0.24 × 3.80 - 1
EV = 0.912 - 1
EV = -0.088

正期望变负期望。

所以,模型概率不校准时,EV 没有意义。

这也是为什么在模型训练专题里,概率校准比短期结果更重要。

你不能拿一个不可信概率去算期望值。

那只是把错误包装成精确数字。


十九、期望值和模型训练目标的关系

很多人会问:

既然 EV 很重要,那模型训练目标是不是应该直接最大化 EV?

这个问题要谨慎。

在研究上,可以分析模型输出与 EV 的关系。

但模型训练阶段,更基础的目标应该是:

概率预测准确;
概率校准稳定;
LogLoss 和 Brier Score 合理;
时间回测稳定;
不同联赛表现可控。

原因是:

EV 依赖外部赔率;
外部赔率本身可能有变化;
不同数据源口径不同;
EV 容易被模型过度自信放大;
如果直接追求历史 EV,很容易过拟合到历史市场环境。

所以,基础模型应该先训练成一个可信概率模型。

然后再研究概率差异和期望值。

顺序不能倒。

先概率,后 EV。


二十、为什么“看对方向”不等于有价值?

在足球模型里,这句话非常重要。

比如模型经常判断主队方向。

结果很多场主队确实赢了。

但如果这些主胜都是低回报结构,并且模型概率没有超过外部预期,那长期未必有价值。

看对方向,只说明你判断了最高概率结果。

但期望值问的是:

这个结果的概率是否被低估?

如果一个结果本来就很热门,外部已经充分反映了它的概率,那么看对它并不等于有价值。

举个例子。

模型认为主胜 70%。

外部隐含概率也大约 70%。

那就没有明显概率差。

你看对了主胜,也只是看对了一个大家都知道的高概率结果。

长期价值不来自“看对热门”。

而来自“模型概率比外部预期更接近真实”。

这就是期望值思维和普通命中率思维的区别。


二十一、期望值和回撤的关系

一个正期望模型,仍然会有回撤。

假设某策略长期 EV 为:

+0.05

也就是每次平均正 0.05 个单位。

这听起来不错。

但单场结果仍然会波动。

如果命中率不是特别高,连续不理想很正常。

即使命中率较高,低回报结构下几次失败也会产生明显回撤。

所以,评估模型时不能只看 EV。

还要看:

最大回撤;
连续低谷;
收益曲线波动;
不同时间段表现;
样本量是否足够;
是否过度集中在某类结果。

EV 告诉你长期平均方向。

回撤告诉你过程有多难受。

没有回撤信息的 EV,是不完整的。


二十二、普通读者如何正确理解 EV?

如果读者不想记太多公式,只要记住四句话。

第一:

命中率高,不等于有价值。

第二:

每个赔率都有对应的最低命中率要求。

第三:

期望值取决于模型概率和外部定价之间的差异。

第四:

模型概率不校准,EV 就不可信。

如果能理解这四句,就不会被“高命中率”“最近很准”“低风险”“看对很多场”轻易误导。


二十三、本章实操检查清单

评估模型或某类策略的期望值时,可以检查:

1. 模型输出的是概率,还是硬判断?
2. 模型概率是否经过长期校准?
3. 是否知道对应外部赔率或隐含概率?
4. 是否计算盈亏平衡命中率?
5. 是否只看命中率,而没有看赔率结构?
6. 是否存在低赔率高命中错觉?
7. 是否样本量足够大?
8. 是否分联赛、分时间段评估?
9. 是否检查最大回撤?
10. 是否比较短期 EV 和长期 EV?
11. 是否存在模型过度自信导致的虚假 EV?
12. 是否把最高概率结果误认为最高价值结果?

这些问题比一句“命中率多少”重要得多。


本章小结

期望值衡量的是长期平均结果。

最基础公式是:

EV = P(成功) × 收益 - P(失败) × 损失

在赔率结构里,可以简化为:

EV = p × O - 1

其中:

p = 模型估计概率
O = 赔率

如果:

EV > 0

表示模型认为长期有正期望。

但这个结论成立的前提是:

模型概率 p 必须可信。

如果模型概率不校准,EV 也不可信。

命中率高不等于有价值。
低赔率高命中也可能长期没有优势。
最高概率结果不一定最有价值。
看对方向不等于有正期望。
正期望也不代表过程平滑。

足球模型真正要做的是:

先训练可信概率;
再比较外部预期;
再分析期望值;
最后结合方差、回撤和长期样本判断是否稳定。

下一章我们继续讲:

方差是什么?为什么足球模型短期表现会大起大落。

本文仅供足球数据研究和模型训练学习参考,不构成任何投注建议。