足球预测模型实战

期望值是什么？为什么命中率高不等于模型有价值

期望值衡量的是长期平均结果。足球模型不能只看命中率，还要看概率、回报结构和错误成本。

2026-05-16浏览 4

常用工具 把文章思路落到比赛数据和方案试算里

竞彩计算器方案试算 足球扫盘赛事分布 冷门预警风险观察

正文：17px

很多人评估足球模型，第一反应还是看命中率。

模型最近 10 场中了 7 场。
某个策略命中率 65%。
某个结果方向长期命中率 70%。
某个推荐号说自己 80% 命中。

这些数字看起来都很直观。

但如果你真正做足球模型，就必须理解一个更重要的概念：

期望值。

因为命中率只回答一个问题：

对了多少次。

但它没有回答：

对一次带来多少收益？
错一次损失多少？
这个概率对应的回报结构是否合理？
长期平均下来到底是正还是负？
模型看对的那些场次，是否足以覆盖看错的成本？

所以，单独看命中率是不够的。

甚至在某些情况下，命中率很高，也可能没有长期价值。

这听起来反直觉，但数学上非常清楚。

这一章要讲的，就是足球模型里最容易被误解的一个问题：

为什么命中率高，不等于模型有价值。

一、什么是期望值？

期望值可以理解成：

如果一件事重复发生很多次，每次平均下来大概得到什么结果。

它不是看某一次。

它看长期平均。

最简单的公式是：

期望值 = 成功概率 × 成功结果 + 失败概率 × 失败结果

如果成功时结果是正的，失败时结果是负的，就可以写成：

EV = P(成功) × 收益 - P(失败) × 损失

其中：

EV = Expected Value，期望值
P(成功) = 成功概率
P(失败) = 失败概率
收益 = 成功一次得到的净结果
损失 = 失败一次损失的结果

如果：

EV > 0

表示长期平均是正的。

如果：

EV = 0

表示长期平均大致持平。

如果：

EV < 0

表示长期平均是负的。

这就是期望值最基本的含义。

二、一个简单例子：命中率 80%，也可能是负期望

假设有一个游戏。

每次成功，赚 1 元。

每次失败，亏 10 元。

成功概率是 80%。

失败概率是 20%。

很多人一看 80% 成功率，会觉得很好。

但算期望值：

EV = 80% × 1 - 20% × 10

换成小数：

EV = 0.80 × 1 - 0.20 × 10

计算：

EV = 0.80 - 2.00 = -1.20

也就是说，这个游戏虽然成功率 80%，但长期每次平均亏 1.20 元。

为什么？

因为失败一次的代价太大。

这个例子说明一个非常重要的原则：

命中率不能脱离收益和损失单独看。

命中率高，不代表长期结果好。

关键要看：

对一次赚多少；
错一次亏多少；
成功概率是否足够覆盖失败损失。

足球模型评估也是一样。

三、为什么足球模型里会出现“高命中率但没价值”？

在足球模型里，很多高命中率来自高概率低回报事件。

例如某个结果本来就很容易发生，所以模型经常能判断对。

但因为它本来就容易发生，外部定价也会很低。

这意味着：

对一次带来的回报很小；
错一次的损失可能抵消多次正确。

举一个通俗例子。

假设某类结果的平均赔率是：

1.25

如果按 1 个单位计算，成功一次的净收益是：

1.25 - 1 = 0.25

失败一次损失：

如果一个模型在这类结果上命中率是 80%。

看起来很高。

但期望值是：

EV = 80% × 0.25 - 20% × 1

换成小数：

EV = 0.80 × 0.25 - 0.20 × 1

计算：

EV = 0.20 - 0.20 = 0

也就是说，80% 命中率在平均赔率 1.25 的结构下，只是刚好持平。

如果实际命中率只有 78%，就会变成负的：

EV = 0.78 × 0.25 - 0.22 × 1
EV = 0.195 - 0.22 = -0.025

所以，高命中率并不自动代表正期望。

它必须配得上对应的回报结构。

四、盈亏平衡命中率：每个赔率都有最低要求

要判断一个命中率有没有价值，可以先看盈亏平衡命中率。

公式很简单：

盈亏平衡命中率 = 1 / 赔率

这个公式的意思是：

如果长期命中率刚好等于这个值，那么长期大致不赚不亏。

如果命中率高于这个值，才可能有正期望。

如果低于这个值，就是负期望。

举几个例子。

平均赔率 2.00

盈亏平衡命中率 = 1 / 2.00 = 50%

如果长期命中率超过 50%，才有正期望空间。

平均赔率 1.50

盈亏平衡命中率 = 1 / 1.50 = 66.7%

也就是说，命中率必须超过约 66.7%，才可能有正期望。

平均赔率 1.30

盈亏平衡命中率 = 1 / 1.30 = 76.9%

平均赔率 1.20

盈亏平衡命中率 = 1 / 1.20 = 83.3%

这组数字非常关键。

它告诉你：

平均赔率越低，对命中率要求越高。

所以，看到“命中率 70%”，不能直接说好。

要问：

它对应的平均赔率是多少？

如果平均赔率是 1.20，70% 很差。
如果平均赔率是 1.50，70% 略有空间。
如果平均赔率是 2.00，70% 非常强。

命中率必须放在赔率结构里理解。

五、同样 65% 命中率，结果可能完全不同

假设有三个模型，命中率都是 65%。

但它们对应的平均赔率不同。

模型 A：平均赔率 1.30

成功一次净收益：

1.30 - 1 = 0.30

65% 命中率的期望值：

EV = 65% × 0.30 - 35% × 1

换成小数：

EV = 0.65 × 0.30 - 0.35 × 1
EV = 0.195 - 0.35 = -0.155

负期望。

模型 B：平均赔率 1.60

成功一次净收益：

1.60 - 1 = 0.60

期望值：

EV = 0.65 × 0.60 - 0.35 × 1
EV = 0.39 - 0.35 = +0.04

略微正期望。

模型 C：平均赔率 2.00

成功一次净收益：

2.00 - 1 = 1.00

期望值：

EV = 0.65 × 1.00 - 0.35 × 1
EV = 0.65 - 0.35 = +0.30

明显更好。

三个模型命中率一样，长期价值完全不同。

所以，单独展示命中率是没有上下文的。

真正要看：

命中率 + 平均赔率 + 样本量 + 回撤 + 概率校准

缺任何一块，判断都不完整。

六、期望值和足球模型有什么关系？

足球模型本身输出的是概率。

例如：

主胜概率：58%
平局概率：26%
客胜概率：16%

这只是模型对比赛结果的估计。

如果只做足球数据研究，模型概率可以用于理解比赛结构。

比如：

主队优势是否明显；
平局风险是否高；
结果分布是否分散。

但如果要判断某个模型结果是否具有长期价值，就必须引入期望值概念。

因为长期价值不是看概率高低，而是看：

模型概率是否高于外部隐含概率

用普通话说：

如果模型认为某结果真实发生概率是 60%，但外部定价只相当于 50%，那说明模型和外部预期有差异。

这个差异是否真实可靠，需要长期验证。

如果模型认为概率是 60%，外部也认为是 60%，那就没有明显优势。

所以，模型概率本身不等于价值。

价值来自：

模型概率 - 外部隐含概率

但这个差值必须非常谨慎对待。

因为模型概率可能错。

如果模型过度自信，就会制造虚假的正期望。

七、为什么“最高概率结果”不一定最有价值？

很多人以为：

概率最高的结果，就是最有价值的结果。

这不一定。

假设一场比赛模型输出：

主胜：62%
平局：24%
客胜：14%

主胜是最高概率。

但如果外部预期已经把主胜看得非常高，主胜未必有价值。

再看另一种情况：

模型输出：

主胜：46%
平局：31%
客胜：23%

主胜仍然最高，但概率不厚。

如果外部预期把主胜看得更高，比如隐含概率接近 55%，那主胜甚至可能被高估。

还有一种情况。

模型输出：

主胜：45%
平局：32%
客胜：23%

平局不是最高概率。

但如果外部对平局的预期很低，而模型认为平局风险明显高于外部，那么平局在研究上更值得关注。

所以，价值不是看哪个结果概率最高。

而是看：

模型概率和外部预期之间是否存在可信差异

这就是期望值思维。

八、期望值公式如何用于模型概率？

假设某个结果的赔率是：

模型认为这个结果发生概率是：

成功时净收益是：

O - 1

失败时损失是：

那么期望值：

EV = p × (O - 1) - (1 - p) × 1

整理一下：

EV = p × O - 1

这是一个非常重要的简化公式。

其中：

p = 模型估计概率
O = 赔率
EV = 每投入1个单位的期望值

如果：

EV > 0

表示模型认为有正期望。

如果：

EV = 0

表示刚好持平。

如果：

EV < 0

表示负期望。

举例。

模型认为主胜概率：

p = 0.60

外部赔率：

O = 1.80

则：

EV = 0.60 × 1.80 - 1
EV = 1.08 - 1
EV = 0.08

也就是：

EV = +0.08

表示每 1 个单位长期期望为 +0.08。

但是，这个计算成立的前提是：

模型概率 60% 是可信的。

如果模型实际校准后只有 52%，那么：

EV = 0.52 × 1.80 - 1
EV = 0.936 - 1
EV = -0.064

就变成负期望。

所以，期望值高度依赖概率校准。

模型概率不可信，EV 也不可信。

九、为什么模型过度自信会制造假 EV？

这是足球模型里非常常见的问题。

假设模型实际没有那么准，但它经常把概率估得很高。

例如真实概率可能只有：

55%

但模型输出：

65%

如果外部赔率是：

1.70

用模型概率算：

EV = 0.65 × 1.70 - 1
EV = 1.105 - 1 = +0.105

看起来是正期望。

但真实概率如果是 55%：

EV = 0.55 × 1.70 - 1
EV = 0.935 - 1 = -0.065

实际上是负的。

这就是过度自信模型最危险的地方。

它会让你以为发现了价值。

但这个价值只是模型概率高估造成的幻觉。

所以，期望值计算必须建立在概率校准基础上。

没有校准，EV 可能只是数学幻觉。

十、为什么低赔率最容易制造“稳但没价值”的错觉？

低赔率结果通常发生概率高。

所以看起来更容易命中。

比如平均赔率：

1.25

它的盈亏平衡命中率是：

1 / 1.25 = 80%

也就是说，长期要超过 80% 命中率才可能有正期望。

如果某个模型在这类结果上命中率 78%，很多人会觉得很高。

但实际上：

EV = 0.78 × 1.25 - 1
EV = 0.975 - 1 = -0.025

仍然是负的。

低赔率的特点是：

命中率看起来高；
每次收益低；
一次错误抵消多次正确；
需要极高命中率才能正期望。

所以，低赔率不能简单理解成低风险。

它只是发生概率高。

是否有长期价值，要看模型概率是否超过赔率对应的盈亏平衡点。

十一、为什么高赔率也不一定有价值？

反过来，高赔率也不等于有价值。

假设某结果赔率是：

3.50

盈亏平衡命中率：

1 / 3.50 = 28.57%

如果模型认为真实概率是 25%，那期望值：

EV = 0.25 × 3.50 - 1
EV = 0.875 - 1 = -0.125

仍然是负的。

如果模型认为概率是 32%：

EV = 0.32 × 3.50 - 1
EV = 1.12 - 1 = +0.12

才是正的。

所以高赔率只是说明外部认为它发生概率低。

它不自动有价值。

高赔率结果命中率低，回撤可能大，方差也会更大。

判断价值仍然要回到：

模型概率 × 赔率 - 1

以及模型概率是否可信。

十二、期望值和方差不是一回事

很多人以为只要 EV 为正，就会稳定。

不是。

期望值回答的是长期平均。

方差回答的是过程波动。

一个正期望模型，也可能经历长时间低谷。

比如一个高赔率模型：

命中率：32%
平均赔率：3.50

期望值：

EV = 0.32 × 3.50 - 1 = +0.12

长期看是正的。

但失败概率是：

68%

这意味着它会经常错。

连续几场不理想很正常。

它有正期望，但过程波动大。

再比如低赔率模型：

命中率：84%
平均赔率：1.25

期望值：

EV = 0.84 × 1.25 - 1 = +0.05

长期略正。

但一次失败会抵消多次成功。

它看起来更平滑，但也有回撤。

所以，评估模型不能只看 EV。

还要看方差和最大回撤。

正期望不等于每天顺。

十三、为什么短期 EV 也会骗人？

假设某模型最近 20 场表现很好。

算出来 EV 很高。

这能说明长期有优势吗？

不一定。

因为样本太小。

20 场里可能刚好高概率结果频繁发生。
也可能低概率结果集中命中。
也可能赛程阶段较简单。
也可能模型刚好适合这段时间。

期望值需要长期样本验证。

不能用短期结果得出结论。

比如一个策略真实 EV 是 0。

也就是长期没有优势。

但在 20 场里完全可能表现很好。

同样，一个真实正期望策略，在 20 场里也可能表现很差。

所以，EV 评估必须有足够样本。

并且最好分：

联赛；
赛季；
时间段；
概率区间；
模型类型。

短期 EV 只能作为观察，不能作为结论。

十四、模型评估里，EV 应该怎么用？

在足球模型评估里，EV 可以作为一个参考维度，但不应该单独决定模型好坏。

更基础的评估仍然是：

LogLoss；
Brier Score；
概率校准；
分联赛表现；
分时间段稳定性；
模型是否过拟合；
是否存在未来数据泄漏。

为什么？

因为 EV 依赖外部价格和模型概率。

如果模型概率不校准，EV 不可信。

如果外部数据质量不稳定，EV 也不稳定。

如果只在某些筛选样本上看 EV，也可能被样本选择影响。

所以正确顺序是：

第一，先让模型概率可信。
第二，验证概率校准和回测稳定。
第三，再比较模型概率和外部预期。
第四，最后再计算 EV 作为研究指标。

不要反过来。

不要一开始就用 EV 指导模型训练，而忽略概率质量。

十五、期望值和“好比赛识别”的关系

期望值可以帮助识别哪些比赛更值得研究。

但不能只看 EV 数字。

一个模型可能在某场比赛上算出高 EV。

但如果这场比赛：

模型分歧很大；
数据缺失明显；
临场变量关键；
平局模型不稳定；
联赛样本不足；
概率校准较差；

那么这个 EV 就要谨慎看。

成熟系统应该同时看：

模型概率；
模型一致性；
概率校准；
外部预期差异；
比赛数据质量；
模型历史表现；
风险分层。

一个高 EV 但高不确定性的比赛，不一定是好比赛。

一个中等 EV 但模型高度一致、校准稳定的比赛，反而可能更适合研究。

所以，好比赛识别不是只看 EV。

EV 是其中一层。

十六、用一个完整例子理解 EV

假设有一场比赛，模型输出：

主胜概率：56%
平局概率：27%
客胜概率：17%

外部赔率假设为：

主胜赔率：1.75
平局赔率：3.40
客胜赔率：4.80

现在分别计算 EV。

主胜 EV

EV_home = 0.56 × 1.75 - 1
EV_home = 0.98 - 1
EV_home = -0.02

主胜虽然概率最高，但 EV 是负的。

平局 EV

EV_draw = 0.27 × 3.40 - 1
EV_draw = 0.918 - 1
EV_draw = -0.082

平局也是负的。

客胜 EV

EV_away = 0.17 × 4.80 - 1
EV_away = 0.816 - 1
EV_away = -0.184

客胜也负。

这说明：

虽然主胜概率最高，但在这个外部定价下，三个结果都没有正期望。

这很正常。

并不是每场比赛都有价值。

很多比赛模型和外部预期差不多，甚至模型认为没有优势。

模型真正应该做的是识别：

有价值的概率差异，而不是每场都强行输出结论。

十七、再看一个主胜不是最高 EV 的例子

模型输出：

主胜概率：48%
平局概率：30%
客胜概率：22%

外部赔率：

主胜赔率：1.95
平局赔率：3.80
客胜赔率：4.20

计算：

主胜

EV_home = 0.48 × 1.95 - 1
EV_home = 0.936 - 1
EV_home = -0.064

平局

EV_draw = 0.30 × 3.80 - 1
EV_draw = 1.14 - 1
EV_draw = +0.14

客胜

EV_away = 0.22 × 4.20 - 1
EV_away = 0.924 - 1
EV_away = -0.076

这里主胜概率最高，但主胜 EV 为负。

平局不是最高概率，但 EV 为正。

这说明：

最高概率结果不一定最有价值。

价值来自模型概率和外部预期之间的差异。

当然，这仍然要求模型的 30% 平局概率可信。

如果模型长期高估平局，这个 EV 就是假的。

十八、期望值为什么必须和概率校准绑定？

期望值公式很简单：

EV = p × O - 1

但这里最重要的是 p。

p 是模型概率。

如果 p 错，EV 就错。

举个例子。

模型认为平局概率：

p = 0.30

赔率：

O = 3.80

算出：

EV = 0.30 × 3.80 - 1 = +0.14

看起来不错。

但如果模型平局概率长期高估，真实概率只有：

p = 0.24

那么真实 EV：

EV = 0.24 × 3.80 - 1
EV = 0.912 - 1
EV = -0.088

正期望变负期望。

所以，模型概率不校准时，EV 没有意义。

这也是为什么在模型训练专题里，概率校准比短期结果更重要。

你不能拿一个不可信概率去算期望值。

那只是把错误包装成精确数字。

十九、期望值和模型训练目标的关系

很多人会问：

既然 EV 很重要，那模型训练目标是不是应该直接最大化 EV？

这个问题要谨慎。

在研究上，可以分析模型输出与 EV 的关系。

但模型训练阶段，更基础的目标应该是：

概率预测准确；
概率校准稳定；
LogLoss 和 Brier Score 合理；
时间回测稳定；
不同联赛表现可控。

原因是：

EV 依赖外部赔率；
外部赔率本身可能有变化；
不同数据源口径不同；
EV 容易被模型过度自信放大；
如果直接追求历史 EV，很容易过拟合到历史市场环境。

所以，基础模型应该先训练成一个可信概率模型。

然后再研究概率差异和期望值。

顺序不能倒。

先概率，后 EV。

二十、为什么“看对方向”不等于有价值？

在足球模型里，这句话非常重要。

比如模型经常判断主队方向。

结果很多场主队确实赢了。

但如果这些主胜都是低回报结构，并且模型概率没有超过外部预期，那长期未必有价值。

看对方向，只说明你判断了最高概率结果。

但期望值问的是：

这个结果的概率是否被低估？

如果一个结果本来就很热门，外部已经充分反映了它的概率，那么看对它并不等于有价值。

举个例子。

模型认为主胜 70%。

外部隐含概率也大约 70%。

那就没有明显概率差。

你看对了主胜，也只是看对了一个大家都知道的高概率结果。

长期价值不来自“看对热门”。

而来自“模型概率比外部预期更接近真实”。

这就是期望值思维和普通命中率思维的区别。

二十一、期望值和回撤的关系

一个正期望模型，仍然会有回撤。

假设某策略长期 EV 为：

+0.05

也就是每次平均正 0.05 个单位。

这听起来不错。

但单场结果仍然会波动。

如果命中率不是特别高，连续不理想很正常。

即使命中率较高，低回报结构下几次失败也会产生明显回撤。

所以，评估模型时不能只看 EV。

还要看：

最大回撤；
连续低谷；
收益曲线波动；
不同时间段表现；
样本量是否足够；
是否过度集中在某类结果。

EV 告诉你长期平均方向。

回撤告诉你过程有多难受。

没有回撤信息的 EV，是不完整的。

二十二、普通读者如何正确理解 EV？

如果读者不想记太多公式，只要记住四句话。

第一：

命中率高，不等于有价值。

第二：

每个赔率都有对应的最低命中率要求。

第三：

期望值取决于模型概率和外部定价之间的差异。

第四：

模型概率不校准，EV 就不可信。

如果能理解这四句，就不会被“高命中率”“最近很准”“低风险”“看对很多场”轻易误导。

二十三、本章实操检查清单

评估模型或某类策略的期望值时，可以检查：

1. 模型输出的是概率，还是硬判断？
2. 模型概率是否经过长期校准？
3. 是否知道对应外部赔率或隐含概率？
4. 是否计算盈亏平衡命中率？
5. 是否只看命中率，而没有看赔率结构？
6. 是否存在低赔率高命中错觉？
7. 是否样本量足够大？
8. 是否分联赛、分时间段评估？
9. 是否检查最大回撤？
10. 是否比较短期 EV 和长期 EV？
11. 是否存在模型过度自信导致的虚假 EV？
12. 是否把最高概率结果误认为最高价值结果？

这些问题比一句“命中率多少”重要得多。

本章小结

期望值衡量的是长期平均结果。

最基础公式是：

EV = P(成功) × 收益 - P(失败) × 损失

在赔率结构里，可以简化为：

EV = p × O - 1

其中：

p = 模型估计概率
O = 赔率

如果：

EV > 0

表示模型认为长期有正期望。

但这个结论成立的前提是：

模型概率 p 必须可信。

如果模型概率不校准，EV 也不可信。

命中率高不等于有价值。
低赔率高命中也可能长期没有优势。
最高概率结果不一定最有价值。
看对方向不等于有正期望。
正期望也不代表过程平滑。

足球模型真正要做的是：

先训练可信概率；
再比较外部预期；
再分析期望值；
最后结合方差、回撤和长期样本判断是否稳定。

下一章我们继续讲：

方差是什么？为什么足球模型短期表现会大起大落。

本文仅供足球数据研究和模型训练学习参考，不构成任何投注建议。