前面几章讲了三个基础问题。
第一,足球预测模型训练的不是确定答案,而是概率。
第二,模型只能使用赛前可得数据,不能把赛后信息或未来数据混进特征。
第三,泊松模型适合从预期进球出发,生成比分矩阵和总进球概率。
但足球模型不可能只靠泊松。
泊松模型很适合处理进球分布,可是足球比赛还有很多复杂因素:
球队近期状态不是线性变化;
强弱差距不是越大越简单;
主客场影响会和联赛风格交互;
赛程压力可能只在某些球队身上明显;
平局不是简单夹在主胜和客胜中间;
某些比赛结构很难只用进球均值解释。
这时候,就需要机器学习模型来学习更复杂的关系。
在足球胜平负建模中,两个非常常见、也很有代表性的模型是:
逻辑回归
LightGBM
逻辑回归的优点是简单、稳定、可解释,适合作为基线模型。
LightGBM 的优点是表达能力强,适合处理表格数据里的非线性关系和特征交互。
这一章要讲清楚:
逻辑回归和 LightGBM 分别在足球模型里解决什么问题;
胜平负模型到底应该怎么训练;
为什么不能只看硬分类命中率;
为什么 LightGBM 强,但不能神化;
为什么一个真正可用的足球模型系统,应该同时重视基线模型和复杂模型。
一、胜平负模型的目标:输出三类概率,而不是只输出一个结果
胜平负模型的标签有三类:
H = 主胜
D = 平局
A = 客胜
模型输入是一场比赛的赛前特征。
例如:
双方长期强弱差异
近期进攻状态
近期防守状态
主客场表现
赛程间隔
联赛环境
近期状态差异
模型输出应该是三类概率:
P(H) = 主胜概率
P(D) = 平局概率
P(A) = 客胜概率
并且必须满足:
P(H) + P(D) + P(A) = 1
例如某场比赛模型输出:
P(H) = 0.51
P(D) = 0.28
P(A) = 0.21
这表示:
主胜是最高概率结果,但平局和客胜合计仍然有 49%。
如果只把这场比赛写成:
预测:主胜
信息量是不够的。
因为主胜 51% 和主胜 78%,完全不是同一种比赛。
胜平负模型真正有价值的地方,不是告诉你“主队赢”,而是告诉你:
主队优势有多厚;
平局风险有多高;
客胜概率是否被明显压低;
这场比赛结果分布是集中还是分散。
所以,本章所有模型都默认一个原则:
模型输出必须是概率,而不是只输出硬分类。
二、先不要急着上复杂模型,必须先有基线模型
很多人一开始做足球模型,直接上 LightGBM。
甚至一开始就想上神经网络、深度学习、多模型融合。
这不是最稳的路线。
真正专业的训练流程里,应该先建立基线模型。
基线模型的作用不是追求最强,而是回答几个基础问题:
当前特征是否真的有信息量;
简单模型能做到什么水平;
复杂模型是否真的带来提升;
模型输出是否符合足球常识;
特征方向是否合理。
如果没有基线模型,你很难判断 LightGBM 的提升是真是假。
例如你训练了一个 LightGBM,回测命中率 54%。
看起来还可以。
但如果逻辑回归基线也能做到 53.5%,那 LightGBM 的提升并不明显。
如果 LightGBM 训练集表现很好,测试集只比基线高一点,甚至更差,那可能说明它学到了历史噪音。
所以,一个成熟的足球模型系统,不能只追求复杂。
应该先问:
简单模型能做到什么程度?复杂模型是否真的超过它?
逻辑回归就是非常适合作为基线的模型。
三、逻辑回归是什么?它不是只能做“线性分类”
逻辑回归这个名字容易让人误解。
很多人看到“回归”,以为它是预测连续数值。
但在机器学习里,逻辑回归常用于分类概率建模。
最常见的是二分类。
例如预测:
主队是否获胜
总进球是否达到某个区间
主队是否不败
二分类逻辑回归的输出是:
P(y = 1 | x)
意思是:
在给定赛前特征 x 的情况下,标签 y=1 的概率是多少。
它的核心形式可以写成:
p = 1 / (1 + e^(-z))
其中:
p = 事件发生概率
z = b + w1*x1 + w2*x2 + ... + wn*xn
b = 截距
w1, w2, ..., wn = 各个特征的权重
x1, x2, ..., xn = 输入特征
e = 自然常数
逻辑回归先把特征做线性组合:
z = b + w1*x1 + w2*x2 + ... + wn*xn
再用 sigmoid 函数把 z 转成 0 到 1 之间的概率:
p = 1 / (1 + e^(-z))
在足球里,如果做“主队是否获胜”模型:
y = 1 表示主胜
y = 0 表示非主胜
模型输出:
p = 主队获胜概率
例如输出:
p = 0.58
表示模型认为主队获胜概率约为 58%。
四、逻辑回归如何做胜平负三分类?
胜平负是三分类问题,不是简单二分类。
逻辑回归也可以扩展为多分类,常用方式是 Softmax。
模型输出三个分数:
z_H = 主胜分数
z_D = 平局分数
z_A = 客胜分数
然后用 Softmax 转成概率:
P(H) = e^(z_H) / (e^(z_H) + e^(z_D) + e^(z_A))
P(D) = e^(z_D) / (e^(z_H) + e^(z_D) + e^(z_A))
P(A) = e^(z_A) / (e^(z_H) + e^(z_D) + e^(z_A))
这样保证:
P(H) + P(D) + P(A) = 1
在足球场景里,Softmax 逻辑回归可以直接训练胜平负三分类概率。
当然,也可以拆成多个二分类模型,例如:
主胜 vs 非主胜
平局 vs 非平局
客胜 vs 非客胜
但如果最终要得到完整胜平负概率分布,三分类 Softmax 更自然。
无论使用哪种方式,都要保证输出概率可解释、可校准。
五、逻辑回归的最大优点:可解释
逻辑回归的优势不是最强性能,而是可解释。
它的每个特征都有权重。
例如某个胜平负模型中,某些特征对主胜概率影响为正,某些为负。
如果一个特征权重为正,表示这个特征越大,主胜概率越容易上升。
如果权重为负,表示这个特征越大,主胜概率越容易下降。
举一个简化例子。
假设一个“主队是否获胜”的逻辑回归模型使用几个特征:
双方强弱差
主队近期进攻
客队近期防守弱度
主队休息天数优势
客队近期状态
如果模型学到:
双方强弱差:正权重
主队近期进攻:正权重
客队近期防守弱度:正权重
主队休息天数优势:正权重
客队近期状态:负权重
这很符合足球常识。
表示:
主队越强,主胜概率越高;
主队近期进攻越好,主胜概率越高;
客队防守越弱,主胜概率越高;
主队休息更充分,主胜概率可能更高;
客队状态越好,主胜概率会下降。
这种结果可以帮助你检查特征方向是否合理。
如果模型学到的方向明显违背常识,就要检查:
特征是否构造错误;
是否存在未来数据泄漏;
样本是否过小;
是否受极端值影响;
是否存在共线性;
标签是否生成错误。
这就是逻辑回归作为基线模型的价值。
它不一定最强,但很适合排查问题。
六、逻辑回归的局限:足球关系很多不是线性的
逻辑回归的核心假设是:
特征对结果的影响可以通过线性组合表达。
也就是:
z = b + w1*x1 + w2*x2 + ... + wn*xn
这在很多情况下不够。
足球比赛里,很多关系不是简单线性。
例如休息天数。
休息 2 天和休息 5 天差异很大。
但休息 10 天和休息 13 天,不一定继续带来明显提升。
这不是线性关系。
再比如强弱差距。
强弱差距从 0 增加到 100,影响可能明显。
但从 500 增加到 600,边际影响可能没那么大。
再比如近期进球。
一队最近 5 场场均进 2 球,说明进攻不错。
但场均进 4 球可能是短期极端效率,不一定应该线性增加主胜概率。
逻辑回归处理这种关系不够灵活。
当然,可以通过分箱、交互项、非线性变换来改善。
例如把休息天数分成:
0-3天
4-6天
7-10天
10天以上
或者加入特征交互:
强弱差 × 主场因素
进攻强度 × 对手防守弱度
赛程密集 × 阵容深度
但这会增加特征工程复杂度。
而 LightGBM 天然更擅长学习这类非线性和交互关系。
七、LightGBM 为什么适合足球胜平负模型?
LightGBM 是基于梯度提升决策树的模型。
它非常适合表格数据。
足球模型的数据通常就是表格型数据:
每一行是一场比赛;
每一列是一个赛前特征;
标签是胜平负、总进球或其他目标。
LightGBM 能处理很多逻辑回归不擅长的问题。
例如:
非线性关系;
特征交互;
缺失值;
不同特征尺度;
复杂分段规律;
类别特征;
大规模样本训练效率。
足球比赛里,很多影响并不是单独发生,而是组合发生。
比如:
强队优势大,但赛程密集;
主队进攻强,但对手防守很深;
客队状态差,但主队轮换严重;
联赛进球多,但本场双方目标谨慎;
主队 Elo 高,但主力中锋缺阵。
这些组合关系,逻辑回归需要你手工设计交互项。
LightGBM 可以通过树结构自动学习一部分交互。
这就是它适合足球表格数据的重要原因。
八、LightGBM 的直观理解:不断修正前面模型的错误
LightGBM 属于梯度提升模型。
可以用一个简单方式理解:
它不是只训练一棵树,而是训练很多棵树。
每一棵新树都尝试修正前面模型还没学好的部分。
大概过程是:
第一棵树学习一个粗略规律
第二棵树修正第一棵树的错误
第三棵树继续修正前面残留的错误
...
多棵树组合成最终模型
在足球胜平负模型里,第一批树可能学到:
强弱差距大时,强队更容易赢。
后面的树可能继续学到:
但如果强队赛程密集,概率要下调。
再后面的树可能学到:
如果对手客场防守很差,这种下调可以减弱。
再后面可能学到:
在某些低进球联赛里,平局概率要上调。
这就是 LightGBM 的强项。
它能逐步捕捉复杂关系。
但也正因为它能力强,它更容易把历史噪音也学进去。
所以 LightGBM 必须严格回测和防过拟合。
九、LightGBM 可以训练哪些足球目标?
LightGBM 不只适合胜平负。
它可以训练很多标签。
1. 胜平负三分类
标签:
H / D / A
输出:
P(H), P(D), P(A)
这是本章重点。
2. 主胜二分类
标签:
1 = 主胜
0 = 非主胜
输出:
P(主胜)
适合做辅助模型。
3. 平局二分类
标签:
1 = 平局
0 = 非平局
平局很难学,但单独建模有时有助于观察平局风险。
4. 总进球分桶
标签:
0球 / 1球 / 2球 / 3球 / 4球+
输出总进球分布。
5. 低比分或高比分二分类
例如:
1 = 总进球 <= 2
0 = 总进球 >= 3
或者其他分法。
但要注意表达边界,公开文章里应定位为总进球概率研究,不写成投注方向。
6. 模型置信度或好比赛识别
可以训练某些辅助模型,帮助识别模型更容易判断的比赛类型。
但这属于更后面的内容,前期不建议过早复杂化。
十、胜平负 LightGBM 的训练目标是什么?
胜平负 LightGBM 的标签是:
H / D / A
模型输入是赛前特征。
输出是三类概率:
P(H), P(D), P(A)
如果使用多分类训练,模型内部会尝试最小化多分类损失。
常用损失函数是多分类 LogLoss。
公式可以写成普通文本:
LogLoss = - (1/N) × Σ log(p_i)
这里要解释清楚。
N = 样本数量
p_i = 模型给第 i 场比赛真实标签的预测概率
Σ = 对所有样本求和
log = 自然对数
举例。
某场比赛真实结果是主胜。
模型输出:
P(H) = 0.70
P(D) = 0.20
P(A) = 0.10
真实标签是 H,所以 p_i = 0.70。
这场比赛的损失是:
-log(0.70)
如果模型输出:
P(H) = 0.40
P(D) = 0.35
P(A) = 0.25
真实标签仍然是 H,这场损失是:
-log(0.40)
因为 0.40 比 0.70 更低,所以损失更大。
如果模型非常自信地给错了:
P(H) = 0.05
P(D) = 0.20
P(A) = 0.75
真实结果是 H,那么损失是:
-log(0.05)
这个损失会非常大。
这就是 LogLoss 的意义。
它不只关心你猜没猜中,还关心你给真实结果的概率是否合理。
足球模型是概率模型,所以 LogLoss 比单纯命中率更有价值。
十一、为什么 LogLoss 比命中率更适合概率模型?
命中率只看硬分类。
假设两场比赛模型输出:
第一场:
P(H) = 0.41
P(D) = 0.30
P(A) = 0.29
第二场:
P(H) = 0.85
P(D) = 0.10
P(A) = 0.05
两场硬分类都是主胜。
如果最后主队都赢了,命中率都算对。
但第二场模型明显更有信心,且信心被验证。
如果最后都平了,命中率都算错。
但第二场错得更严重,因为它给主胜 85%,却发生了平局。
LogLoss 能区分这种差异。
它会奖励:
给真实结果更高概率的模型。
它会惩罚:
对错误结果过度自信的模型。
这非常适合足球。
因为足球模型最怕的不是偶尔错,而是错得非常自信。
一个模型如果经常把 45% 的主胜说成 80%,即使命中率短期不错,长期概率也不可信。
十二、LightGBM 的输入特征应该怎么控制边界?
公开文章不需要给出内部字段结构,但必须讲清特征边界。
LightGBM 输入特征应该满足:
赛前可得;
足球含义清楚;
计算稳定;
不包含当前比赛结果;
不包含未来数据;
不包含赛后技术统计;
不同时间段可复现。
特征可以来自这些维度:
长期强弱
近期攻防状态
主客场表现
赛程压力
联赛环境
双方差值
历史趋势
外部预期参考
但不能包含:
当前比赛全场比分
当前比赛射门
当前比赛控球率
当前比赛角球
赛季最终排名
赛后积分
未来比赛更新后的 Elo
LightGBM 很强,它会利用任何可用信号。
如果你把未来数据泄漏进去,它会学得非常好。
但那是假的好。
所以,越强的模型,越要守住数据边界。
逻辑回归可能因为表达能力有限,对泄漏没那么敏感。
LightGBM 会把泄漏用到极致。
这也是 LightGBM 回测虚高的常见原因。
十三、LightGBM 训练时最需要关注哪些参数?
公开文章可以讲通用参数含义,不需要暴露内部真实参数。
几个重要参数包括:
1. learning_rate
学习率。
它控制每棵树对最终模型的贡献。
学习率越小,模型学习越慢,通常需要更多树。
学习率太大,模型可能不稳定。
可以理解为:
每一步修正前面错误时,走多大步。
2. n_estimators
树的数量。
树越多,模型表达能力越强。
但树太多也容易过拟合。
通常要配合验证集和 early stopping。
3. num_leaves
每棵树最多有多少叶子节点。
叶子越多,模型可以表达越复杂的关系。
但也越容易过拟合。
足球数据噪音不小,num_leaves 不宜盲目开得太大。
4. min_data_in_leaf
每个叶子节点至少需要多少样本。
这个参数可以防止模型在很少样本上学到过细规律。
如果太小,模型容易记住历史噪音。
5. feature_fraction
每次训练树时随机选择一部分特征。
可以降低过拟合。
6. bagging_fraction
每次训练使用部分样本。
也能帮助提高泛化能力。
7. early_stopping
如果验证集表现长时间没有提升,就停止训练。
这是控制过拟合的重要工具。
这些参数不是越复杂越好。
目标是让模型在未来数据上稳定,而不是在训练集上表现漂亮。
十四、为什么 LightGBM 很容易过拟合足球数据?
足球数据噪音很大。
一场比赛可能被很多随机事件影响:
红牌;
点球;
门将失误;
补时进球;
意外伤退;
天气;
临场轮换;
战术变化。
而 LightGBM 表达能力很强。
它可能学到真实规律,也可能学到历史巧合。
比如某个特征组合在过去某段时间表现很好:
强队主场 + 休息6天 + 客队连续客场 + 某联赛
历史上可能主胜率很高。
但这个组合样本很少。
未来未必继续成立。
如果 LightGBM 过度相信这种小样本组合,就会过拟合。
过拟合表现是:
训练集很好;
验证集一般;
未来测试集下降;
不同时间段表现不稳定;
某些联赛表现很好,换联赛就不行;
短期回测好,长期失效。
所以训练 LightGBM 必须重视时间切分、样本量和过拟合控制。
不要被训练集成绩迷惑。
十五、时间切分比随机切分更重要
足球比赛有时间顺序。
模型真实使用时,永远是用过去预测未来。
所以训练和验证也应该模拟这个过程。
不能随机打乱比赛。
错误方式:
随机抽取80%比赛训练
随机抽取20%比赛测试
问题是:
训练集可能包含未来比赛,测试集可能包含过去比赛。
模型等于用未来信息帮助理解过去。
这种评估会虚高。
更合理的方式是:
较早年份训练
后续年份验证
再后续年份测试
例如:
2018-2022 训练
2023 验证
2024 测试
或者使用滚动回测。
例如:
用2018-2021训练,预测2022
用2018-2022训练,预测2023
用2018-2023训练,预测2024
时间切分可以更真实地模拟未来预测。
对于足球模型,时间切分不是可选项。
是基本要求。
十六、逻辑回归和 LightGBM 应该如何配合?
它们不是对立关系。
更合理的是配合使用。
逻辑回归做基线
它回答:
用简单可解释模型,当前特征能做到什么程度?
如果逻辑回归表现很差,说明特征可能信息不足。
如果逻辑回归表现已经不错,说明特征基础有效。
LightGBM 做增强
它回答:
在同样数据边界下,复杂非线性模型能否带来稳定提升?
如果 LightGBM 只在训练集提升,在未来测试集不提升,说明过拟合。
如果 LightGBM 在多个时间段、多个联赛都稳定提升,说明它确实学到了更多关系。
两者输出可以互相校验
例如某场比赛:
逻辑回归输出:
主胜 54%
平局 27%
客胜 19%
LightGBM 输出:
主胜 72%
平局 18%
客胜 10%
两者差异很大。
这时要谨慎。
可能是 LightGBM 捕捉到了某些非线性因素,也可能是它过度自信。
如果泊松模型也支持主队优势,但不支持过高概率,那么这场比赛可能需要进一步检查。
多模型分歧本身就是一种风险信号。
十七、多模型一致性比单模型高信心更重要
一个模型给出很高概率,不一定可靠。
如果多个不同结构模型都给出类似概率,可信度会提高。
例如:
逻辑回归:
主胜 61%
平局 24%
客胜 15%
LightGBM:
主胜 63%
平局 23%
客胜 14%
泊松汇总:
主胜 60%
平局 25%
客胜 15%
三个模型都接近。
说明这场比赛的概率结构比较一致。
再看另一场:
逻辑回归:
主胜 52%
平局 28%
客胜 20%
LightGBM:
主胜 71%
平局 18%
客胜 11%
泊松汇总:
主胜 49%
平局 30%
客胜 21%
这说明模型之间分歧明显。
这种比赛不一定不能分析,但不适合过度自信。
所以,模型系统不仅要看“最高概率”,还要看“模型之间是否一致”。
这是多模型融合和好比赛识别的基础。
十八、LightGBM 输出的概率一定可信吗?
不一定。
这是非常重要的一点。
很多树模型输出的概率可能没有很好校准。
它可能排序能力不错。
也就是说,它能把更可能发生的比赛排在前面。
但概率值本身可能偏高或偏低。
比如模型输出主胜 70% 的比赛,长期实际主胜率只有 58%。
这说明模型过度自信。
也可能模型输出主胜 50% 的比赛,长期实际主胜率有 60%。
说明模型低估了主胜。
所以,LightGBM 训练后,必须做概率校准检查。
要看:
模型给 50%-60% 的主胜概率时,实际发生率是多少;
给 60%-70% 时,实际发生率是多少;
给 70%-80% 时,实际发生率是多少。
如果预测概率和真实发生率接近,说明模型校准较好。
如果差异明显,就要做校准。
这会在后续“概率校准”章节详细讲。
本章先记住:
LightGBM 输出概率,不等于概率天然可信。
十九、平局为什么是胜平负模型最难的一类?
平局是足球模型里的难点。
原因有几个。
第一,平局不像主胜和客胜那样直接对应强弱优势。
强队更强,主胜概率上升。
客队更强,客胜概率上升。
但平局往往出现在中间区域。
第二,平局和比赛节奏、赛制、战意、进球环境关系很大。
实力接近容易平。
低比分环境容易平。
一方平局可接受容易平。
淘汰赛首回合可能更谨慎。
强队破密集困难,也可能提高平局风险。
第三,平局样本比例稳定但不高。
很多联赛平局率在 20%-30% 左右。
它不是少数类到可以忽略,也不是多数类到容易学习。
第四,很多模型会系统性低估平局。
模型容易把概率分给主胜或客胜,尤其在有强弱差距时。
所以训练胜平负模型时,要单独检查平局校准。
不能只看整体命中率。
如果模型主胜和客胜还行,但平局长期失真,这个模型仍然不够好。
二十、胜平负模型的评估不能只看“预测中了多少场”
胜平负模型至少要看几类指标。
1. 命中率
可以看,但不是唯一标准。
它表示硬分类是否正确。
2. LogLoss
评估概率质量。
越低越好。
它会惩罚对错误结果过度自信。
3. Brier Score
评估概率误差。
多分类也可以扩展计算。
4. 概率校准
检查模型说 60% 的事情,长期是否真的接近 60%。
5. 分类别表现
分别看主胜、平局、客胜。
不要只看总体。
6. 分联赛表现
不同联赛风格不同。
模型可能在某些联赛好,在另一些联赛差。
7. 分时间段表现
检查模型是否随时间失效。
比如 2021 好,2022 好,2023 开始下降,就要排查原因。
这些评估比“命中率 55%”更重要。
二十一、一个合理的训练流程应该长什么样?
公开文章不需要给内部实现,但可以讲通用流程。
一个比较稳的胜平负训练流程可以是:
1. 明确标签:H / D / A
2. 构造赛前特征
3. 按时间顺序切分训练、验证、测试
4. 训练逻辑回归基线
5. 记录基线 LogLoss、Brier Score、命中率、校准情况
6. 训练 LightGBM
7. 使用验证集控制过拟合
8. 在测试集上评估未来表现
9. 分析主胜、平局、客胜三类概率是否校准
10. 对比逻辑回归、LightGBM、泊松汇总结果
11. 检查模型分歧较大的比赛
12. 决定是否进行概率校准或模型融合
这个流程的重点不是“训练出一个模型”,而是建立一套可靠评估体系。
模型训练很容易。
判断模型是否可信才难。
二十二、一个简化例子:逻辑回归和 LightGBM 输出差异怎么理解?
假设某场比赛,特征显示:
主队长期强弱高于客队;
主队近期状态不错;
客队客场防守一般;
但主队赛程较密;
客队低位防守能力还可以。
逻辑回归输出:
P(H) = 0.55
P(D) = 0.27
P(A) = 0.18
LightGBM 输出:
P(H) = 0.66
P(D) = 0.21
P(A) = 0.13
为什么 LightGBM 更高?
可能因为它学到:
在类似强弱差距、主场、客队客场防守差的组合下,主胜实际发生率较高。
但也可能是它对某些小样本组合过度自信。
所以不能直接说 LightGBM 更对。
要看长期验证:
类似条件下 LightGBM 的 60%-70% 主胜概率是否真的接近实际发生率。
如果校准后发现实际只有 56%,说明 LightGBM 高估了主队。
如果实际接近 65%,说明 LightGBM 学到了有价值的非线性关系。
这就是模型评估的重要性。
单场无法判断哪个模型更可靠。
必须看长期校准。
二十三、为什么复杂模型不应该直接替代人工理解?
模型能给出概率,但不能替代理解。
尤其是足球比赛,很多临场因素不一定完全进入模型。
比如:
主力临场轮换;
更衣室问题;
极端天气;
赛前发布会暗示;
杯赛特殊战意;
赛制细节;
主教练临场变化。
如果这些没有结构化进入特征,模型就无法充分理解。
所以模型输出应该被看成:
数据条件下的概率判断
而不是:
绝对答案
产品层面应该把模型概率翻译成风险语言。
例如:
主队优势存在,但平局概率不低。
模型对主胜判断较高,但进球分布并不支持大比分。
多个模型分歧较大,本场不确定性偏高。
泊松模型显示低比分概率较高,LightGBM 对主胜更乐观,需要结合临场阵容观察。
这比简单显示一个“预测主胜”更专业。
二十四、本章实操检查清单
训练逻辑回归和 LightGBM 胜平负模型时,至少检查:
1. 标签是否明确为 H / D / A?
2. 模型是否输出 P(H), P(D), P(A),而不是只输出硬分类?
3. 三类概率是否相加为 1?
4. 特征是否全部赛前可得?
5. 是否避免使用当前比赛赛后统计?
6. 是否按时间切分训练、验证、测试?
7. 是否建立逻辑回归基线?
8. LightGBM 是否真的超过基线?
9. 是否使用验证集和 early stopping 控制过拟合?
10. 是否评估 LogLoss,而不仅是命中率?
11. 是否检查平局概率校准?
12. 是否分联赛、分时间段评估模型?
13. 是否比较逻辑回归、LightGBM、泊松模型输出?
14. 模型分歧较大的比赛是否单独标记?
15. LightGBM 输出概率是否做过校准检查?
如果这些问题没有解决,不建议把模型结果直接产品化。
本章小结
逻辑回归和 LightGBM 都可以用于足球胜平负建模,但它们角色不同。
逻辑回归适合作为基线模型。
它简单、稳定、可解释,能帮助你检查特征方向是否符合足球常识。
LightGBM 表达能力更强。
它适合处理足球表格数据中的非线性关系和特征交互,但也更容易过拟合。
胜平负模型的核心输出不是一个结果,而是:
P(H), P(D), P(A)
也就是主胜、平局、客胜三类概率。
模型评估不能只看命中率。
必须看:
LogLoss;
Brier Score;
概率校准;
平局表现;
分联赛表现;
分时间段稳定性;
模型之间是否一致。
一个专业的足球预测系统,不应该迷信单个复杂模型。
更稳的路线是:
先建立逻辑回归基线;
再训练 LightGBM 增强模型;
再和泊松模型输出对比;
最后通过校准、回测和长期监控判断模型是否可信。
下一章我们继续讲:
多模型融合怎么做?泊松、逻辑回归和 LightGBM 各自解决不同问题。
本文仅供足球数据研究和模型训练学习参考,不构成任何投注建议。
