错误:完美分离错误:检测到完全分离,结果不可用

2022-04-19 00:00:00 python logistic-regression

问题描述

这是列车数据集的头。

Head of the X_Train

运行以下代码:

logit = sm.GLM(Y_train, X_train, family=sm.families.Binomial())
result = logit.fit()

您能帮帮忙吗?

出现以下错误: Error Screen Shot


解决方案

已在一个或多个预测变量和结果变量中检测到完全或准完全分离。

当一个预测器类别(或预测器的组合)中的所有或几乎所有值仅与一个二元结果值相关联时,就会发生这种情况。(我假设你正在尝试逻辑回归。)发生这种情况时,无法找到预测系数的解决方案。

有几种可能的解决方案。根据您的分析中有多少变量,您可以尝试对您的结果和每个预测变量运行双向交叉表,以定位任何没有观测的单元格,然后从分析中删除该变量或使用更少的类别。另一种选择是运行Firth Logistic回归或惩罚回归。

相关文章