错误:完美分离错误:检测到完全分离,结果不可用
问题描述
这是列车数据集的头。
Head of the X_Train
运行以下代码:
logit = sm.GLM(Y_train, X_train, family=sm.families.Binomial())
result = logit.fit()
您能帮帮忙吗?
出现以下错误: Error Screen Shot
解决方案
已在一个或多个预测变量和结果变量中检测到完全或准完全分离。
当一个预测器类别(或预测器的组合)中的所有或几乎所有值仅与一个二元结果值相关联时,就会发生这种情况。(我假设你正在尝试逻辑回归。)发生这种情况时,无法找到预测系数的解决方案。有几种可能的解决方案。根据您的分析中有多少变量,您可以尝试对您的结果和每个预测变量运行双向交叉表,以定位任何没有观测的单元格,然后从分析中删除该变量或使用更少的类别。另一种选择是运行Firth Logistic回归或惩罚回归。
相关文章