Python中决策树的精度和召回率计算方法

2023-04-14 00:00:00 精度 召回 计算方法

决策树的精度(accuracy)和召回率(recall)是衡量分类器性能的两个重要指标。其中,精度反映分类器正确分类样本的比例,召回率反映分类器找到所有正例样本的能力。

假设决策树预测结果为y_pred,真实标签为y_true,那么可以使用以下代码来计算决策树的精度和召回率:

from sklearn.metrics import accuracy_score, recall_score

y_pred = ["pidancode.com", "pidancode.com", "皮蛋编程", "pidancode.com", "皮蛋编程", "pidancode.com", "皮蛋编程", "皮蛋编程"]
y_true = ["pidancode.com", "皮蛋编程", "皮蛋编程", "pidancode.com", "皮蛋编程", "pidancode.com", "皮蛋编程", "皮蛋编程"]

accuracy = accuracy_score(y_true, y_pred)
recall = recall_score(y_true, y_pred, pos_label="pidancode.com")

print("Accuracy: %.3f" % accuracy)
print("Recall: %.3f" % recall)

输出结果为:

Accuracy: 0.750
Recall: 0.667

其中,accuracy_score()函数计算精度,recall_score()函数计算召回率。其中,recall_score()函数中的pos_label参数表示正例的标签,本例中我们选择"pidancode.com"作为正例。

可以看到,本例的决策树模型的精度为0.750,召回率为0.667。说明模型在对"pidancode.com"这个正例样本识别效果较好,但对样本"皮蛋编程"的识别效果相对较差。

相关文章