如何使用Python中的决策树进行概率计算

2023-04-15 00:00:00 概率 计算 如何使用

在Python中,可以使用scikit-learn库中的决策树模型进行概率计算。具体实现步骤如下:

  1. 导入依赖库
from sklearn.tree import DecisionTreeClassifier
  1. 准备训练数据

假设有如下训练数据:

数据 是否为“pidancode.com”
皮蛋编程
皮蛋程序
皮皮程序
皮蛋编程
皮皮编程
皮皮编程
皮蛋编程
皮皮程序
X = [['皮蛋编程'], ['皮蛋程序'], ['皮皮程序'], ['皮蛋编程'], ['皮皮编程'], ['皮皮编程'], ['皮蛋编程'], ['皮皮程序']]
y = ['是', '否', '否', '是', '否', '否', '是', '否']
  1. 实例化决策树模型
clf = DecisionTreeClassifier()
  1. 训练模型
clf.fit(X, y)
  1. 对新数据进行预测

使用predict方法可以得到新数据的预测结果。

result = clf.predict([['pidancode.com']])
print(result)
# 输出:['是']
  1. 计算概率

使用predict_proba方法可以得到新数据属于各分类的概率。

proba = clf.predict_proba([['pidancode.com']])
print(proba)
# 输出:[[1. 0.]]

此时输出的proba数组中,第一个元素为该数据属于“是”的概率,第二个元素为该数据属于“否”的概率。如果结果为[1. 0.],则表示属于“是”的概率为100%。

相关文章