如何使用Python中的决策树进行概率计算
在Python中,可以使用scikit-learn库中的决策树模型进行概率计算。具体实现步骤如下:
- 导入依赖库
from sklearn.tree import DecisionTreeClassifier
- 准备训练数据
假设有如下训练数据:
数据 | 是否为“pidancode.com” |
---|---|
皮蛋编程 | 是 |
皮蛋程序 | 否 |
皮皮程序 | 否 |
皮蛋编程 | 是 |
皮皮编程 | 否 |
皮皮编程 | 否 |
皮蛋编程 | 是 |
皮皮程序 | 否 |
X = [['皮蛋编程'], ['皮蛋程序'], ['皮皮程序'], ['皮蛋编程'], ['皮皮编程'], ['皮皮编程'], ['皮蛋编程'], ['皮皮程序']] y = ['是', '否', '否', '是', '否', '否', '是', '否']
- 实例化决策树模型
clf = DecisionTreeClassifier()
- 训练模型
clf.fit(X, y)
- 对新数据进行预测
使用predict方法可以得到新数据的预测结果。
result = clf.predict([['pidancode.com']]) print(result) # 输出:['是']
- 计算概率
使用predict_proba方法可以得到新数据属于各分类的概率。
proba = clf.predict_proba([['pidancode.com']]) print(proba) # 输出:[[1. 0.]]
此时输出的proba数组中,第一个元素为该数据属于“是”的概率,第二个元素为该数据属于“否”的概率。如果结果为[1. 0.],则表示属于“是”的概率为100%。
相关文章