决策树算法api

2024-05-13 08:43:28 阅读次数：40

决策树算法api

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)
- criterion 【选择哪个参数来划分决策树】
  - 特征选择标准
  - "gini"或者"entropy"，前者代表基尼系数，后者代表信息增益。一默认"gini"，即CART算法。
- min_samples_split
  - 内部节点再划分所需最小样本数
  - 这个值限制了子树继续划分的条件，如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分。默认是2.如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。我之前的一个项目例子，有大概10万样本，建立决策树时，我选择了min_samples_split=10。可以作为参考。
- min_samples_leaf
  - 叶子节点最少样本数
  - 这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝。默认是1,可以输入最少的样本数的整数，或者最少样本数占样本总数的百分比。如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。之前的10万样本项目使用min_samples_leaf的值为5，仅供参考。
- max_depth
  - 决策树最大深度
  - 决策树的最大深度，默认可以不输入，如果不输入的话，决策树在建立子树的时候不会限制子树的深度。一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间
- random_state
  - 随机数种子

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

决策树算法api

决策树算法api

决策树算法api

相关文章

Java实现常见排序算法（二）

Java实现常见排序算法（一）

用go语言，给定整数数组arr，求删除任一元素后， 新数组中长度为k的子数组累加和的最大值。

双连通域分解算法

Python算法学习[10]—经典算法问题的解决&算法分析与实现

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

Python算法学习[6]—查找算法：表、树、散列、斐波那契查找算法&实践操作

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

作者介绍

最新文章

归并排序算法

试探回溯法解决八皇后的问题

有序向量去重算法

列表的插入排序算法

python使用t-sne算法降维，方便可视化

文心一言 VS 讯飞星火 VS chatgpt （22）-- 算法导论4.2 2题

热门文章

5、使用PyTorch 实现线性回归

Lc70_爬楼梯

python使用numpy保存字典格式的数据

pandas Dataframe读取数据表是自定义列名

利用函数求出一个数组最大三个数的乘积

冒泡排序法解析

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【算法入门10】链表中倒数第k个结点

【堆 优先队列】1354. 多次求和构造目标数组|2014

matlab最小分类错误全局二值化算法

路径总和III——对前缀和解法的解释

给定一个长度为N的数组，值一定在0~N-1范围，且每个值不重复。

线性回归api深度介绍

用go语言，给定整数数组arr，求删除任一元素后，新数组中长度为k的子数组累加和的最大值。

【堆优先队列】1354. 多次求和构造目标数组|2014