sklearn.inspection.partial_dependence

sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.050.95), grid_resolution=100, method='auto')

源码

特征的部分依赖。

特征(或一组特征)的部分依赖关系对应于该特征的每个可能值的估算器的平均响应。

用户指南中阅读更多内容。

警告:

对于GradientBoostingClassifierGradientBoostingRegressor,‘recursion’方法(默认使用)将不考虑提升过程的初始预测变量。实际上,只要init是一个常数估算器(默认值),它将在目标响应中产生与‘brute’相同的值,直到一个恒定的偏移量。 但是,如果init不是常数估算器,则部分依赖关系值对于‘recursion’是不正确的,因为偏移量将取决于样本。最好使用‘brute’方法。请注意,这仅适用于GradientBoostingClassifierGradientBoostingRegressor,不适用于HistGradientBoostingClassifierHistGradientBoostingRegressor

参数 说明
estimator BaseEstimator
一个适合的估计器对象,实现 predict,predict_proba 或 decision_function。不支持多输出多类分类器。
X {array-like or dataframe} of shape (n_samples, n_features)
X用于生成目标features的值的网格(将在其中评估部分相关性),还用于在method为‘brute’时生成补数特征的值。
features array-like of {int, str}
应为其计算部分依赖的特征(例如[0])或一对相互作用的特征(例如[(0,1)])。
response_method ‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’)
指定是使用predict_proba还是decision_function作为目标响应。对于回归量,将忽略此参数,并且响应始终是predict的输出。默认情况下,将先尝试使用predict_proba,如果不存在,则我们将恢复到decision_function。 如果method为‘recursion’(递归),则响应始终是decision_function的输出。
percentiles tuple of float, optional (default=(0.05, 0.95))
上下百分比用于创建网格的极值。必须在[0,1]中。
grid_resolution int, optional (default=100)
每个目标特征在网格上等距的点数。
method str, optional (default=’auto’)
用于计算平均预测的方法:
- 仅某些基于树的评估器支持‘recursion’(即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,)但在速度方面效率更高。使用这种方法,分类器的目标响应始终是决策函数,而不是预测的概率。
- 任何估算器均支持‘brute’,但计算量更大。
- ‘auto’:‘recursion’用于支持它的估算器,否则使用‘brute’。
请参阅此注释,以了解‘brute’和‘recursion’方法之间的区别。
返回值 说明
averaged_predictions ndarray,shape (n_outputs, len(values[0]), len(values[1]), …)
网格中所有点的预测值是X中所有样本的平均值(如果方法为“递归”,则为训练数据的平均值)。 n_outputs对应于多类设置中的类数,或对应于多输出回归的任务数。 对于经典回归和二进制分类,n_outputs == 1n_values_feature_j对应于大小值[j]