sklearn.inspection.partial_dependence¶

sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.05, 0.95), grid_resolution=100, method='auto')

源码

特征的部分依赖。

特征（或一组特征）的部分依赖关系对应于该特征的每个可能值的估算器的平均响应。

在用户指南中阅读更多内容。

警告：

对于GradientBoostingClassifier和GradientBoostingRegressor，‘recursion’方法（默认使用）将不考虑提升过程的初始预测变量。实际上，只要init是一个常数估算器（默认值），它将在目标响应中产生与‘brute’相同的值，直到一个恒定的偏移量。但是，如果init不是常数估算器，则部分依赖关系值对于‘recursion’是不正确的，因为偏移量将取决于样本。最好使用‘brute’方法。请注意，这仅适用于GradientBoostingClassifier和GradientBoostingRegressor，不适用于HistGradientBoostingClassifier和HistGradientBoostingRegressor。

参数	说明
estimator	BaseEstimator 一个适合的估计器对象，实现 predict，predict_proba 或 decision_function。不支持多输出多类分类器。
X	{array-like or dataframe} of shape (n_samples, n_features) X用于生成目标`features`的值的网格（将在其中评估部分相关性），还用于在`method`为‘brute’时生成补数特征的值。
features	array-like of {int, str} 应为其计算部分依赖的特征（例如[`0`]）或一对相互作用的特征（例如[`（0，1）`]）。
response_method	‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’) 指定是使用predict_proba还是decision_function作为目标响应。对于回归量，将忽略此参数，并且响应始终是predict的输出。默认情况下，将先尝试使用predict_proba，如果不存在，则我们将恢复到decision_function。如果`method`为‘recursion’(递归)，则响应始终是decision_function的输出。
percentiles	tuple of float, optional (default=(0.05, 0.95)) 上下百分比用于创建网格的极值。必须在[0，1]中。
grid_resolution	int, optional (default=100) 每个目标特征在网格上等距的点数。
method	str, optional (default=’auto’) 用于计算平均预测的方法： - 仅某些基于树的评估器支持‘recursion’（即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,）但在速度方面效率更高。使用这种方法，分类器的目标响应始终是决策函数，而不是预测的概率。 - 任何估算器均支持‘brute’，但计算量更大。 - ‘auto’：‘recursion’用于支持它的估算器，否则使用‘brute’。请参阅此注释，以了解‘brute’和‘recursion’方法之间的区别。

返回值	说明
averaged_predictions	ndarray,shape (n_outputs, len(values[0]), len(values[1]), …) 网格中所有点的预测值是X中所有样本的平均值（如果方法为“递归”，则为训练数据的平均值）。 `n_outputs`对应于多类设置中的类数，或对应于多输出回归的任务数。对于经典回归和二进制分类，`n_outputs == 1`。`n_values_feature_j`对应于大小值`[j]`。