sklearn.inspection.partial_dependence¶
sklearn.inspection.partial_dependence(estimator, X, features, *, response_method='auto', percentiles=(0.05, 0.95), grid_resolution=100, method='auto')
特征的部分依赖。
特征(或一组特征)的部分依赖关系对应于该特征的每个可能值的估算器的平均响应。
在用户指南中阅读更多内容。
警告:
对于GradientBoostingClassifier
和GradientBoostingRegressor
,‘recursion’方法(默认使用)将不考虑提升过程的初始预测变量。实际上,只要init是一个常数估算器(默认值),它将在目标响应中产生与‘brute’相同的值,直到一个恒定的偏移量。 但是,如果init不是常数估算器,则部分依赖关系值对于‘recursion’是不正确的,因为偏移量将取决于样本。最好使用‘brute’方法。请注意,这仅适用于GradientBoostingClassifier
和GradientBoostingRegressor
,不适用于HistGradientBoostingClassifier
和HistGradientBoostingRegressor
。
参数 | 说明 |
---|---|
estimator | BaseEstimator 一个适合的估计器对象,实现 predict,predict_proba 或 decision_function。不支持多输出多类分类器。 |
X | {array-like or dataframe} of shape (n_samples, n_features) X用于生成目标 features 的值的网格(将在其中评估部分相关性),还用于在method 为‘brute’时生成补数特征的值。 |
features | array-like of {int, str} 应为其计算部分依赖的特征(例如[ 0 ])或一对相互作用的特征(例如[(0,1) ])。 |
response_method | ‘auto’, ‘predict_proba’ or ‘decision_function’, optional (default=’auto’) 指定是使用predict_proba还是decision_function作为目标响应。对于回归量,将忽略此参数,并且响应始终是predict的输出。默认情况下,将先尝试使用predict_proba,如果不存在,则我们将恢复到decision_function。 如果 method 为‘recursion’(递归),则响应始终是decision_function的输出。 |
percentiles | tuple of float, optional (default=(0.05, 0.95)) 上下百分比用于创建网格的极值。必须在[0,1]中。 |
grid_resolution | int, optional (default=100) 每个目标特征在网格上等距的点数。 |
method | str, optional (default=’auto’) 用于计算平均预测的方法: - 仅某些基于树的评估器支持‘recursion’(即 GradientBoostingClassifier, GradientBoostingRegressor, HistGradientBoostingClassifier, HistGradientBoostingRegressor, DecisionTreeRegressor, RandomForestRegressor,)但在速度方面效率更高。使用这种方法,分类器的目标响应始终是决策函数,而不是预测的概率。 - 任何估算器均支持‘brute’,但计算量更大。 - ‘auto’:‘recursion’用于支持它的估算器,否则使用‘brute’。 请参阅此注释,以了解‘brute’和‘recursion’方法之间的区别。 |
返回值 | 说明 |
---|---|
averaged_predictions | ndarray,shape (n_outputs, len(values[0]), len(values[1]), …) 网格中所有点的预测值是X中所有样本的平均值(如果方法为“递归”,则为训练数据的平均值)。 n_outputs 对应于多类设置中的类数,或对应于多输出回归的任务数。 对于经典回归和二进制分类,n_outputs == 1 。n_values_feature_j 对应于大小值[j] 。 |