Search
Please activate JavaScript to enable the search functionality.
From here you can search these documents. Enter your search words into the box below and click "search". Note that the search function will automatically search for all of the words. Pages containing fewer words won't appear in the result list.
Search Results
Search finished, found 840 page(s) matching the search query.
-
带交叉验证的递归特征消除
一个递归特征消除示例,它使用交叉验证自动调整所选择的特征数。  ```python Opti
-
高斯混合模型选择
实例表明,利用信息论准则(BIC)可以对高斯混合模型进行模型选择。模型选择涉及到模型中的协方差类型和成分数。在这种情况下,AIC也提供了正确的结果(没有显示出来以节省时间),但是如果问题是确定正确的模
-
带噪声水平估计的高斯过程回归(GPR)
此示例说明具有和核(包括WhiteKernel)的CPR可以估计数据的噪声水平。对数边际似然(LML)的图的表明,LML存在两个局部极大值。第一个对应于一个高噪声级和大长度尺度的模型,它解释了数据中的
-
在20newgroups上的多类系数逻辑回归
比较多项Logistic L1与one-versus-rest L1 Logistic回归对20newgroups数据集的文献进行分类。多项Logistic回归得到更准确的结果,在大尺度数据集上训练速
-
具有多重共线性或相关特征的置换重要性
在本例中,我们使用 [`permutation_importance`](https://scikit-learn.org.cn/view/849.html)计算 Wisconsin乳腺癌数据集上的置
-
多维标度
对所生成的噪声数据的有度量和非度量MDS的说明。 使用度量MDS和非度量MDS的重构点稍微移动以避免重叠。 ,以说明算法处理多模式数据的能力。 对于每个数据集,将生成15%的样本作为随机均匀噪声。该比例是为OneCl
-
在scikit-learn中可视化交叉验证行为
选择正确的交叉验证对象是正确拟合模型的关键部分。有很多方法可以将数据分为训练集和测试集,从而避免模型过度拟合,例如标准化测试集中的组数等。 本示例将几个常见的scikit学习对象的行为可视化以进
-
用邻域成分分析进行降维
用于降维的邻域成分分析的样本案例。 本案例比较了应用于手写数字数据集的不同的(线性)降维方法。数据集包含从0到9的数字图像,每个类别大约有180个样本。每个图像的尺寸为8x8 = 64,在这里我
-
在MNIST数据集上可视化MLP权重
有时查看神经网络的学习系数可以洞悉学习行为。例如,如果权重看起来是无结构的,则可能根本没有使用权重,或者如果存在很大的系数,则可能是正则化过低或学习率过高。 此示例显示了如何在MNIST数据集上
-
使用Pipeline和GridSearchCV选择降维算法
本示例构建了一个进行降维处理,然后使用支持向量分类器进行预测的管道。 它演示了如何使用GridSearchCV和Pipeline在单个CV运行中优化不同类别的估计量–在网格搜索过程中,将无监督的PCA
-
特征缩放的重要性
对于许多机器学习算法而言,通过标准化(或Z分数标准化)进行特征缩放可能是重要的预处理步骤。标准化涉及重新缩放特征,以使它们具有标准正态分布的属性,平均值为零,标准差为1。 尽管许多算法(例如SV
-
Iris数据集上的标签传播与SVM的决策边界
标签传播和SVM之间在鸢尾花数据集上生成的决策边界的比较。 这表明标签传播即使在标签数据较少的情况下也能很好地学习。 输出: 的一类支持向量机(One-class SVM)
使用一类SVM进行新颖性检测的示例。 一类SVM是一种无监督算法,可学习用于新颖性检测的决策函数:将新数据分类为与训练集相似或不同。 ![](https://scikit-learn.or
-
手写数据集分类练习
关于在Digits数据集上使用分类技术的教程练习。 此练习在“有监督的学习”的“分类”部分中使用:从“用于科学数据处理的统计学习”教程的高维观测部分预测输出变量。 输出: ```py