数据无量纲化处理(归一化VS标准化)

发布网友 发布时间:3小时前

我来回答

1个回答

热心网友 时间:2分钟前

一、概念解析与比对

常见的无量纲化处理方法包括极值化、标准化(最常用)、均值化和标准差化方法。

二、机器学习中归一化的优点及代码

1.归一化后能加快梯度下降求最优解的速度,对使用梯度下降法求最优解的机器学习模型来说,归一化是很有必要的,否则可能很难收敛甚至不能收敛。

2.归一化有可能提高精度,例如对于KNN这样的分类器,它需要计算样本之间的距离。如果特征值域范围非常大,那么距离计算就主要取决于这个特征,从而与实际情况相悖。

1.min-max标准化

2.Z-score标准化

3.Sigmoid函数:

三、哪些算法并不需要归一化?

概率模型(树形模型)不需要归一化,因为它们不关心变量的值,而是关心变量的分布和变量之间的条件概率,如决策树、RF。而像Adaboost、SVM、LR、Knn、KMeans之类的最优化问题就需要归一化。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com