求大神简述一下LLE算法(或降维算法)在模式识别和数据挖掘中是怎样被应用的呢,谢谢

发布网友 发布时间:2022-04-23 17:08

我来回答

1个回答

热心网友 时间:2023-10-10 06:14

关于LLE算法具体的理论部分你可参考http://www.pami.sjtu.e.cn/people/xzj/introcelle.htm

Locally linear embedding (LLE),使用这种算法可以进行非线性降维,关键是其能够使降维后的数据保持原有拓扑结构

先给出一张下面算法得到的图 ,图中第一幅

LLE算法可以归结为三步:

(1)寻找每个样本点的k个近邻点;

(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;

(3)由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。

为原始数据,第三个为降维后的数据,可以看出处理后的低维数据保持了原有的拓扑结构。

另,本人对LLE算法不是很熟悉,在此介绍一下其他降维算法的使用,以SVD算法为例。

电影推荐。

(1)假设现在有一个用户和电影评分的二维矩阵,矩阵内容是用户对电影的评分,现有得知某个用户对部分电影的评分,由此为该用户推荐他可能喜欢的电影。

(2)假设用户有100W,电影有100W部,那么对于任意一种推荐算法来说,这个数据量都很大,该问题无法在单机上进行运算解决;

(3)这100W维特征中必然存在一些几乎不重要的特征,这时,我们就需要用降维算法进行降维,降维的目的就是去掉大量的不重要的特征,以简化运算;

(4)在此例中,可以使用SVD(或SVD++)算法对矩阵进行降维

       图片相似度

       (1)通常,进行图片相似度判断首先会将图片通过傅里叶变换转换成数值代表的矩阵,矩阵代表着该图片,一般来说矩阵维数越高越精确

       (2)同样,维数过高的情况下,相似度计算成本很高,因此同样需要降维,在图片相似度识别中常用的降维算法是PCA算法;


总之,降维的目的就是减少特征的维数,减少运算的成本。

以上皆为我的拙见,如有疑义请指正。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com