在高维数据中,往往隐藏着低维的流形结构。Laplacian Eigenmap(拉普拉斯特征映射,简称LE)是一种经典的非线性降维方法,它通过构建数据的局部邻接关系图(亲和矩阵W),利用图拉普拉斯矩阵的谱性质,将数据嵌入到低维空间中,同时尽可能保持原始数据的局部几何结构。
今天我们要介绍的Eigenmap函数,就是Laplacian Eigenmap的核心MATLAB实现。它以亲和矩阵W为输入,高效计算拉普拉斯特征映射的低维嵌入坐标,并对特征向量进行必要的后处理,确保结果的数值稳定性和几何意义。
算法原理简述
Laplacian Eigenmap的核心思想是:如果两个样本在高维空间中邻近,那么它们在低维嵌入空间中也应该邻近。
具体步骤:
构造亲和矩阵W(通常基于k近邻或ε球邻域 + 高斯热核)
计算度矩阵D,对W进行归一化,得到归一化拉普拉斯矩阵 L’ = D^{-1/2} W D^{-1/2}
求解广义特征值问题或直接对归一化矩阵求特征向量
丢弃最大特征值(恒为1)对应的平凡解,取次大特征值对应的向量作为嵌入坐标
该函数正是实现了归一化拉普拉斯特征映射(Normalized Laplacian Eigenmap),其嵌入结果在理论上更具鲁棒性。