PCA(主成分分析)通过对原始数据特征的线性组合,在尽可能保留样本之间差异性(样本方差)的情况下,形成新的特征,是最常见的数据降维手段。
t-SNE(t-distributed stochastic neighbor embedding)是一种非线性的数据降维方法,它将数据点之间的空间距离转化为相似度的概率分布(高维空间中使用高斯分布,低维空间中使用t-分布),通过最小化高维空间和低维空间概率分布的KL散度,获得数据在低维空间中的近似。通常用于高维数据的可视化。
本文分别使用t-SNE和PCA对mnist图像数据进行降维处理,再对降维后的数据进行KMeans聚类,对比其降维效果的差异。
文章
10.51W+人气
19粉丝
1关注
©Copyrights 2016-2022 杭州易知微科技有限公司 浙ICP备2021017017号-3 浙公网安备33011002011932号
互联网信息服务业务 合字B2-20220090