跳至主要內容
主成分分析(PCA)

主成分分析(PCA)

  • PCA(Principal Component Analysis)是一种无监督学习的线性变换技术,通过将高维数据投影到低维空间中的主要方向来捕获数据的本质结构。

PCA步骤

特征提取

  • 对于一个样本数据,它可以包含很多的特征,例如一个人的身高、体重、性别、年龄,但是并不是每个特征都能用于指定的任务中,例如判断一个人是否患病,身高可能不仅没有作用还会让分类器效果变差,所以对于具体的任务要选择不同的特征输入给模型,这个过程便是特征选择

    而对于特征提取来说,是指从已有的特征中生成新的特征,例如体重和是否应减肥并不是完全相关(不同年龄、身高、性别标准都不一样),更多的我们会用身高和体重计算出新的指标BMI,再更具BMI确定是否应减肥。那么从原有的特征计算出BMI的过程,便是一个特征提取的过程。

  • 而PCA也就是干这样一件事,从原有的特征空间进行特征提取得到特征空间,达到减少维度的效果。


Xenny原创大约 6 分钟机器学习机器学习无监督学习PCA