你好,游客 登录 注册
背景:
阅读正文

主成分分析

[日期:2011-04-10] 来源:  作者:辽宁省科学技术厅科技统计中心 金婷 [字体: ]

主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来指标的信息。这种将多个指标化为少数互相无关的综合指标的统计方法叫做主成分分析,也是数学上处理降维的一种方法。

在实际问题中,研究多指标问题是经常遇到的,然而在多数情况下,不同指标之间是有一定相关性的。由于指标较多,再加上指标之间有一定的相关性,势必增加了分析问题的复杂性。而在商业经济中用主成分分析可将复杂的一些数据综合成几个商业指数形式,如生活费用指数,物价指数,商业活动指数等等。

主成分分析的基本思想:主成分分析就是设法将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。通常数学上的处理就是将原来个指标做线性组合,作为新的综合指标。但是这种线性组合如果不加限制则可以有很多。如果将第一个线性组合即第一个综合指标记为,则希尽可能多地反映原来指标的信息,这里的方法就是用的方差来表达,即)越大,表示包含的信息越多。因此,在所有的线性组合中所选取的应该是方差最大的,故称为第一主成分。第一主成分不足以代表原来个指标的信息时,再考虑选取已有的信息不需要再出现在中。此类推可以构造出第三,四,……,第个主成分。这些主成分不仅不相关,而且他们的方差依次递减。因此在实际工作中,就挑选前几个最大主成分。虽然这样会损失一部分信息,但抓住了主要矛盾。

主成分分析的计算步骤:设有个样品,每个样品观测个指标,将原始数据写成矩阵:

 

 

1将原始数据标准化,即将每个指标的原始数据减去这个指标的均值后,再除以这个指标的标准差。

2.建立变量的相关系数阵: 不妨设

3.求的特征根0及相应的单位特征向量

,……,

在解决实际问题时,一般不是取个主成分,而是根据累计贡献率的大小取前个,称第一主成分的贡献率为/,这个值越大,表明第一主成分综合,…,信息的能力越强。前个主成分的累计贡献率达到85%,表明取前个主成分基本包含了全部测量指标所具有的信息。

这种统计方法可以使用国内外通用的软件去实现。

主成分分析用于系统评估:系统评估是指对系统营运状态做出评估,而评估一个系统营运状态往往需要综合考察许多营运的指标,例如对某一类企业经济效益作评估,影响企业经济效益就有许多指标,很难直接比较其优势,所以解决评估问题的焦点就是希望将一个多指标问题综合成一个单指标的形式,也就是说只有在一维空间中才能使排序评估成为可能。下面介绍运用主成分分析来解决这个问题的两种简单常用的方法。

第一种方法,利用主成分,…,做线性组合,并以每个主成分的方差贡献率作为权数构造一个综合评价函数:+,也称为评估指数,依据对每个系统计算出的值大小进行排序、比较或分类划级。这种方法的局限是,当产生主成分的特征向量的各分量符号不一致时就很难进行排序评估。

第二种方法是第一种方法的改进,只用第一个主成分作评估指数即,理由是:第一主成分与原始变量,…,综合相关度最强,即。如果想以一个综合变量来代替原来所有原始变量,则最佳选择应该是,另一方面由于第一主成分对应于数据变异最大的方向也就是使数据信息损失最小,精度最高的一维综合变量。但值得指出的是使用这种方法是有前提条件的,即要求所有评估指标变量都是正相关的。

收藏 推荐 打印 | 录入:gaohc | 阅读:
相关文章       统计知识 
热门评论