SPSS主成分分析

2024-08-23

SPSS主成分分析(精选十篇)

SPSS主成分分析 篇1

区域投资环境在发展与完善过程中具有环境的综合性、整体性、差异性、动态性的特点,国内外许多学者提出过多种分析方法,本文拟在前人研究基础上,利用最新统计数据,采用主成分分析法对中原城市群的投资环境进行定量分析比较排序。

二、中原城市群介绍

中原城市群以省会郑州为核心,洛阳为副中心,包括开封、新乡、焦作、许昌、平顶山、漯河、济源共9个省辖市,土地面积5.87万平方公里,总人口4010万,2009年GDP总额11290亿元。整个城市群位于我国中部地区,交通便利,特别是郑州,是国家重要的交通枢纽中心,具有有力的区位优势。中原城市群在中国15个城市群中综合实力名列第7位,位列中国中西部第一位。

中原城市群是国家级区域经济带中原经济区的核心组成部分,其投资环境如何直接影响着中原经济区的整体经济发展水平,因此对其投资环境的研究,找出各市投资环境的优劣势对加强各市之间的合作,为各城市改善区域投资环境提供政策建议具有重要意义。

三、评价指标体系的选取和解释

本文遵循区域投资环境评价的系统性、客观性、比较性、时效性、目的性原则,结合中原城市群的实际,考虑到各种指标的代表性、综合性、全面性、可操作性以及资料的可得性选取5大类37个因子作为中原城市群投资环境评价指标体系(见表1)。

选取的指标体系包括经济发展、市场状况、基础设施、科技金融和社会环境共计5大类一级指标,它们反映出投资环境结构,37个因子是对一级指标的具体化,是整个分析的基本变量数据。

经济发展类是对区域经济发展总体水平的衡量,该类反映出各个区域的经济实力综合现状,是投资环境分析中的决定性因素;市场状况类从区域人口总量、消费水平等方面反映各个区域的市场容量、市场化状况、市场投资潜力等重要信息,是投资主体衡量投资效益的重要参考信息;基础设施类反映各个区域的交通、邮电通信、物流等重要信息,是投资环境的硬件部分,为经济活动提供必要的硬件支持,因此也是投资主体考虑的重要因素之一;科技金融类反映各个区域的科技活动活跃程度、金融机构资金支持状况的重要大类,是投资环境的软件部分,对投资活动的重要软实力支撑;社会环境类反映了各个区域社会生活、环境、卫生等状况,衡量区域的和谐程度,是投资环境评价中以人为本的重要体现,也是投资主体必须考虑的因素之一。

四、区域投资环境评价

(一)原始数据处理

依据河南省2010年统计年鉴,收集指标体系中的各项原始数据。其中经济发展大类中的单位GDP能耗属于逆向指标,利用公式1对其进行正向化;正向化后数据录入SPSS18.0软件进行标准化,去除量纲的影响。

公式1 X′=1/X×100

(二)SPSS软件主成分分析

按照主成分分析提取原则,即基于特征值大于1,提取前6个成分,并且它们的方差累积贡献率达到97.596%以上,说明这6个主成分几乎包含原始数据的全部信息(见表2)。

然后对得到的成分矩阵进行公式2的处理,从而得到各成分的特征向量。

公式2特征向量bi=成分矩阵向量ai/SQRT(初始特征值ti)。

最后,用标准化数据矩阵(9×37阶)与特征向量矩阵(37×6阶)相乘,得到各市单个主成分值矩阵,即9辖市的F1、F2、F3、F4、F5、F6值(见表3);再根据各主成分在总方差中的比例赋权重,利用公式3得出9辖市综合主成分值F。

公式3

(三)分析评价

从表3中可以看出,主成分F1主要反映城市的总体经济发展和居民消费水平,包括GDP、财政、居民消费、外商投资、邮电通信、旅游业、技术市场、金融机构存贷款和医疗卫生;主成分F2主要反映人均收入指标,包括人均GDP、农民人均纯收入、进出口;主成分F3主要反映城市人口、公路密度、人均公共绿地面积等方面各区域水平;主成分F4主要反映经济结构,包括GDP中二三产业比重、货运量和科技投入等方面各区域水平;主成分F5主要反映单位GDP能耗、研发投入等方面各个区域水平;主成分F6主要反映财政支出占GDP的比重。

五、政策建议

中原城市群城市分布以郑州为核心向外展开,圈层式空间分布特征明显,有利于中心城市扩散效应的发挥和各城市之间功能的分工与协调,充分发挥区位优势,大力发展现代物流产业,优化投资环境;随着郑汴一体化进程的不断推进,郑州至周边城市的城际公交开通运营,中原城市群的同城效应更加明显,投资大环境必将得到改善;中原城市群拥有丰富的劳动力资源,对劳动密集型产业具有强大吸引力,政府应该充分利用这一优势,积极同沿海以及外资企业沟通,鼓励企业到中原投资,例如2010年富士康落户郑州,政府的招商工作就很是到位;最后,中原城市群各市政府还应提高办事效率,树立服务型政府形象并对外积极推广宣传,完善法制。

参考文献

[1]邸晶鑫.西部地区投资环境评价指标体系研究[J].求索,2009(9)

[2]王风,黄志阳.主成份分析法对陕西投资环境的评价[J].生产力研究,2005(3)

[3]栾贵勤区域经济学[M].北京:清华大学出版社,2008:154-177

SPSS主成分分析 篇2

选定河北省张家口地区34个地下水质站点9年资料,在SPSS统计软件的支持下,将主成分分析方法应用于水环境的.综合评价之中.利用主成分综合得分从评价分区、河流水系、同一水系的相邻站点上进行时空变化分析,分析结果理想,体现了主成分分析在水环境质量评价中的实用性.

作 者:李哲强 侯美英 白云鹏 作者单位:李哲强(河北省水文水资源勘测局,河北,石家庄,050031)

侯美英,白云鹏(张家口市水文水资源勘测局,河北,张家口,075000)

宜宾油樟营养器官精油主成分分析 篇3

关键词:油樟;1,8-桉叶油素;黄樟油素;气相色谱-质谱联用技术;精油

中图分类号:O657.63文献标志码:A 文章编号:1002-1302(2014)11-0348-03

油樟[Cinnamomumlongepaniculatum(Gamble)N.Chao]系樟科樟属的珍贵树种,由于精油含量高,因此是一种重要的经济树种。该物种于1974年由四川省林业科学院森林植物分类专家赵良能发现并命名,当时认为油樟是特产于四川和陕西西部的新种[1]。但在后期的研究中,李敏敬、陶光复等通过调查发现,在湖北西部、湖南西部、陕西南部也有油樟分布[2-3]。四川省宜宾市位于四川南部,气候温暖湿润、土壤肥沃,非常适合油樟树的生长,境内的宜宾县有“油樟王国”之称,油樟油产量占全国70%以上[1]。现已建成“天然油樟母本园”21.7hm2,选育了优质油樟母树6500多株,油樟种植面积已达2万hm2,年产油量达到3000t。四川宜宾油樟叶精油出油率(3.8%~4.5%)高于其他地区的油樟,如精油的桉叶油素是广东、江西等樟油的1.6倍[1],具有很好的應用前景。开展油樟精油成分分析研究是进一步开发油樟资源的前提,现有文献仅报道了油樟叶精油成分[4],但有关其根、茎精油的成分研究还未见报道。为此,本研究采用气相色谱-质谱联用法分析油樟叶、根、茎的精油主成分,以期对宜宾油樟资源的进一步合理、有效利用提供参考。

1材料与方法

1.1材料

油樟叶、茎、根采自四川省宜宾市翠屏区宗场乡油樟林基地,乙醚(分析纯,成都市科龙化工试剂厂)。

1.2主要仪器设备

磨口玻璃蒸馏器、圆形电子调温电热套、日本岛津GCMS-QP2010气相色谱质谱联用仪。

1.3方法

1.3.1精油制备方法

分别称取10.0g油樟叶、50.0g油樟根、50.0g茎,剪碎后放入3支1000mL的磨口圆底烧瓶中,每个烧瓶中加入750mL蒸馏水后接上磨口连接头,与冷凝管相连。调节电热套,使烧瓶中的水保持微沸,蒸馏120min,获得芳香油-水混合物,然后加入50mL乙醚,转入分液漏斗中,摇匀后静置24h。取有机相,用乙醚定容至100mL,稀释至适当浓度,供分析测试用。

1.3.2气质联用仪(GC-MS)分析条件

气相色谱条件:色谱柱Rtx-5MS(30.0m×0.25mm×0.25μm)弹性石英毛细管柱(美国Restek公司生产);初始温度50℃,保持3min,以5℃/min升温至180℃;载气为纯度大于99.999%的氦气;柱流量1.5mL/min,分流比50∶1;进样口温度200℃;进样量1μL。质谱条件:EI源(电子能量70eV),相对分子质量扫描范围30~550u,倍增管电压1.2kV,溶剂延迟3min,离子源温度200℃,接口温度200℃,溶剂延迟时间为3min,检测阈值为1000,将峰值大于100000的色谱峰进行定性分析。

2结果与分析

2.1油樟叶精油分析

按“1.3”节的方法测得油樟叶总离子流色谱图(图1)。由图1可知,优化的气相色谱条件,可以很好地将油樟叶精油中的各成分分离开来,各峰形对称,峰与峰之间完全分开,基

线稳定无飘移。与文献[4-5]相比,分析时间由原来的40min以上缩短至29min,提高了分析效率。定性可信度高的色谱峰如表1所示。

由表1可知,叶精油中1,8-桉叶油素相对含量最多,为60.81%,稍高于黄远征等报道的58.55%[4]。另2种成分β-水芹烯和α-萜品醇的相对含量分别为13.27%、12.90%。文献[4]报道的含量高于10%的物质是香桧烯(14.18%)、α-萜品醇(15.43%),未检测到β-水芹烯。本次试验中未测到香桧烯,2种物质的结构式如图2所示,二者互为同分异构体,在后期生产实践中,可进一步开展单体的分离纯化与性质研究。

α-蒎烯、2(10)-蒎烯、月桂烯、1,1-二甲基,2-(3-甲基-1,3-丁二烯)-环丙烷、4-萜品醇的含量介于1.10%~3.35%之间,侧柏烯、γ-萜品烯、(1.α,2.β,5.α)-

2-甲基,5-(1-甲基乙基)-二环[3.1.0]2-己醇、(1.α,2.α,5.α)-2-甲基,5-(1-甲基乙基)-二环[3.1.0]2-己醇的含量介于0.34%~0.89%。

油樟叶精油成分是油樟分型的重要依据,李毓敬等依据油樟叶精油的主要化学成分类型,将湖南油樟分为甲基丁香酚型、龙脑型、樟脑型、桉叶油素型、芳樟醇型、倍半萜烯型6个不同的化学类型[2]。陶光复等测得湖北长阳县油樟油的主要成分是布勒醇(44.78%)、β-桉叶醇(15.61%)、香叶醛(10.80%)、橙花醛(7.63%)、愈创醇(5.07%)、β-石竹烯(2.46%)和1,8-桉叶油素(1.72%)[3]。程必强等报道了叶精油的主要化学成分是β-桉叶醇(40.98%)、榄香醇(10.84%)、愈创醇(4.61%)[6]。本试验结果表明,宜宾油樟为桉叶油素型油樟。

nlc202309032136

2.2油樟茎精油成分分析

按“1.3”节方法测得的油樟茎油总离子流色谱图见图3,定性结果见表2。

由表2可知,油樟茎精油以1,8-桉叶油素为主,占鉴定到的3种物质的99.37%,另2种物质为4-萜品醇和α-萜品醇,含量分别为0.24%、0.39%,这与油樟叶精油的成分有很大差异。进一步研究枝条与树叶出油率和产品成分的影响,将有助于综合利用油樟资源。

2.3油樟根精油成分分析

根据“1.3”节的方法对油樟根精油分析,结果如图4、表3所示。

由表3可知,油樟根精油的主要成分是黄樟油素,相对含量高达93.18%,而1,8-桉叶油素和樟脑的相对含量分别为5.31%、1.51%,由此可见根精油成分与叶、茎精油成分有很大差异。

3结论与讨论

本试验结果表明,宜宾油樟叶、茎、根的精油化学成分构成差异较大,其中叶精油的成分比根、茎丰富,主要成分1,8-桉叶油素的相对含量为60.81%,β-水芹烯和α-萜品醇的相对含量分别为13.27%、12.90%。而茎精油主要成分1,8-桉叶油素的相对含量高达99.37%,其他2种成分4-萜品醇和α-萜品醇含量仅分别为0.24%、0.39%。根精油主要成分为黄樟油素,含量为93.18%,而1,8-桉叶油素的相对含量仅为5.31%。油樟叶精油的主要成分分析结果表明,宜宾油樟属于1,8-桉叶油素型。

油樟油是我国重要的外贸商品,精油中的多种单体物质是医药、日化、香精香料的重要原料。1,8-桉叶油素具有抗菌、杀虫、疏风解热、祛湿解毒作用[7],对多种药物具有良好的透皮渗透作用。β-水芹烯是一种具有生物活性的天然杀虫剂,是生物杀虫剂中的一个重要活性成分[8]。黄樟油素可用于合成洋茉莉醛、胡椒基丁醚、左旋多巴、胡椒乙胺、甲基多巴等化工、医药原料[9]。洋茉莉醛不仅可用于香料和调味品工业,而且也可用作电镀工业中的光亮剂;此外,洋茉莉醛还是一些生物碱和特殊化学品合成的重要原料。胡椒乙胺是多巴胺和黄连素合成的重要原料,其中左旋多巴胺是治疗震颤麻痹症的有效药物之一。然而,黄樟油素具有较强的致癌毒性[10],在生产过程中应当采取合理控制工艺,以预防其对工作人员的毒害作用[11]。在植物精油市场上,粗油制品价格低,精加工制品纯度越高价格越高。一直以来,我国油樟油的提炼、精制技术落后,产品单一、品位不高,限制了产品附加值的提升,不利于农户油樟种植积极性的提高,影响了产业的发展。开展油樟加工技术的研究是促进油樟产业快速、健康发展的关键。

参考文献:

[1]罗中杰,李维一,魏琴,等.宜宾油樟的现状及未来[J].四川师范大学学报:自然科学版,2001,24(3):317-319.

[2]李毓敬,李宝灵,曾幻添,等.湖南油樟的化学类型[J].植物资源与环境,1993,2(3):7-11.

[3]陶光复,丁靖垲,孙汉董.湖北油樟叶精油的化学成分[J].武汉植物学研究,2002,20(1):75-77.

[4]黄远征,温鸣章,赵蕙,等.关于油樟叶芳香油化学成分的研究[J].武汉植物学研究,1986,4(1):59-63.

[5]尹礼国,卿海军,曾林久,等.三种方法制备的岩桂叶精油(浸膏)的分析[J].林产化学与工业,2009,29(6):69-72.

[6]程必强,喻学俭,丁靖垲,等.[HJ2mm]中国樟属植物资源及其芳香成分[M].昆明:云南科技出版社,1997:34-35.

[7]王文元,顾丽莉,吴志民.1,8-桉叶油素的研究进展[J].食品与药品,2007,9(02A):56-59.

[8]夏克坚,任宇红,聂丽娟,等.β-水芹烯的合成与应用[J].南昌大学学报:理科版,2001,25(4):380-382.

[9]罗小龙.黄樟油素的生产及应用[J].林产化工通讯,1998(5):24-27.

[10]林大清,池淑君,袁定国,等.樟叶油对雄性小鼠生殖细胞的诱变性[J].癌变·畸變·突变,1994,6(5):27-29.

[11]罗中杰,黄亮.气相色谱法测量空气中的黄樟素[J].化学研究与应用,1999,11(1):99-101.

SPSS主成分分析 篇4

关键词:变电工程概算决算,主成分分析,SPSS

引言

近年来, 随着电力工程逐渐走向成熟, 投资规模不断增加, 诸多工程项目还是普遍存在概算超估算、预算超概算、决算超预算, 既所谓的“三超”现象。为了实现社会和经济效益的最大化, 减少投资和资源的浪费, “三超”现象成为高度关注的问题之一。[1]本文使用主成分分析方法, 利用SPSS软件, 从概算和决算两个主要的经济文件, 对影响变电工程造价的主要因素进行归纳、分析。

1.变电工程造价的含义及编制

(1) 变电工程造价一般包含两方面的含义:一是指进行变电工程建设所需支付的全部费用;二是为了建成相关的变电设施、设备, 预计或者实际在土地、技术劳务、设备等市场交易活动中形成的建筑安装工程的价格与其他工程的总价格。[2]

(2) 变电工程造价的编制, 主要由建筑安装工程费、设备购置费、其他费用、基本预备费和建设期贷款利息组成 (见图1) 。其中, 建筑安装工程费、设备购置费、其他费用和基本预备费为静态投资。但根据实际工程项目的不同, 工程造价的具体构成也会发生变化。

2.变电工程造价管理

工程造价管理贯穿于整个工程建设过程中, 是全动态对投资费用的控制。在变电工程项目造价编制的整个过程中, 主要有投资估算、设计概算、施工图预算、价款结算和竣工决算。这五部分环环相扣, 前者控制后者的投资金额, 后者又验证了前者的合理准确性。因为变电工程造价的编制, 越到后期就越同实际费用相接近。例如, 设计阶段的费用就是利用批准的投资估算来约束的, 施工图设计费用又是依据设计预算而来, 这样就行成了估算控制概算、概算控制预算的动态控制过程。然而, 在前者控制后者的同时, 工程项目与市场环境是不断变化的, 往往有些变电工程造价在编制概算时, 没有考虑到机械台班未来的市场价格波动, 导致最终决算与计划出入很大。例如, 在某110KV城网工程项目中, 该项目设备费超概算202万元, 其中有2台主变概算价为580万元, 实际购置价为718万元, 仅主变一项设备费超概算就达到138万元。如果概预算本身严重缺乏合理性, 就无法达到控制成本的目的, 工程造价管理也就没有任何意义了。[3]

总的来说, 变电工程造价管理, 是电力相关部门按照市场经济的要求和发展形势, 利用科学管理方法和先进管理手段, 全过程动态控制投资, 使变电工程造价的确定具有科学性、准确性, 实现变电工程造价的有效控制, 以提高各方经济利益, 促进微观效益和宏观效益的统一。

文献综述

1.对“三超”现象原因的研究

廖东英 (2010) 认为“三超”现象的原因主要有4点:概预算的编制偏差大, 成本控制缺乏基础支持;工程设计变更多, 为成本控制的重中之重;项目经理人职责不健全, 忽视工程成本控制;工程审计仓促不精, 没有在成本控制中发挥应有的作用。赵红 (2012) 则将不同时期“三超”现象的原因归为:在立项决策阶段, 忽视工程造价的控制;在设计阶段, 对工程造价的控制不严;在施工阶段, 对工程造价的控制不够;在工程竣工结算阶段, 对工程造价的控制不力。以上观点可归结为:相关部门监管控制不力, 编制人员素质参差不齐;市场价格波动造成工程造价浮动;部分政策规定尚不健全, 不同地区的编制结果与实际情况有所出入。

2.对“三超”现象解决方案的研究

不少学者提出了解决方案, 但是较多局限于管理上, 并未明确概预算编制的修改方向。如廖冬英 (2010) 提出, 需要加强管理、提高概预算人员素质、严格按编制规程编制概预算、应用计算机进行编制等控制编制质量的措施。事实上, 电力工程涉及的费用科目多而杂、时间跨度大, 使得造价编制计算与分析控制的难度高。所以, 如何从科目众多的费用中确定造价的关键影响因素并调整造价编制成为电力工程中的重点。

聂宏展等 (2010) 认为, 目前解决电网规划方案综合决策问题的方法, 有层次分析法和模糊综合评判法, 但指标中的权重依赖于专家评判。可见这些方法对于研究电力工程造价的客观性不足, 而主成分分析法凭借样本数据反映总体信息, 评价结果相对客观, 因此适用于电力工程造价的影响因素分析。

卢艳超等 (2012) 则认为, 建立以指导工程建设造价综合指标主要面临两个问题:一是电力工程影响因素众多, 若计算参数选取过多, 将增加造价分析的复杂性;二是影响因素间存在一定的相关性, 若逐一进行分析会使影响程度重复增加, 不剔除影响因素间的相关性, 势必会放大各影响因素对造价的影响。而主成分分析法能够有效地减少数据信息重叠问题, 所以较为适合电力工程造价指标的分析。

3.对分析方法比较的研究

张文霖 (2006) 提出, 主成分分析法的数学模型, 利用综合得分对各项指标进行比较。彭慧芳等 (2012) 提出了利用因子的权重, 来衡量影响因素并确定其重要程度。结合两者的模型与权重比较方法, 对概算和决算中的费用进行主成分分析。并且在分析过程中使用SPSS软件简化计算流程, 生成系统的数据结果有利于寻找影响因素, 同时, 能够验证数据的使用性和结果的合理性。党瑞明 (2013) 利用SPSS软件, 对手机的众多参数进行主成分分析, 找出了影响消费者购买手机时的综合指标。[4]吉祝美等 (2012) 在使用SPSS软件对河流水质进行评价中展示了具体的操作流程, 并将结果与实际情况比较, 得出与现实相吻合的结论。

主成分分析法

1.主成分分析法

主成分分析法就是利用降维的思想, 把多个指标或变量转化为少数几个综合指标或变量。有时多个变量之间存在一定关系, 但所反映的信息在一定程度上有重复, 增加了分析问题的复杂性。此时, 采用主成分分析法, 利用尽可能少的彼此不相关的综合变量, 来替代原来的多个变量, 较为全面反映出所研究事物的信息。[5]主成分分析法的数学模型如下:

公式中, a1i, a2i, ……, api (i=1, 2, ……, m) 为X的协方差矩阵特征值对应的特征向量;X1, X2, ……, Xp为原始数据经过标准化处理后的值。[6]笔者利用SPSS软件进行主成分分析, 按照特征值大于1或累计贡献率大于85%的标准选出m个主成分, 确定主成分载荷。然后, 将其与对应的方差贡献率相乘求和得到权重, 表达式如下:

公式中, aqi (q=1, 2, ……, m) 为q主成分中的主成分载荷, gq为对应方差的贡献率。[7]最后, 对权重进行归一化处理, 进而比较各指标对总体的影响程度。

变电工程的造价计算包含多个计算指标数据, 且所反映出的信息有一定重复性。所以, 在研究影响变电工程造价的影响因素时, 使用主成分分析法较为合适。[8]

2.概算、决算主成分分析

概算只是在项目进行时对成本的一个大致计算, 而决算基本反映一个项目工程的实际费用。因此, 决算的主成分分析, 对于实际造价控制有指导意义, 概算只是作为一个比较对象。本文使用某电力公司提供的20组变电工程费用样本, 利用SPSS软件, 对同一工程的概算和决算分别进行主成分分析。操作时, 挑选建筑工程费、设备购置费、安装工程费、其他费用、基本预备费和建设期贷款利息为概算主成分分析变量。由于在竣工决算时不考虑基本预备费, 因此, 挑选建筑工程费、设备购置费、安装工程费、其他费用和建设期贷款利息为决算主成分分析变量。另外, 在决算分析时考虑到增值税抵扣税额, 因此也将其加入变量。

SPSS软件在进行主成分分析时, 会自动对数据标准化, 将概算和决算数据输入后分别得出相关矩阵 (表1、表2) 、方差与特征值 (表3、表4) 、成分矩阵 (表5、表6) 、主成分载荷矩阵 (表7、表8) 。

从表1和表2的概算相关矩阵中可看出, 数值基本都落在0.85~0.95之间, 有些数值甚至高于0.95。说明这些变量之间存在着强相关性和信息上的重叠, 从决算的相关矩阵中也能体现这一点。而增值税抵扣税额数值的绝对值较小, 说明与其他变量存在的信息重叠较少, 相关性也较弱。总体来说样本数据还是适合进行主成分分析的。

从表3和表4解释的总方差中可看出, 概算成分1的特征值为5.62, 累积贡献率到达93.662%;决算成分1的特征值为4.76, 累积贡献率到达79.34%, 累积贡献率基本到达要求。因此, 对于概算和决算, 均采用一个主成分来反映总体信息。

如用X1、X2、X3、X4、X5、X66个变量分别表示概算的建筑工程费、设备购置费、安装工程费、其他费用、建设期贷款利息和基本预备费;用X1*、X2*、X3*、X4*、X5*、X6*6个变量来分别表示决算的建筑工程费、设备购置费、安装工程费、其他费用、建设期贷款利息和增值税抵扣税额。根据表5、表6概算和决算的成分矩阵, 可得出它们与概算第一主成分F1和决算第一主成分F1*的关系:

其中, 相关系数的绝对值越大, 主成分对该变量的代表性也越大。可以看出, 概算中第一主成分F1对所有变量包含信息的体现比较充分, 而决算的第一主成分F1*对于增值税抵扣税额相关度一般, 但对于其他变量能够很好地解释。

利用概算和决算的成分矩阵除以对应特征值的平方根, 得到表7和表8的主成分载荷矩阵, 对应的主成分表达式为:

可见, 无论是概算还是决算, 它们的主成分载荷值都比较接近。因而F1与F1*能够代表原先的所有变量, 较为完整地反映出原有信息。这些变量对于变电工程概算和决算信息反映程度尽管接近, 但依旧有大小之分:在概算中, 其他费用>设备购置费>基本预备费>安装工程费>建筑工程费>建设期贷款利息;在决算中, 其他费用>设备购置费>安装工程费>建设期贷款利息>建筑工程费>增值税抵扣税额。无论是概算还是决算, 其他费用和设备购置费都是最能反映造价的两个费用, 可以说它们对造价的影响最大。[9]

为了进一步找到具体的影响因素, 将其他费用中的细分费用带入, 再次使用主成分分析。由于概算和决算的时期阶段不同, 因此, 两者其他费用中的具体费用也会略有差别。定义y1、y2、y3、y4、y5、y6、y7、y8、y9、y10、y11表示概算中的建筑工程费、设备购置费、安装工程费、建设场地征用及赔偿费、项目前期工作费、环境检测验收费、大件运输措施费、建设期贷款利息、水土保持项目验收及补偿费、生产准备费和基本预备费;定义y1*、y2*、y3*、y4*、y5*、y6*、y7*、y8*、y9*、y*10、y*11、y*12表示决算中的建筑工程费、设备购置费、安装工程费、建设场地征用及赔偿费、项目前期工作费、环境检测验收费、大件运输措施费、建设期贷款利息、设计费、勘察费、监理费和增值税抵扣税额。利用SPSS得出的主成分载荷矩阵如表9、表10所示。

根据表9和表10的分析结果得知:概算的第一主成分G1代表设备购置费、安装工程费、大件运输措施费、基本预备费、建设期贷款利息和建筑工程费;第二主成分G2代表项目前期工作费、生产准备费和环境监测验收费;第三主成分G3代表水土保持项目验收及补偿费和建设场地征用及赔偿费。G1基本可以代表除了其他费用的费用;G2与G3基本可以代表其他费用。

决算的第一主成分G1*代表设计费、设备购置费、建筑工程费、安装工程费、建设期贷款利息、大件运输措施费和监理费;第二主成分G2*代表环境检测验收费、建设场地征用及赔偿费和增值税抵扣税额;第三主成分G3*代表项目前期工作费和勘察费。G1*基本可以代表除了其他费用的费用;G2*与G3*基本可以代表其他费用。对应的概算主成分表达式为:

对应的决算主成分表达式为:

求出各费用的权重并进行归一化处理, 得到:

从表11、表12、图2、图3中可清楚地看出, 概算费用影响程度为:建筑安装费>基本预备费>设备购置费>大件运输措施费>安装工程费>建设期贷款利息>建设场地征用及赔偿费>水土保持项目验收及补偿费>生产准备费>环境检测验收费>项目前期工作费;决算费用影响程度排名为:监理费>建设期贷款利息>设计费>大件运输措施费>建筑工程费>设备购置费>安装工程费>项目前期工作费>建设场地征用及赔偿费>勘察费>环境检测验收费>增值税抵扣税额。

设备购置费依旧是影响造价的最主要因素, 而其他费用中的大件运输措施费, 以及决算中的监理费和设计费对造价的影响也比较突出。而且无论是概算还是决算, 第一主成分的代表性都超过50%, 因此, 其中所包含的费用可以说是整体造价的集中体现, 控制造价影响因素的重中之重。

3.主要影响因素分析

为了实现对变电工程造价的动态控制, 应将概算与决算共同含有的主成分分析数据进行对比, 观察两者费用之间的变化程度, 找到概算需要调整之处, 使其接近决算, 缩小与实际造价间的差距。因为在影响因素中, 最有代表性的就是主成分1, 所以这里选取概算和决算中的建筑工程费、设备购置费、安装工程费、大件运输措施费和贷款利息进行对比。

从表13中得知, 概算变量的主成分载荷要大于决算, 说明这些费用对于概算的影响都要高于决算, 它们的大小浮动会对概算产生比较大的影响。因此, 相比决算时期, 在概算时期更加需要对造价进行控制, 控制的效果也会更好。这些费用主成分载荷的变化程度依次为:建筑工程费>设备购置费>安装工程费>大件运输措施费>贷款利息。

通过比较发现:设备购置费对概算和决算的影响较大, 不同时期的变化也较大, 其主要原因有两点:一是因为许多电力设备原本的购置价格就较高, 导致整个变电工程的造价上涨;二是电力工程项目的长周期性, 使得造价受到市场价格波动的影响也较大。设备购置费的波动也导致和它相关的大件运输措施费、安装工程费等费用的波动。

此外, 通过主成分分析可发现其他费用中的设计费在决算中是影响程度最高的变量。大量的电力工程造价实例也证明:尽管设计费在造价中的比重并不高, 但其对工程造价的影响可高达75%。这是因为设计决定了这个工程项目的思路方向以及对材料设备的选择。因此, 这些载荷高、变化幅度大的费用是概算容易与决算发生较大偏差的部分, 在编制和修正概算时应特别关注。再比较两者综合评价表达式:

决算较概算第一主成分系数增大, 而第二和第三主成分系数减小。由于决算比概算在时期上更加接近项目的完工, 数额上也更加靠近最终结算或实际造价, 实际上安装工程费、设备购置费、建筑工程费、建设期贷款利息和一部分其他费用对变电工程造价影响的比重在上升, 部分其他费用影响的比重在下降。因此, 编制和修正概算时, 应将重点放在安装工程费、设备购置费和大件运输措施费、设计费等部分其他费用上。

概算修改方向与造价控制建议

1.概算修改方向

借助主成分分析法, 可以得到概算和决算的影响因素主要是:设备购置费、安装工程费、建设期贷款利息, 以及其他费用中的监理费、设计费、大件运输措施费等费用。为了避免它们在电力工程项目中对决算产生影响和“三超”现象发生, 应在概算编制时进行费用如下调整:一是适当增加监理费、建设期贷款利息、设计费、大件运输措施费、建筑工程费、设备购置费和安装工程费的费用数额;二是修改建筑工程费、设备购置费、安装工程费、大件运输措施费和建设期贷款利息的费用可调整数额。

2.造价控制建议

(1) 在设备购置方面。由于电力设备的市场价格变化难以控制, 在控制时可采用以下几个方法:一是在决策和设计阶段充分考虑市场价格因素;二是选用设备时可以参考相似工程案例, 了解设备可能产生的价格波动;三是使用市场价格波动较小的电力设备;四是使用优秀的电力设备市场价格预测人员和买手。

(2) 在设计方面。对于工程造价的控制主要是在设计阶段:一是在设计工程方案时, 人员一定要对设计中涉及的人、材、机价格心知肚明;二是使用优秀的工程设计人员;三是考虑施行设计限额, 控制设计费以及总体工程费用;四是设计要求精益求精, 可以进行多种方案设计, 择优选取。通过合理的设计过程, 在保证变电工程项目顺利实施的前提下, 使用尽可能少的项目投资实现优秀的项目设计。

结论

通过使用主成分分析法得到的影响变电工程造价因素与实际情况比较吻合, 因此, 主成分分析法是一种比较适用于造价影响因素评价的方法。同时, 分析所得到的数据可以为变电工程造价的控制提供参考。在评价时, 重点考虑主成分载荷靠前的变量, 确定影响造价的主要因素。这样的评价方法, 不仅可以节约时间和人力, 而且更加科学准确。

主成分分析法的适用性较强, 可以将它运用到估算、预算上, 综合考虑造价影响因素。也可以根据情况调整变量, 将它使用到其他项目造价的评价中。

参考文献

[1]赵红.电力工程造价有效控制对“三超”现象的制约研究[J].价值工程, 2012 (18) :53-54.

[2]樊文广.煤炭企业招投标阶段的工程造价控制管理问题分析[J].煤炭科技, 2013 (3) :144-146.

[3]廖东英.电力工程概预算编制和管理[J].中华民居:学术刊, 2010 (12) :158.

[4]党瑞明.用主成份分析法对消费者选购智能手机做出合理性建议[J].中国科技博览, 2013 (5) :206-208.

[5]聂宏展, 聂耸.基于主成分分析法的输电网规划方案综合决策[J].电网技术, 2010 (6) :134-138.

[6]张文霖.主成分分析在满意度权重确定中的应用[J].市场研究, 2006 (6) :18-22.

[7]彭慧芳, 魏久传, 尹会永, 高树林, 吴树磊.基于主成分分析法的底板突水危险性评价[J].煤矿开采, 2012 (6) :101-104.

[8]卢艳超.基于核主成分分析模型的输电线路工程造价评价指标[J].电力建设, 2012 (7) :73-77.

中国出口商品结构的主成分分析 篇5

中国出口商品结构的主成分分析

对外贸易对经济增长的推动作用是很大的,作为对外贸易的基础,出口对经济增长的推动作用更加明显.按产品附加值大小可以将出口商品划分为十类,对按结构划分的`中国出口产品进行主成分分析,可以发现中国出口数据的规律性.通过对数据分析,说明中国应扩大出口,进一步优化出口商品结构,以促进中国经济的快速发展.

作 者:蒋茂军 JIANG Mao-jun 作者单位:河北经贸大学,商学院,河北,石家庄,050061刊 名:经济与管理英文刊名:ECONOMY AND MANAGEMENT年,卷(期):200519(10)分类号:F259.23关键词:商品结构 附加值 主成分分析 累计贡献率

SPSS主成分分析 篇6

关键词:主成分分析 财务绩效 评价指标

1.财务绩效评价指标体系的构建

1.1盈利能力指标

营业利润率(X1):营业利润率是指企业的营业利润与营业收入的比率。计算公式为: 营业利润率=营业利润/全部业务收入×100%。

净资产收益率(X2):用以衡量公司运用自有资本的效率。计算公式为:净资产收益率=净利润/净资产×100%。

总资产利润率(X3):用来说明企业运用其全部资产获取利润的能力。计算公式为:总资产利润率=利润总量/资产平均总额×100%。

1.2营运能力指标

存货周转率(X4):用于反映存货的周转速度。计算公式为:存货周转率=销货成本/平均存货余额。

1.3偿债能力指标

资产负债率(X5):表示公司总资产中有多少是通过负债筹集的。计算公式为:资产负债率=负债总额/资产总额×100%。

流动比率(X6):是流动资产对流动负债的比率。计算公式为:流动比率=流动资产/流动负债×100%。

速动比率(X7):是指速动资产对流动负债的比率。计算公式:速动比率=速动资产/流动负债=(流动资产-存货)/流动负债。

1.4发展能力指标

净资产增长率(X8):反映了企业资本规模的扩张速度。计算公式:净资产增长率=(期末扣除其他资本公积的净资产/期初扣除其他资本公积的净资产-1)×100%。

总资产增长率(X9):企业本年总资产增长额同年初资产总额的比率。计算公式:总资产增长率=本年总资产增长额/年初资产总额×100% 。

净利润增长率(X10):是反映企业成长能力的一个重要指标。计算公式:净利润增长率=(本年净利润增长额/上年净利润)×100%。

2.主成分分析的基本思想

2.1基本思想

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一個综合指标的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。

2.2主要步骤

(1)设原始数据矩阵X=(xij)n×p,其中,i=1,2,……,n;j=1,2, ……p;n表示n个样本;p表示p个指标;xij表示第i个样本的第j个指标值;

(2)将原始数据资料标准化;

(3)计算变量的相关系数矩阵R;

(4)计算R的特征值及相应的特征向量;

向量。首先解特征方程|λi-R|=0,求出特征值λi( i, j=1,2,…,p ),并使其按大小顺序排列,即λ1≥λ2≥…≥0;然后分别求出对应于特征值λi的特征向量ei( i=1,2,…, p);

(5)Zi=a1iX1+a2iX2+…+apiXp即为所求主成分,其中i=1,2,…,p;

(6)求累积贡献率。

(7)构造综合评价函数。选择m个主分量,以每个主分量所对应的特征值占所提取主成分总的特征值之和的比例作为权重,得到综合评价函数。

3.财务绩效指标主成分分析的实证分析

本文选取了中原高速、同力水泥、双汇发展、平煤股份、许继电气、中航光电、太龙药业、郑州煤电、中原环保、ST思达、宇通客车、三全食品、中孚实业、瑞贝卡、天方药业、羚锐制药、新野纺织、利达光电、轴研科技、神火股份、豫能控股、ST安彩、恒星科技、黄河旋风、平高电气、风神股份、豫光金铅、林州重机、焦作万方。财务绩效指标数据来源主要是各个银行2011年年报,原始指标体系是在年报的基础上计算整理得出,能够通过对这29家河南省上市公司在2011年经营情况的研究看出河南省上市公司最新的发展水平。

运用Minitab软件进行数据的分析处理,结果如下:

由相关矩阵的特征分析可知,10个特征值的方差百分比及累计方差百分比表明:第一个特征值是4.0046,第二个特征值是2.0722,第三个特征值是1.3212,这前三个的特征值均大于1,而其余的均小于1。

第一、二、三的特征值的累计方差百分比是0.740。上述都表明原来10个变量反映的信息可由三个主成分反映74.00%,一般认为,累计方差百分比达到70%以上,即认为比较满意。而本文的累计贡献率是74.00%。

运用Minitab最终得出:在河南省29家上市公司中,林州重机、平高电气、焦作万方、黄河旋风、三全食品等几家公司的综合评价处于领先地位。其中,林州重机、黄河旋风、三全食品虽然综合排名靠前,但发展能力方面仍有很大改善空间。另一方面,豫光金铅、中原高速、ST思达、ST安彩、豫能控股的综合财务状况排名比较靠后,需要加以改善。

参考文献:

[1] 张晓峰,李博.主成分分析法在上市公司财务业绩评价中的应用[J].财会月刊.2007.12

[2] 彭亚. 基于主成分分析的上市公司经营管理业绩评价[J]. 山东商业职业技术学院学报.

2010年12月

SPSS主成分分析 篇7

在经济管理、工程技术等研究领域,多元线性回归是应用最为广泛的统计分析与预测技术之一,它一般采用最小二乘方法(Ordinary Least Squares,简称OLS)估计回归系数,以使残差平方和达到最小;但当数据观察次数n小于自变量个数p时,自变量之间存在多重相关性,此时OLS方法失效。而这种自变量之间多重相关性问题在多元线性回归分析中危害非常严重,但又普遍存在。为消除这种影响,目前学术界的解决方法主要有两种:(1)采用主成分回归(Principal Components Regression,简称PCR)方法,这种方法虽然能够消除自变量之间存在的多重相关性,但由于提取成分时没有考虑到与因变量的联系,因此经常出现主要成分对因变量的解释性不强的情况。(2)针对PCR的缺陷,文献[1]中提出了偏最小二乘回归(Partial Least Squares Regression,简称PLSR)方法。近年来的理论和实践研究都表明,PLSR的成分提取和参数估计依然会受到自变量严重多重相关性的影响[2]。此外,其迭代算法容易产生较大的累计计算误差。

本文从经典主成分回归的基本原理出发,分析了PCR的优点和不足,重点探讨了主成分个数m优化选择问题,并用我国沪指数据与所有的沪市A股交易波动数据进行PCR实证分析。

1主成分回归基本原理[4]

因变量Y与p个自变量X1,X2,…,Xp,做n次观察的多元线性回归模型为:

记Z=(Z1,…,Zr,…,Zp),则

Z=X·A,X=Z·AT,由主成分原理知,Z1,…,Zp即为X的所有主成分。

由高斯-马尔科夫定理可知,式(2)中,回归系数B的最小二乘线性无偏估计为:

主成分回归方程为:

2 PCR方法性能分析

评价线性回归模型的性能可从两方面进行:拟合的有效性和模型的稳定性。下面从式(4)中分析Y与X的回归性能(特别情况下,可从式(3)中取数分析)。

3主成分个数m与模型性能关系分析

4 PCR方法实证分析

设pij表示某j只股票第i周的收盘价,其对数收益为:xij=lnpij-lnp(i-1)j,现从2013年6月1日至2014年8月31日沪市A股65个交易周中,滤去有停牌的股票,共选取640只股票及相应的沪市A股大盘指数周收益数据Y=(y1,…,y65)T,得数据矩阵如表一所示。

图一前30个主成分的累计贡献率

图二主成分个数m与残差平方和、回归系数的均方误差

(4)当m=27时,由Matlab7.0编程,得主成分回归模型:

图三应变量Y与其估计值的拟合

后13周预测拟合图如图四所示。

图四应变量Y的预测与其观测值的拟合

5模型检验

6结束语

从本文的实证分析中可看出,对于自变量个数p较大,而样本数m较小的情况下,PCR是一种非常有效且适用的技术方法,其拟合和预测效果均比较理想。

摘要:针对多元线性回归模型中,自变量之间存在多重相关性问题,本文根据主成分回归原理建立模型,对主成分个数选择与模型的性能之间的关系进行了详细分析,并用沪市A股收益波动性数据进行了实证分析。结果表明:当主成分个数m增加时,模型的残差平方和SES会下降,而回归系数的均方误差MSE会上升,因此m的选择应以SES和MSE的变化趋势交点为宜。

关键词:多元线性回归,最小二乘法,主成分回归

参考文献

[1]Wold S,Albano C,Dunn M,et al.Pattern Regression Finding and Usingr Egularitiesin Multivariate Data[M].London:Analysis Applied Science Publication,1983.

[2]王惠文,王吉力,黄海军.主成分回归的建模策略研究[J].北京航空航天大学学报,2008,34(06):661-664.

[3]童恒庆.理论计量经济学[M].北京:科学出版社,2005.

[4]高慧璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[5]曲双红,李华,李刚.基于主成分分析的几种常用改进方法[J].统计与决策,2011,(05):155-156.

[6]韩汉鹏.偏最小二乘法在回归设计多因变量建模中的应用及其优化[J].数理统计与管理,2007,26(02):303-307.

[7]熊幼林.病态线性回归模型系数的主成分——岭估计[J].数学学习与研究(教研版),2014,(09):121.

核主成分分析概述 篇8

核主成分分析是一种非线性推广的主成分分析。大量结果显示[31], 核主成分分析法由于在非线性统计和高阶统计特征提取具有较好的效果, 相对于传统的主成分分析观测数据的特点, 具有更好的分类能力。传统的基于矢量的主成分分析和核主成分分析方法, 计算数字图像数据的特征的方法是, 所有二维图像数据计算出由一个堆积行的列向量, 进而对样本图像的列向量协方差矩阵奇异的整体值分解, 然后计算主成分投影, 最典型的例子是著名的面部识别, “特征脸”技术[32]。由上面的处理方法计算得到的图片, 二维图像数据的不足之处是, 图像矩阵堆叠成一个矩阵列向量的像素行后, 在图像之间的相关矩阵被破坏。而且, 传统的计算方法是, 核主成分分析通过非线性映射到高维特征空间进行整体改造, 然后得到向量的内积后 (内核功能) , 操作时并没有考虑到的图像区域或区域的相关信息。

2 核主成分分析

如果得到了向量空间的正交分解, 是对所有训练样本的而言, 那么, m个子空间的求和就构成了样本空间, 也就是

普遍的方案是将m组变换为n个坐标轴方向, n个坐标轴方向都包含在m个组之中, 以使输入向量可变换成成n子向量的加和

在计算输入向量的内积时, 则对其所对的子内积计算向量, 每个内积分向量的定义允许有不同的定义, 也就是说允许引入不同的内核, 各内积分矢量的加权和构建了原有的矢量, 也就是下式所示:

其中kl (x il, x jl) 表示表示第l个子向量的核函数, 显然如果各子向量的核函数满足Mercer条件, 则k (x, y) 也一定满足Mercer条件即为核函数[33]。

基于区域核函数的距离测度算法步骤如下:

(1) 给出数据块的尺寸。将原设图像与目标图像的矩阵分解若干个数据块, 各个数据块按照行来累积成一个列矢量, 每个列矢量累积成一个列矢量。

(2) 抽取一个核函数, 求出原始图像及目标图像的核目标空间的协方差矩阵。

(3) 计算协方差矩阵的特征根和特征向量, 按照大小将特征值排序, 并取前几个 (按方差贡献率确定) 。

(4) 将计算得出的协方差矩阵的特征向量 保存起来, 计算出目标图像与原始图像的特征向量的距离, 并按照大小进行排序, 得到距离最相近的目标图像就是检索图像。

3、结论

上面定义的核函数称为组合核函数, 而各子向量的核函数称为局部核函数, 如果使用组合核函数进行核主成分分析, 则所提取的图像主成分不仅包含图像的整体特征同时又包含图像数据局部特征[1]。文献[2]在运用支持向量机对图像数据进行分类时, 根据图像数据的特点, 提出了一种具体的组合核函数的构成方式, 即将图像用若干个像素邻域 (各邻域可以交叠也可以不交叠) 覆盖, 各邻域的像素数据所形成的向量可视为整个图像数据向量的子向量, 在计算两图像的内积时, 首先对两图像相应的各邻域分别求内积, 再以各邻域的内积之和作为两图像之间的内积, 该文的实验结果表明, 基于局部核函数的支持向量机的分类能力比基于整体核函数的支持向量机的分类准确率要高。根据这一核主成分分析, 得出了一个顺利成章的方向, 因为最初是由在SVM的引导下得出的核主成分分析法。

文献[3]也提出了一种基于组合核函数的KPCA, 该文定义了一种条件正定核函数而非满足Mercer定理的核函数, 也没有考虑各输入向量各分量的关系。本章提出根据图像数据的之间的矢量相关性得到的各个组成部分, 也就是根据窗口用来使区域相关的图像数据由核函数来加权求和体现。

参考文献

[1]Pentland A et al, Photobook:tools for conteni-based manipulation of image databases, International Joumal of Computer Vision 1996, 18 (3) :233-254

[2]Smith J R and Chang S F, Querying by color regions using the Visual SEEk content-based visual query system, Intelligent Multimedia Information Retrieval (Maybury, M T, ed) .AAAIPress, Menlo Park, CA, 1997:23-41

教室卫生评价指标的主成分分析 篇9

教室是学生学习的最主要场所,学生在学校的大部分时间都是在教室中度过,因而教室卫生对学生健康影响较大。主成分分析法是良好的构效关系分析方法,为完善标准,了解各指标的实际关联,笔者用主成分分析法对《评价》中的教室主要指标进行了分析。

1 对象与方法

1.1 对象

随机抽取沈阳市和平区6所中小学教室进行卫生监测,其中小学3所,中学3所。每所学校每个年级调查1间教室,共调查31间教室。

1.2 方法

1.2.1 测量

按照《评价》的要求进行教室卫生学指标测量。

1.2.2 主成分分析

利用SPSS 11.5软件[2]对实际调查中影响教室得分的主要指标,如人均面积、课桌椅符合率、采光系数、玻地比、教室照度、CO2体积分数、室温、教室噪声等,进行主成分分析,列出主成分表达式,探讨各成分的意义,并对同一成分中部分指标进行相关分析,分析各因子间关系。

1.2.3 相对权重

将各主成分表达式乘以相应的特征根,得到各指标的系数,归一化后,即可得到相对权重,进而确定主要影响因素;将原标准相应权重归一化,与新权重进行比较。

2 结果

经KMO检验及球型检验,该数据符合主成分分析的要求。 特征根及方差贡献率见表1。根据特征根及方差贡献率大小综合考虑,决定提取前4个主成分,各成分因子负荷见表2。

通过观察因子负荷和因子得分(表3)可以发现:第1主成分主要由人均面积、采光系数、教室照度构成,其中教室照度、采光系数2项占主要部分,可以认为该成分主要反映了包括教室的自然照明(采光系数)和人工照明(教室照度)的实际综合光照情况。另外,人均面积为负指标,经相关分析发现人均面积与采光系数和教室照度均呈显著负相关(r=-0.648,P<0.01,r=-0.588,P<0.01),因而推测,人均面积可能为影响教室照明的负性影响因素。

第2主成分主要由教室噪声和玻地比构成,按照《评价》的要求,测量外界噪声干扰要分别在开窗和关窗时进行2次,以关窗为本底值,故而教室噪声与窗口的大小或玻地比可能有相关性。经相关分析教室噪声和玻地比呈正相关(r=0.402,P<0.05)。因此推测第2主成分主要反映外界环境通过窗户对教室的影响,且以噪声为主。

第3主成分主要由CO2体积分数和室温构成,它们同是标准中室内微小气候的指标,因而该成分反映教室室内微小气候。

第4主成分主要由课桌椅符合率构成,反映教室课桌椅情况。

简化的主成分表达式如下:

Z1=-0.352X1+0.343X3+0.332X5

Z2=0.426X4+0.580X8

Z3=0.585X6+0.526X7

Z4=0.899X2

将各主成分表达式乘以相应的特征根,得到各指标系数,归一化后,即可得指标的相对权重(表4)。影响程度最大为光照的总体情况(26%),其次是微小气候(包括CO2体积分数、室温,共占23%),噪声(14%)。

将原标准相应的权重归一化,与新权重进行比较。教室照度、室温、CO2体积分数、教室噪声、人均面积权重与原标准相差不大,采光系数、玻地比权重增大,课桌椅符合率权重减小。

3 讨论

3.1 各指标间的相互关系

通过分析发现,学校教室卫生指标主要可以分为4类,1类即包括教室的自然照明(采光系数)和人工照明(教室照度)实际光照的综合情况;2类主要为外界环境通过窗户对教室的影响,且以噪声为主;3类为室内微小气候由CO2体积分数和室温构成;4类反映教室课桌椅情况,由课桌椅符合率构成。这与《综合评价标准》划分的维度基本相符,建议将自然照明和人工照明划为同一维度。

分析结果发现,人均面积在光照主成分中为负性作用,且与教室照明和采光均呈负相关,在调查中笔者也发现类似情况。对于这一现象笔者认为城市地区教室的大小大致相同,教室人均面积主要取决于教室人数[3,4,5],人均面积大,人数也较少。这样的教室通常照明较差,采光也不好,可能的原因一是由于教室人数少,座位相对分散,在同样照明的情况下,单位课桌面积的平均照度也有所下降;二是该类教室多是非重点教室,灯具陈旧、损坏严重,教室位置不好,采光较差。另外,人数较少,为了节能,灯具使用率也人为地减低。教室人均面积的原标准确定主要依据课桌的长度[6],目的是为了座位的舒适;但通过分析发现,人均面积与照明亦有一定关联,应该在今后修订标准时加以适当考虑这一混杂因素,减少其对评价结果的干扰。

分析还发现噪声与玻地比呈正相关,并且同为一个主成分的影响指标。因而,噪声可能与玻地比存在某种关联,或有共同的作用。由于2者都与直接通向外界的窗户大小关联,故提示玻地比可能反映了外界环境通过窗户对教室的影响。因而,玻地比不仅仅与采光有关,建议今后应该考虑制定一个通过窗户这一重要媒介影响教室的能反映外界声、光、影像干扰的综合指标。

CO2体积分数、室温共同反映了冬季室内微小气候的情况。调查发现 CO2浓度、室温的因子系数符号相同,提示2者作用是同向的,他们共同反映教室空气质量,高CO2则教室空气质量差,同样过高室温也不是良好环境的反映,因此冬季室温不宜过高,原标准仅有室温下限,建议参考《儿童少年卫生学》规定的16~20℃[6]的范围制定其上限。

3.2 各因素对教室卫生状况的影响及权重大小的修订

参考各成分构成和各指标权重,笔者发现光照是当前影响教室卫生的最重要的指标,无论是光照的总体情况(26%)或是采光系数、教室照度都有较大权重。提示今后应改善教室光照。另外,反映自然光的采光系数权重有较大提升,反映各教室在自然光方面有较大差异,今后应加强监测,努力改善;同时也应规范测量的方法,减少其不确定性[7]。

指标权重的决定最好由专家主观经验和统计学依据2方面因素共同决定[8]。既要使权重反映指标的卫生学重要性,又要考虑在实际测量中变异波动的情况。原标准的权重主要依据专家经验,结合此次实际调查分析后,建议应适当提高采光系数、玻地比的权重,减小课桌椅符合率的权重。

当然,此次评价仍存在许多不足之处,欠缺对农村学校的评估,评价指标也仅限于教室卫生的主要指标,有待于今后进一步改进。

参考文献

[1]卫生部学校卫生标准专业委员会.学校卫生监督综合评价.GB/T18205-2000.北京:中国标准出版社,2000:1.

[2]唐功爽.基于SPSS的主成分分析与因子分析的辨析.统计教育,2007(2):12-14.

[3]郑志华.2000年云南省学校卫生监测结果分析.中国校医,2003,l7(1):50.

[4]李香兰,徐能义,赵金龙.包头市区中小学校经常性卫生状况调查分析.包头医学院学报,2003,18(3):186-188.

[5]冯碧君,赵薇,蔡建忆.宁波市区16所中学卫生监督监测结果分析.海峡预防医学杂志,2003,9(2):54.

[6]叶广俊,主编.儿童少年卫生学.4版.北京:人民卫生出版社,2000:156-167.

[7]张宁,沈明珠.教室采光系数测量的不确定度评定.中国校医,2003,17(5):428-429.

基于主成分分析的城市创新能力评价 篇10

在人类社会从工业社会向知识社会的演进过程中, 现代科学技术起到了引领和不断推动的作用, 而创新作为科学技术发展的推动力也越来越成为国家经济发展的核心驱动力。

创新这一概念最早见于经济学家约瑟夫-熊彼特[1]的“创新理论”, 他把创新界定为“执行新的组合”, 即建立一种新的生产函数, 把一种关于生产要素和生产条件的新组合引入生产体系。围绕这一概念, 后来的研究者逐步建立起以创新为核心的经济发展理论, 并广泛指导于科技、产业等生产实践领域。1987年, 英国经济学家弗里曼运用国家创新系统这一概念分析日本经济问题[2], 他将创新系统作为一种理论概念和分析方法而引起了学术界的重视和肯定。英国的库克于1992年在《区域创新系统:全球化背景下区域政府管理的作用》一书中提出了区域创新系统[3] (Regional Innovation Systems) , 从系统构成的角度对区域创新系统的概念作了界定。20世纪90年代, 美国“可持续社区联合中心”发表了题为《创新型市县伙伴关系》的报告, 总结许多城市已完成的创新性项目的经验。芬兰首都赫尔辛基市政府与赫尔辛基技术大学于2001年共同设立了“创新型城市计划”, 希望通过伙伴之间的合作, 激发创造力和创新精神。创新已经逐步成为了各国发展的战略选择, 成为城市经济发展重要的内在动力和决定性因素。

胡锦涛主席在2006年1月召开的全国科学技术大会上, 明确提出:到2020年, 使中国的自主创新能力显著增强, 进入创新型国家行列的目标。随后, 北京、上海、深圳、大连、南京、青岛等城市均提出建设创新型城市, 将提高自主创新能力作为城市发展的首要任务。对于创新型城市的界定和对城市的创新能力评价也就显示出了极其重要的意义。

目前国内对于创新型城市的研究中, 有很多对于城市创新能力的评价指标以及评价方法的研究。有关城市竞争力、区域现代化和可持续发展的评价的研究均涉及创新指标, 而且基本都采用多指标的综合评价的方法, 主要有以下三种关于创新能力的评价指标体系: (1) 从投入-产出的角度出发, 如胡琴[4]将区域创新能力评价指标分为:科技进步技术基础、科技活动投入、科技活动产出、科技进步对经济社会发展的贡献等四大类共26个指标; (2) 从系统功能的角度出发, 如王国贞[5]将区域创新能力评价指标分为:知识生产能力、知识扩散能力、企业技术创新能力、创新环境、创新效益等五大类别共31个指标; (3) 从系统的构成要素出发, 如罗守贵、甄峰[6]将区域创新能力评价指标分为:区域综合实力、教育资源与潜力、科学技术资源与潜力、企业创新能力、信息条件、区域政策与管理水平等六大类共52个指标。当然三种分类不是绝对的, 有部分指标体系都是三种分类之间有不同程度的交叉关系。在众多研究中, 最突出的问题在于以往用指标体系对创新能力所做的评价没有提供具体的衡量指标, 且个别权重的确定带有极重的主观性, 如采用专家打分法, 另外有的标准值的取定也没有具体的依据。针对这些问题, 许多学者力求探索在分析方法上的解决办法, 而主成分分析方法因其独特的优点为城市创新能力的评价提供了较为科学与客观的途径。

2 主成分分析的基本原理及优点

主成分分析方法也称主分量分析, 旨在利用降维的思想, 把多指标转化为少数几个综合指标。在实证问题研究中, 为了全面、系统地分析问题, 我们必须考虑众多指标, 在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息, 并且变量之间彼此有一定的相关性, 因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时, 变量太多会增加计算量和增加分析问题的复杂性, 人们希望在进行定量分析的过程中, 涉及的变量较少, 得到的信息量较多。主成分分析是适应这一要求产生的一种数学变换方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量, 这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变, 使第一变量具有最大的方差, 称为第一主成分, 第二变量的方差次大, 并且和第一变量不相关, 称为第二主成分, 依次类推。主成分在方差贡献率中的比例越大, 它在综合评价中的作用就越大。当前k个主成分的方差累积贡献率超过85%, 可认为这k个主成分可以反映足够的信息量, 可以用来解决实证问题[7]。

主成分分析法确定权数有以下优点: (1) 可消除评价指标之间的相关影响, 因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分; (2) 可减少指标选择的工作量, 由于其它评价方法难以消除评价指标间的相关影响, 所以选择指标时要花费不少精力, 而主成分分析由于可以消除这种相关影响, 在指标选择上相对容易些; (3) 主成分分析中各主成分是按方差大小依次排列顺序的, 在分析问题时, 可以舍弃一部分主成分, 只取前后方差较大的几个主成分来代表原变量, 从而减少了计算工作量。

3 评价指标体系

在众多的已研究得出的城市创新能力评价指标体系中, 不同的评价体系有不同的侧重点, 涉及各种各样的指标。为了能科学、客观、准确、合理地衡量城市创新能力, 本文选取了9个代表性的指标, 建立了相应的统计评价指标体系, 包括文化方面、教育方面、科技方面、基础设施方面、综合经济方面的指标共9项, 具体为:

A1——地方财政支出中教育支出占GDP的比值 (%)

A2——人均社会固定资产投资 (万元/人)

A3——每万人拥有的国际互联网数 (户/万人)

A4——人均实际利用外资 (美元/人)

A5——每百人拥有的公共图书馆藏书 (册、件/百人)

A6——人均地区生产总值 (元/人)

A7——每万人专利申请授权量 (件/万人)

A8——每万人中高等学校学生数 (人/万人)

A9——每万人技术成果成交金额 (元/人) 。

4 评价过程

结合前面的指标体系, 根据2007年全国统计年鉴和城市统计年鉴, 得到以下的原始数据表格, 如表1。

数据来源:中国统计年鉴 (2007) [8], 中国城市统计年鉴 (2007) [9]

4.1 原始数据的标准化

评价指标是由多个指标构成, 为了避免量纲和数量级的影响, 必须对数据进行标准化处理, 即将它们都转化成无量纲数据。采用标准差标准化方法[10]进行标准化处理, 公式为:

Yi=Xi-X¯S,

式中, X¯=1ni=1nXiS=1 (n-1) i=1n (Xi-X¯) 2,

Yi ——指标标准化值, Xi——指标初始值, X¯—指标初始平均值, S——指标初始标准差值, n——样本数。标准化后数据如表2所示。

4.2 主成分分析

采用SAS系统软件作为分析工具进行主成分分析, 输入主成分分析的princomp语句, 得到了Correlation Matrix (相关系数矩阵, 此表略) 、Eigenvalue (特征值) 、Proportion (方差贡献率) 、Cumulative (累积方差贡献率) 以及主成分荷载矩阵, 如表3和如表4所示。

从表3可以看到每个主成分的方差, 即特征值, 它的大小表示了对应成分能够描述原有信息的多少, 按照累计贡献率达到85%的原则, 前3个特征值大于1的主成分, 其方差累计贡献率已达到89.49%, 得出只需提取3个主成分已能概括出绝大部分信息的结论, 因此, 这里提取前三个成分分别作为第一主成分、第二主成分以及第三主成分。

4.3 计算结果

将这3个主成分的方差贡献率归一化, 得到η值, 即有η1=0.6195, η2=0.2187, η3=0.1618, 以此为权重, 利用式F=η1F1+η2F1+η3F3, 计算出各评价对象的综合评价得分F和各个城市创新能力的排名顺序, 计算结果如表5所示。

4.4 评价结果及分析

根据表5中的排名顺序, 可以科学地了解所选取的16个城市的创新能力。我们把以上16个城市大致的分为三类, 第一类包括五个城市, 分别为深圳、上海、北京、青岛、广州。这五个城市在16个样本城市中, 创新型城市实现程度最高, 它们或科技资源密集, 研发实力雄厚, 如北京;或市场完善, 开放程度高, 如上海、深圳[11];或民营企业发展迅速, 企业创新能力强, 知名品牌众多, 如青岛、广州。总而言之, 它们在知识创新能力、创新环境支撑能力等方面都具有一定的优势, 并在某些方面表现较为突出, 如北京、上海的知识创造与流动能力、教育和研究机构创新能力, 深圳、青岛[12]的人才创新能力、企业创新能力, 广州的新产业创新能力和经济结构转型能力。第二类包括苏州、南京、杭州、天津、沈阳、宁波、大连七个城市, 它们占样本城市总数的一半, 代表了目前大多数城市的发展水平。这些城市虽然已经具备了建设创新型城市的基础, 但总体实力仍显薄弱, 特别是在某些领域存在薄弱点, 如沈阳的创新环境、经济结构转型, 南京的城市创新环境支撑能力等, 这就需要在未来制定创新型城市发展战略的过程中有所侧重。此外, 在这七个城市中, 天津处于中间位置, 各项指标水平也基本处于中游, 因此我们认为其城市整体发展较为均衡, 但是优势和特色不突出, 距离创新型城市的目标距离较大, 城市创新任务艰巨。第三类包括武汉、成都、西安和重庆, 它们的创新能力相对较差, 无论是知识创新能力还是环境支撑能力的基础均相对薄弱。因此, 就需要在建设创新型城市的过程中, 采取更加有力的战略措施, 强化政府主导和制度创新, 充分利用现有资源, 提高城市开放水平, 激发城市创新活力, 提高城市发展的综合创新水平。

5 总结

通过本文的研究, 我们发现在创新型城市建设中, 深圳、上海、北京、青岛、广州五城市排位均处于前列, 表明在创新型城市建设中已经具备领先于国内其他城市的基础条件和其他优势;苏州、南京、杭州、天津、沈阳、宁波、大连为创新型城市建设的二类城市, 是创新型城市建设中的生力军;武汉、成都、西安、重庆为创新型城市建设的三类城市, 主要指标均处于相对落后的位置, 表明这些城市要建设创新型城市, 需要在城市整体实力上有较大的提升。

需要指出的是, 本论文中选取的指标仅仅是具有代表性的个别指标, 必然是不甚完整的, 存在一定的局限性。但是选用的主成分分析法对于我国城市的创新能力评价, 是具有开创性意义的。随着创新能力评价指标体系的建立和完善, 创新型城市评价的研究也将更趋科学、合理和完善。

摘要:随着提高我国自主创新能力目标的提出, 各大城市纷纷提出建设创新型城市的任务, 城市创新能力评价的研究工作也日趋重要。在以往研究的基础上, 开创性地以主成分分析为方法, 结合SAS系统软件为分析工具对北京、上海、深圳等中心城市进行了城市创新能力的分析。

关键词:创新型城市,主成分分析,评价指标

参考文献

[1]熊彼特.经济发展理论[M].北京:商务印书馆, 1990:73-74.

[2]克里斯托弗弗里曼.日本:一个新国家创新系统, 技术进步与经济理论[M].北京:经济科学出版社, 1992:402-419.

[3]COOKE P, HANS-JOACHIMBRACZYK H J, HEIDENREICH M.regional innovation systems:the role of Governances in the GlobalizedWorld[M].London:UCLPress, 1996.

[4]胡琴.湖北省区域科技创新能力综合评价和研究[J].武汉理工大学学报, 2003, 2 (25) :94-95.

[5]王国贞.河北省区域技术创新能力评价研究[J].河北科技大学学报, 2005, 9 (26) :254-255.

[6]罗守贵, 甄峰.区域创新能力评价研究[J].南京经济学院学报, 2000, 3:32-33.

[7]史锦凤, 马力.基于主成分分析的区域创新能力评价[J].济南大学学报, 2007, 1 (21) :68.

[8]国家统计局, 科学技术部.中国统计年鉴 (2007) [M].北京:中国统计出版社, 2007.

[9]国家统计局, 科学技术部.中国城市统计年鉴 (2007) [M].北京:中国统计出版社, 2007

[10]陈安明.基于人才结构的区域人才效能综合评价[J].重庆大学学报, 2007.8 (30) :151-152.

[11]倪鹏飞.二十四城市各领风骚 (一) ——点评我国二十四个城市竞争力[J].当代经济.2002 (4) :27.

上一篇:中小学教育科研分析下一篇:互动性教学初中历史