時(shí)間:2022-09-28 02:20:43
序論:寫(xiě)作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來(lái)了七篇主成分分析論文范文,愿它們成為您寫(xiě)作過(guò)程中的靈感催化劑,助力您的創(chuàng)作。
主成分分析法,又稱(chēng)主分量分析法是指相關(guān)的經(jīng)濟(jì)變量間通常存在著起主導(dǎo)作用的決定性因素,通過(guò)對(duì)原始變量的相關(guān)矩陣內(nèi)部結(jié)構(gòu)進(jìn)行分析,找出幾個(gè)不相關(guān)的綜合指標(biāo)來(lái)線性表示原來(lái)的變量,主成分之間既互不相關(guān),又盡可能多的包含了原指標(biāo)集合。這種方法首先由Hotelling提出,其主要思想是降維。Stone(1947)對(duì)美國(guó)1929-1938年間的17項(xiàng)國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)進(jìn)行主成分分析,發(fā)現(xiàn)完全可以用三個(gè)經(jīng)濟(jì)指標(biāo)來(lái)概括原來(lái)的17項(xiàng)指標(biāo),大大簡(jiǎn)化了數(shù)據(jù)分析。M.Scott(1961)對(duì)英國(guó)157個(gè)城鎮(zhèn)的發(fā)展水平進(jìn)行主成分分析,發(fā)現(xiàn)原57個(gè)測(cè)度指標(biāo)完全可以由5個(gè)綜合變量替代,既解決了原指標(biāo)間的信息重疊問(wèn)題,又簡(jiǎn)化了原指標(biāo)體系的指標(biāo)結(jié)構(gòu),主成分分析由此推廣。邱東(1990)系統(tǒng)闡述了主成分分析法的定義、基本思想、基本步驟和特點(diǎn),認(rèn)為主成分分析法可以消除評(píng)價(jià)指標(biāo)間的相關(guān)影響,并且伴隨數(shù)學(xué)變換過(guò)程生成信息量權(quán)數(shù)和系統(tǒng)效應(yīng)權(quán)數(shù),保證了客觀性。同時(shí)也指出了主城分析法在計(jì)算綜合評(píng)價(jià)值未充分考慮指標(biāo)的重要程度等不足,主要適用于被評(píng)價(jià)對(duì)象較多的綜合評(píng)價(jià)。隨后,眾多學(xué)者對(duì)此提出了改進(jìn):孟生旺(1992)針對(duì)原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理和主成分個(gè)數(shù)的選擇問(wèn)題,認(rèn)為標(biāo)準(zhǔn)化不如均值化的無(wú)量綱處理方法,提出了非標(biāo)準(zhǔn)化主成分分析法。陳述云等(1995)通過(guò)對(duì)原始數(shù)據(jù)作對(duì)數(shù)—中心化轉(zhuǎn)換,用原始變量的非線性組合表示主成分,同時(shí)重點(diǎn)分析樣本協(xié)方差矩陣而非相關(guān)系數(shù)矩陣,提出了非線性主成分法。朱泰英等(2004)提出了加權(quán)主成分分析法,認(rèn)為可以將主成分分析法的客觀分析和層次分析法的主觀分析有機(jī)結(jié)合。王璐等(2006)在對(duì)主成分分析法的權(quán)數(shù)、降維等問(wèn)題的研究上,提出了首先要按主成分分析法對(duì)指標(biāo)體系進(jìn)行分類(lèi),得到各方面的評(píng)價(jià)值后再進(jìn)行主成分分析,最終得到綜合評(píng)價(jià)值的二重主成分分析法。段力誌等(2009)在傳統(tǒng)主成分分析法基礎(chǔ)上,首先對(duì)原始指標(biāo)值進(jìn)行預(yù)處理,再借助軟件,將原始數(shù)據(jù)轉(zhuǎn)化為少數(shù)幾個(gè)主成分的線性組合,并進(jìn)行加權(quán)變換,得到改進(jìn)的主成分綜合值。白雪梅等(1995)則分析了“均值化”、“標(biāo)準(zhǔn)化”、“極差正規(guī)化”三種方法的選擇條件是保證方差損失最小。陳衍泰等(2004)認(rèn)為主成分分析法具有全面性、可比性和客觀合理性等優(yōu)點(diǎn),比較適合對(duì)評(píng)價(jià)對(duì)象進(jìn)行分類(lèi),但需要大量數(shù)據(jù),函數(shù)意義不夠明顯,不能反映客觀發(fā)展水平。蘇為華(2012)提出經(jīng)典的R型主成分本質(zhì)是單項(xiàng)指標(biāo)標(biāo)準(zhǔn)化結(jié)果的加權(quán)算術(shù)平均值,比當(dāng)量平均法復(fù)雜。趙利等(2013)通過(guò)主成分分析法對(duì)宏觀經(jīng)濟(jì)中影響城鎮(zhèn)勞動(dòng)就業(yè)因素分析時(shí),提出主成分為宏觀經(jīng)濟(jì)和技術(shù)進(jìn)步,通過(guò)VAR模型對(duì)主成分進(jìn)行分析,得出宏觀成分中對(duì)城鎮(zhèn)勞動(dòng)就業(yè)影響最大的是消費(fèi)、產(chǎn)業(yè)結(jié)構(gòu)和城市化水平,而技術(shù)進(jìn)步成分中影響最大的是技術(shù)進(jìn)步的結(jié)論。黃利文(2013)針對(duì)主成分分析中存在的未考慮負(fù)向因子的影響,以及采用線性加權(quán)法時(shí)確定權(quán)重方法不統(tǒng)一,評(píng)價(jià)結(jié)果非唯一等缺陷,提出了逼近理想點(diǎn)的主成分分析法,更好地反映了原始數(shù)據(jù)信息,并較為客觀地給出了綜合評(píng)價(jià)結(jié)果。林海明等(2013)認(rèn)為主成分分析因缺乏應(yīng)用條件的考慮而導(dǎo)致評(píng)價(jià)結(jié)果不具合理性甚至錯(cuò)誤,通過(guò)分析因子分析法因子載荷陣的簡(jiǎn)單結(jié)構(gòu)、加權(quán)算術(shù)平均數(shù)的合理性,得出主成分分析的應(yīng)用條件是:指標(biāo)是正向、標(biāo)準(zhǔn)化的;主成分載荷陣達(dá)到更好的簡(jiǎn)單結(jié)構(gòu)時(shí),主成分正向,且主成分與變量顯著相關(guān)。
二、因子分析
法因子分析法是指從被評(píng)對(duì)象的觀察變量的相關(guān)度出發(fā),利用降維的思想,把繁雜的變量盡可能歸納為幾個(gè)綜合因子進(jìn)行分析的的一種多變量統(tǒng)計(jì)分析方法。其基本思想是:將觀察變量按相關(guān)度的高低或聯(lián)系的緊密程度進(jìn)行分類(lèi),類(lèi)別內(nèi)部變量相關(guān)性高,聯(lián)系緊密,而類(lèi)別之間的變量則相關(guān)度較低,聯(lián)系稀疏,每一類(lèi)變量則代表一個(gè)公共因子。具體步驟為:
三、逼近理想解的排序法
關(guān)鍵詞 期刊評(píng)價(jià);區(qū)間數(shù)據(jù);主成分分析;相關(guān)分析
中圖分類(lèi)號(hào) 文獻(xiàn)標(biāo)識(shí)碼 A
Analyzing the Current Development of Periodicals
Based on Interval-Censored Data
LI Jing-bo
(Periodical Agency, Hunan University, Changsha, Hunan 410082, China)
Abstract The article uses all periodicals' data collected in CSSCI database to build a model by the ways of relative analysis and interval-censored data's principal component analysis. It analyzes all periodicals in the database objectively and systematically, and explores its characters, regularity and reasons, which provides some ways to manage academic journal better.
Key words periodicals' comment; interval-censored data; principal component analysis; relative analysis
1 引 言
學(xué)術(shù)期刊作為科學(xué)技術(shù)事業(yè)的重要組成部分,具有傳播知識(shí)、傳播思想、傳播信息的重要功能,與科技創(chuàng)新和進(jìn)步有著密不可分的關(guān)系.另一方面,學(xué)術(shù)期刊作為衡量一個(gè)國(guó)家的科技發(fā)展水平的尺度,標(biāo)志著該國(guó)家的生產(chǎn)力水平高低及科學(xué)文化事業(yè)的興旺發(fā)達(dá)程度,會(huì)產(chǎn)生巨大的社會(huì)影響和經(jīng)濟(jì)效益.因此,辦好學(xué)術(shù)期刊是建立我國(guó)科學(xué)和技術(shù)創(chuàng)新體系的重要環(huán)節(jié)[1].
自20 世紀(jì)80 年代以來(lái),中國(guó)的學(xué)術(shù)期刊出現(xiàn)了一個(gè)“黃金時(shí)代”,數(shù)量急劇增長(zhǎng),似乎呈現(xiàn)出一片繁榮的景象.據(jù)統(tǒng)計(jì),目前,全世界共有近24萬(wàn)種期刊,85%在發(fā)達(dá)國(guó)家出版發(fā)行;學(xué)術(shù)性期刊約10 萬(wàn)種,其中重要科技期刊8 萬(wàn)種,幾乎全為發(fā)達(dá)國(guó)家所擁有.與發(fā)達(dá)國(guó)家相比較而言,我國(guó)所擁有的學(xué)術(shù)期刊并不多,2008年全國(guó)共出版期刊95 49種,平均期印數(shù)16 767萬(wàn)冊(cè),總印數(shù)31.05億冊(cè),總印張157.98億印張,其中,學(xué)術(shù)期刊有6 000余種(哲學(xué)、社會(huì)科學(xué)類(lèi)2 339種),在整個(gè)期刊中所占比例在40%左右[2].
從數(shù)量上講,我國(guó)僅次于美國(guó),成為世界學(xué)術(shù)期刊第二大國(guó).雖然從學(xué)術(shù)期刊和學(xué)術(shù)論文的絕對(duì)數(shù)量上來(lái)看,我國(guó)算得上是一個(gè)學(xué)術(shù)期刊大國(guó),但是我國(guó)學(xué)術(shù)期刊發(fā)展仍面臨著發(fā)展水平參差不齊、優(yōu)秀稿源外流等諸多問(wèn)題.因此,建立科學(xué)的評(píng)價(jià)模型,分析我國(guó)學(xué)術(shù)期刊的發(fā)展現(xiàn)狀和特點(diǎn),以期對(duì)我國(guó)學(xué)術(shù)期刊的健康發(fā)展發(fā)揮有效的導(dǎo)向作用,并促進(jìn)其管理的標(biāo)準(zhǔn)化、規(guī)范化.
期刊評(píng)價(jià)是文獻(xiàn)計(jì)量學(xué)研究的重要組成部分,它通過(guò)對(duì)學(xué)術(shù)期刊的發(fā)展規(guī)律和增長(zhǎng)趨勢(shì)進(jìn)行量化分析,揭示學(xué)科文獻(xiàn)數(shù)量在期刊中的分布規(guī)律.
評(píng)價(jià)學(xué)術(shù)期刊的文獻(xiàn)計(jì)量指標(biāo)多種多樣,各有側(cè)重.在評(píng)價(jià)期刊時(shí),單一使用任何一種指標(biāo)都可能造成某些方面不同程度的片面性,而選擇許多個(gè)指標(biāo)時(shí),又常因個(gè)數(shù)太多而增加對(duì)問(wèn)題分析的復(fù)雜性,且人為確定指標(biāo)權(quán)重會(huì)產(chǎn)生主觀偏差,加上對(duì)于指標(biāo)之間的相關(guān)性未給充分的考慮,造成所確定的權(quán)重并不是實(shí)際計(jì)算過(guò)程中所體現(xiàn)的真實(shí)權(quán)重[3].
隨著人們對(duì)期刊評(píng)價(jià)工作重要性認(rèn)識(shí)的不斷加深,評(píng)價(jià)方法有了很大的進(jìn)展,出現(xiàn)了諸如綜合評(píng)分、專(zhuān)家討論、費(fèi)用效益分析、層次分析、模糊聚類(lèi)、模糊評(píng)判、灰色統(tǒng)計(jì)、熵值法以及改進(jìn)熵值法,灰色關(guān)聯(lián)分析、人工神經(jīng)網(wǎng)絡(luò)方法、主成分分析方法等評(píng)價(jià)方法.這些方法在評(píng)價(jià)工作中展示了各自的優(yōu)點(diǎn),同時(shí)也暴露出各自的弱點(diǎn)和缺陷,在此不一一贅述.
現(xiàn)有期刊評(píng)價(jià)的研究大多聚焦于通過(guò)建立指標(biāo)體系,對(duì)某一類(lèi)學(xué)術(shù)期刊進(jìn)行綜合排序,并且所使用的數(shù)據(jù)樣本規(guī)模較小.本文將采用CSSCI數(shù)據(jù)庫(kù)中收錄的全部期刊數(shù)據(jù),通過(guò)相關(guān)分析、區(qū)間數(shù)據(jù)主成分分析等方法建立模型,實(shí)現(xiàn)數(shù)據(jù)降維和可視化,客觀地對(duì)整個(gè)數(shù)據(jù)庫(kù)中各學(xué)科期刊的整體特征進(jìn)行全面、系統(tǒng)的分析,探尋其中的特征、規(guī)律以及原因.
2 數(shù)據(jù)描述與指標(biāo)選擇
本文的數(shù)據(jù)來(lái)自于中文社會(huì)科學(xué)引文索引(Chinese Social Sciences Citation Index,簡(jiǎn)稱(chēng)CSSCI)是由南京大學(xué)中國(guó)社會(huì)科學(xué)研究評(píng)價(jià)中心開(kāi)發(fā)研制的引文數(shù)據(jù)庫(kù),用來(lái)檢索中文人文社會(huì)科學(xué)領(lǐng)域的論文收錄和被引用情況.CSSCI中收錄期刊均為學(xué)術(shù)性期刊,以反映我國(guó)社會(huì)科學(xué)研究和科研成果應(yīng)用為主要方向,充分顯示我國(guó)的科研水平,因此利用其數(shù)據(jù)可以一定程度反映我國(guó)學(xué)術(shù)期刊的整體情況.
2007-2008年,CSSCI來(lái)源期刊共收錄528種期刊,CSSCI擴(kuò)展版收錄期刊的數(shù)量為152種,CSSCI來(lái)源集刊共收錄86種期刊,共計(jì)收錄766種期刊.
CSSCI使用的指標(biāo)分為兩類(lèi):(一類(lèi)反映情況,包括發(fā)文量、基金論文數(shù)、發(fā)文機(jī)構(gòu)數(shù)、篇均參考文獻(xiàn)量、自引率、引用半衰期等6個(gè)指標(biāo),
另一類(lèi)屬于引證指標(biāo),包括影響因子、即年指標(biāo)、總被引頻次、自被引率、被引半衰期等5個(gè)指標(biāo)[4].
下面對(duì)上述11個(gè)指標(biāo)的含義進(jìn)行簡(jiǎn)要介紹[5].
1)發(fā)文量.絕對(duì)數(shù)量指標(biāo),指某一期刊在一定時(shí)期內(nèi)(一年)所刊登的全部論文數(shù),反映了期刊的信息含量.發(fā)文量越高,說(shuō)明期刊的信息含量就越大.
2)基金論文數(shù).
絕對(duì)數(shù)量指標(biāo),指期刊在當(dāng)年中受基金資助的論文數(shù)量可測(cè)度期刊在學(xué)術(shù)交流中的地位,表征論文產(chǎn)出性質(zhì)的重要指標(biāo),可以衡量期刊論文學(xué)術(shù)質(zhì)量.基金論文數(shù)越多,說(shuō)明期刊論文的學(xué)術(shù)質(zhì)量就越高.
3)發(fā)文機(jī)構(gòu)數(shù).絕對(duì)數(shù)量指標(biāo),指期刊當(dāng)年所中所涉及的不同機(jī)構(gòu)的數(shù)量,可測(cè)度期刊論文的機(jī)構(gòu)分布情況,衡量期刊科學(xué)生產(chǎn)能力,機(jī)構(gòu)分布越廣,說(shuō)明期刊具有開(kāi)放性和作者隊(duì)伍具有廣泛性.發(fā)文機(jī)構(gòu)數(shù)越多,說(shuō)明期刊的影響范圍就越廣.
4)篇均參考文獻(xiàn)量.相對(duì)數(shù)量指標(biāo),指在給定的時(shí)間內(nèi)(一年),期刊中的平均參考文獻(xiàn)量,在數(shù)值上等于期刊參考文獻(xiàn)數(shù)/期刊論文總數(shù),通常可以反映期刊吸收信息的能力以及科學(xué)交流程度的高低.篇均參考文獻(xiàn)量越多,說(shuō)明期刊吸收的信息越多.
5)自引率.相對(duì)數(shù)量指標(biāo),指該刊在當(dāng)年的自引次數(shù)占該刊當(dāng)年參考文獻(xiàn)總數(shù)的比例.自引率越高,說(shuō)明期刊引用論文中的大部分是發(fā)表在自身期刊上的,學(xué)術(shù)交流程度則越低,且若自引率過(guò)高,往往說(shuō)明該期刊有不良的非正常自引現(xiàn)象.
6)引用半衰期.絕對(duì)數(shù)量指標(biāo),指該期刊當(dāng)年引用類(lèi)型為期刊的參考文獻(xiàn)中較新的一半是在多長(zhǎng)時(shí)間中發(fā)表的,可測(cè)度期刊文獻(xiàn)老化的速度[6].
一般來(lái)說(shuō),半衰期長(zhǎng)的期刊比短的期刊影響更深遠(yuǎn)一些.但該指標(biāo)受學(xué)科的內(nèi)容、性質(zhì)等因素的制約,比如說(shuō)發(fā)展穩(wěn)定的學(xué)科比發(fā)展較快、較活躍的學(xué)科長(zhǎng),基礎(chǔ)理論學(xué)科的比技術(shù)學(xué)科的長(zhǎng),歷史悠久的比新興學(xué)科的長(zhǎng).因此該指標(biāo)在判斷期刊學(xué)術(shù)質(zhì)量時(shí)往往不易解釋和操作.
7)影響因子.相對(duì)數(shù)量指標(biāo),指期刊前2 年的被引次數(shù)占前2 年該刊所總數(shù)的比例.
表征論文被引強(qiáng)度的重要指標(biāo),反映學(xué)術(shù)影響力.影響因子可克服由于發(fā)文量不同所造成的對(duì)期刊被引率的偏差,使期刊總被引頻次這一絕對(duì)指標(biāo)變成了相對(duì)指標(biāo),所以能較好地反映期刊被使用的真實(shí)客觀情況,從而可以對(duì)不同期刊的引用次數(shù)和質(zhì)量進(jìn)行比較,以說(shuō)明其利用率在科學(xué)上的重要性.通常影響因子越大,可以認(rèn)為期刊在科學(xué)發(fā)展和文獻(xiàn)交流過(guò)程中的作用和影響較大,其學(xué)術(shù)水平也較高.影響因子是期刊評(píng)價(jià)中最重要的指標(biāo)之一.
8)即年指標(biāo).相對(duì)數(shù)量指標(biāo),指某刊當(dāng)年的被引次數(shù)占該刊當(dāng)年總數(shù)的比例,是表征論文被引速度的主要指標(biāo).即年指標(biāo)越大,說(shuō)明期刊論文被引的數(shù)量多且速度快.
9)總被引頻次.絕對(duì)數(shù)量指標(biāo),指某刊自創(chuàng)刊以來(lái)所刊登的全部論文在某一年被其他期刊(包括本刊)引用的總次數(shù),可測(cè)度期刊自創(chuàng)刊以來(lái)的學(xué)術(shù)影響力,是從信息反饋的角度評(píng)價(jià)期刊的基本指標(biāo)之一,表征期刊學(xué)術(shù)質(zhì)量的重要指標(biāo)[4].
體現(xiàn)了被引用過(guò)程的總體規(guī)模.總被引頻次也是期刊評(píng)價(jià)中最重要的指標(biāo)之一.
10)自被引率.相對(duì)數(shù)量指標(biāo),指某期刊當(dāng)年被本刊引用的次數(shù)占該刊當(dāng)年被引用總次數(shù)的比例.與自引率類(lèi)似,自被引率越高反而不好.
11)被引半衰期.絕對(duì)數(shù)量指標(biāo),指某期刊在某年被引用的全部論文中較新的一半是在多長(zhǎng)時(shí)間中發(fā)表的.
與引用半衰期類(lèi)似,被引半衰期在期刊評(píng)價(jià)中的受各種因素影響大且不易直接判斷好壞.
以上11個(gè)指標(biāo)中,自引率和自被引率兩個(gè)指標(biāo)屬于反映期刊水平的逆向指標(biāo),而引用半衰期和被引半衰期兩個(gè)指標(biāo)不能簡(jiǎn)單地用數(shù)值大小來(lái)解釋期刊水平的優(yōu)劣,故只選取余下的7個(gè)指標(biāo)(發(fā)文量、基金論文數(shù)、發(fā)文機(jī)構(gòu)數(shù)、篇均參考文獻(xiàn)量、影響因子、即年指標(biāo)、總被引頻次)進(jìn)行以下的建模分析.
3 模型建立及結(jié)果分析
本節(jié)采用相關(guān)分析和區(qū)間數(shù)據(jù)主成分分析等方法建立模型,從期刊計(jì)量指標(biāo)進(jìn)行篩選和大規(guī)模期刊數(shù)據(jù)的“打包”處理兩方面,評(píng)價(jià)期刊的發(fā)展水平.
3.1 相關(guān)分析
相關(guān)分析是研究隨機(jī)變量之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的變量探討其相關(guān)方向以及線性相關(guān)程度的一種統(tǒng)計(jì)方法.
采用SPSS 15.0軟件對(duì)7個(gè)指標(biāo)的原始數(shù)據(jù)進(jìn)行相關(guān)分析,得到見(jiàn)表1.
表1顯示了7個(gè)指標(biāo)之間的相關(guān)系數(shù),可以看出,發(fā)文量與基金論文數(shù)、發(fā)文機(jī)構(gòu)數(shù)的相關(guān)性很強(qiáng),影響因子與即年指標(biāo)、總被引頻次中度相關(guān)[4].
由于基金論文數(shù)、發(fā)文機(jī)構(gòu)數(shù)和發(fā)文量的相關(guān)程度非常高,僅用其中一個(gè)指標(biāo)就能夠代表三者所包含的絕大部分信息.而發(fā)文量的應(yīng)用更具普遍性,這里篩掉基金論文數(shù)、發(fā)文機(jī)構(gòu)數(shù)兩個(gè)指標(biāo),用余下的5個(gè)指標(biāo)繼續(xù)對(duì)全部期刊進(jìn)行數(shù)據(jù)分析.
3.2 區(qū)間數(shù)據(jù)主成分分析
區(qū)間數(shù)據(jù)是一種非常重要的數(shù)據(jù)概念.與傳統(tǒng)的分析方法不同,區(qū)間數(shù)據(jù)分析研究的數(shù)據(jù)表單元不再是一般意義下的定量和定性數(shù)值,而是一個(gè)實(shí)數(shù)域區(qū)間.經(jīng)打包處理后的數(shù)據(jù)集合在幾何上表現(xiàn)為一個(gè)高維的超矩形,這種處理方式不僅能夠反映大規(guī)模數(shù)據(jù)的集中趨勢(shì)和離散程度,同時(shí)有助于從整體上把握數(shù)據(jù)集合的表現(xiàn)特征和內(nèi)在規(guī)律[7].
設(shè)有一個(gè)N個(gè)樣本點(diǎn)和p個(gè)變量的數(shù)據(jù)表XN×p=xijN×p.根據(jù)數(shù)據(jù)系統(tǒng)中的某些重要屬性,將這N個(gè)樣本點(diǎn)劃分成n類(lèi)子集合:S1,S2,…,Sn.如果用區(qū)間數(shù)據(jù)ek來(lái)概括Sk,常用的方法有:
ek=x-kj,kj=min i∈Sk(xij),max i∈Sk(xij),
j=1,2,…,p. (1)
在實(shí)際應(yīng)用中,還可以采用適當(dāng)?shù)姆治稽c(diǎn)作為每個(gè)區(qū)間的上下限.
一般地, n個(gè)數(shù)據(jù)集合Sk,k=1,…,n,可以被概括成一個(gè)n×p維的“樣本點(diǎn)×定量區(qū)間變量”類(lèi)型的數(shù)據(jù)表,其形式為.
n×p=[x11,11][x12,x12]…[x1p,x1p][x21,x21][x22,x22]…[x2p,x2p]……
[xn1,xn1][xn2,xn2]…[xnp,xnp]
=(e1)′(e2)′(en)′.(2)
這里,ei=[xi1,xi1][xi2,xi2]…[xip,xip]′,被稱(chēng)為區(qū)間數(shù)據(jù)表的樣本點(diǎn).
由于區(qū)間數(shù)據(jù)的特殊性,在對(duì)以區(qū)間數(shù)據(jù)為單元的數(shù)據(jù)表進(jìn)行主成分分析時(shí),首先要按照一定的展平算法,將區(qū)間數(shù)據(jù)表展平為普通數(shù)據(jù)表.本文采用因素區(qū)間數(shù)據(jù)展平算法.該方法首先對(duì)每一個(gè)數(shù)據(jù)集合求主成分,然后分別用各個(gè)主成分的最大值和最小值來(lái)概括區(qū)間數(shù)據(jù),并用高維超矩形的頂點(diǎn)作為樣本點(diǎn)生成普通數(shù)據(jù)表.該方法能夠以很高的精度代表原始數(shù)據(jù)的取值范圍,計(jì)算出的主軸誤差較小[8].
本文采用發(fā)文量、總被引頻次、篇均參考文獻(xiàn)量、影響因子、即年指標(biāo)等5個(gè)文獻(xiàn)計(jì)量指標(biāo)對(duì)CSSCI收錄的全部期刊進(jìn)行區(qū)間數(shù)據(jù)的主成分分析.
采用Matlab軟件對(duì)區(qū)間數(shù)據(jù)進(jìn)行主成分分析,得到結(jié)果見(jiàn)表2.
由表2的分析結(jié)果,前兩個(gè)主成分累計(jì)貢獻(xiàn)率接近70%,能夠較好地代表5個(gè)原始變量的大部分信息,因此模型提取第一和第二主成分對(duì)期刊進(jìn)行綜合評(píng)價(jià),其結(jié)果是合理和有效的.
表3的因子載荷矩陣反映了第一和第二主成分和5個(gè)原始變量的相關(guān)性.可以看到,第一主成分與5個(gè)原始變量均正相關(guān),與影響因子、總被引頻次呈強(qiáng)正相關(guān),說(shuō)明第一主成分主要反映的是期刊被引用的情況,體現(xiàn)其學(xué)術(shù)影響力,以影響因子這一指標(biāo)為代表.
第二主成分與發(fā)文量、總被引頻次正相關(guān),特別是和發(fā)文量強(qiáng)正相關(guān),與剩下其他三個(gè)變量負(fù)相關(guān),說(shuō)明第二主成分反映期刊的載文信息含量,以發(fā)文量這一指標(biāo)為代表.
根據(jù)主成分分析的結(jié)果,可將符號(hào)對(duì)象在第一、第二主成分上的得分情況繪制成圖,觀察期刊的特征.如圖1所示,主平面圖的橫軸和縱軸的含義與主成分分析的第一主軸和第二主軸相同,描述期刊的區(qū)間數(shù)據(jù)在主平面上均以“十”字表示.其中,每一個(gè)“十”字的交叉點(diǎn)表示相應(yīng)學(xué)科期刊的中心位置,而十字的長(zhǎng)短則分別表示該類(lèi)期刊在第一與第二主軸的離散范圍.通過(guò)觀察期刊在主平面圖上的位置,可以把握它們各自在兩方面指標(biāo)上的表現(xiàn)特征,進(jìn)而了解各學(xué)科期刊的整體特點(diǎn).
圖1 因子載荷圖4 結(jié)論與建議
近年來(lái),我國(guó)科技水平快速發(fā)展,學(xué)術(shù)論文的數(shù)量和質(zhì)量也在不斷提高,然而相較而言,我國(guó)學(xué)術(shù)期刊與國(guó)際的差距卻非常明顯.因此必須正確認(rèn)識(shí)我國(guó)學(xué)術(shù)期刊的發(fā)展現(xiàn)狀,采用客觀、科學(xué)、合理的手段評(píng)價(jià)學(xué)術(shù)期刊,指導(dǎo)學(xué)術(shù)期刊的管理工作和發(fā)展方向.
本文的研究對(duì)CSSCI數(shù)據(jù)庫(kù)中收錄的數(shù)百種學(xué)術(shù)期刊進(jìn)行了全面、系統(tǒng)描述,并且通過(guò)建立模型,得出了一些有益的結(jié)論.
首先,學(xué)術(shù)期刊的發(fā)展差異很大,一方面反映在不同學(xué)科之間,另一方面反映在同一學(xué)科內(nèi)水平參差不齊,因此在評(píng)價(jià)期刊時(shí),不宜用同一套指標(biāo)對(duì)全部期刊大排名,而用學(xué)科內(nèi)排名.
其次,就評(píng)價(jià)指標(biāo)而言,各種指標(biāo)反映的信息主要集中在兩個(gè)維度.其一是體現(xiàn)被引用情況的一類(lèi)指標(biāo),如影響因子、總被引頻次等,其次是反映信息含量的一類(lèi)指標(biāo),如發(fā)文量等.在對(duì)學(xué)術(shù)期刊進(jìn)行綜合評(píng)價(jià)時(shí),要挖掘系統(tǒng)的內(nèi)部特性,重點(diǎn)把握其主要差異所在,便于期刊的管理和遴選.
近年來(lái),隨著經(jīng)濟(jì)的發(fā)展和社會(huì)的變革,學(xué)術(shù)界的浮燥之風(fēng),也影響到學(xué)術(shù)期刊的質(zhì)量.這一方面表現(xiàn)在有重大影響的社會(huì)科學(xué)成果和具有深遠(yuǎn)意義的原創(chuàng)性成果比較匱乏,缺少創(chuàng)新,缺少健康和必要的學(xué)術(shù)探討,有水準(zhǔn)的爭(zhēng)鳴和書(shū)評(píng)少之又少.另一方面則表現(xiàn)為低水平重復(fù)的社會(huì)科學(xué)成果大量剩余,大部分學(xué)術(shù)論文質(zhì)量平平,甚至偏低[2].
學(xué)術(shù)期刊所面臨的問(wèn)題已經(jīng)引起了廣泛的重視.隨著科研體制的進(jìn)一步完善,學(xué)術(shù)期刊也將與時(shí)俱進(jìn),順應(yīng)時(shí)代和社會(huì)的發(fā)展,尋找自身的出路.
首先要提高期刊的綜合質(zhì)量,引領(lǐng)學(xué)術(shù)創(chuàng)新.提高刊物的質(zhì)量首先就是要爭(zhēng)取好的稿源,通過(guò)擴(kuò)大交流,舉辦研討會(huì)等方式,主動(dòng)爭(zhēng)取好的稿源.
其次提高編輯隊(duì)伍的專(zhuān)業(yè)素質(zhì).應(yīng)由掌握除編輯學(xué)之外的某一領(lǐng)域的專(zhuān)業(yè)知識(shí),且學(xué)有所長(zhǎng)、有一定影響力的專(zhuān)家擔(dān)任學(xué)術(shù)期刊的領(lǐng)導(dǎo),而其領(lǐng)導(dǎo)下的編輯工作者隊(duì)伍是由一批具備一定科研能力、在某一領(lǐng)域已有所成就或有較強(qiáng)科研潛力的中青年學(xué)者組成.學(xué)術(shù)期刊編輯自身的科研能力對(duì)于學(xué)術(shù)期刊發(fā)展具有十分重要的作用.
還有就是加快學(xué)術(shù)期刊國(guó)際化步伐.學(xué)術(shù)期刊承載著重要的社會(huì)責(zé)任,要努力推進(jìn)合作中的學(xué)術(shù)交流,躋身于世界知名期刊行列.提高學(xué)術(shù)意識(shí),反映我國(guó)學(xué)術(shù)研究的狀況,尤其是科技期刊要依托我國(guó)學(xué)術(shù)研究的專(zhuān)業(yè)優(yōu)勢(shì),真正在國(guó)際上代表這一領(lǐng)域的較高水平.學(xué)術(shù)期刊應(yīng)與時(shí)俱進(jìn),打造亞洲一流乃至世界一流的學(xué)術(shù)期刊.參考文獻(xiàn)
[1] 杜玲.我國(guó)學(xué)術(shù)期刊數(shù)字化面臨的問(wèn)題與對(duì)策[J].天水行政學(xué)院學(xué)報(bào),2010,(6):114-117.
[2] 冷曉玲.學(xué)術(shù)期刊現(xiàn)狀和發(fā)展的思考[J]. 濰坊學(xué)院學(xué)報(bào),2008,(5):119-122.
[3] 邱均平. 文獻(xiàn)計(jì)量學(xué)[M ]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社,1988:2-34.
[4] 杜飛,房濤,葛學(xué)銘,等.1999~2008年中國(guó)應(yīng)用生理學(xué)雜志載文統(tǒng)計(jì)分析[J].中國(guó)應(yīng)用生理學(xué)雜志,2010,(2):252-255.
[5] 張建勇.中國(guó)科學(xué)計(jì)量指標(biāo):期刊引證報(bào)告[M].北京:中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心出版社,2006.
[6] 譚果林.科技情報(bào)信息出版物有效性評(píng)價(jià)指標(biāo)分析[J].太原科技,2009(10):42-44.
【關(guān)鍵詞】人臉識(shí)別 判別過(guò)程 歐氏距離 馬氏距離
隨著技術(shù)的不斷進(jìn)步,人臉識(shí)別系統(tǒng)正在逐漸進(jìn)入日常應(yīng)用,在企業(yè)、住宅安全、刑偵、自助服務(wù)、信息安全等領(lǐng)域有著廣泛的市場(chǎng)前景。目前人臉識(shí)別方法主要有:幾何特征的人臉識(shí)別方法,基于主成分分析(PCA)的人臉識(shí)別方法等。
1 識(shí)別方法簡(jiǎn)介
幾何特征的人臉識(shí)別方法研究開(kāi)始于上世紀(jì)60年代末,通過(guò)考量眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系實(shí)現(xiàn)人臉幾何特征的提取。此方法識(shí)別速度快,所占內(nèi)存小,但識(shí)別率較低。
基于主成分分析的人臉識(shí)別方法主要是基于KL(Karhunen-Loeve)變換的識(shí)別方法,KL變換以矢量信號(hào)的協(xié)方差矩陣的歸一化正交特征矢量所構(gòu)成的正交矩陣來(lái)對(duì)該矢量信號(hào)正交變換。在圖像處理中,高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果人臉在這些低維線性空間的投影具有可分性,將這些投影作為識(shí)別的特征矢量。PCA具有良好的去相關(guān)特性,KL變換后的矢量信號(hào)分量互不相關(guān)。同時(shí)KL變換是在均方誤差測(cè)度下,失真最小的一種變換。PCA也是目前人臉識(shí)別的主流方法。
PCA特征值提取時(shí)首先計(jì)算矩陣樣本的協(xié)方差矩陣,然后計(jì)算協(xié)方差矩陣的本征向量e1,e2,…,eN的本征值。通過(guò)PCA訓(xùn)練多個(gè)樣本的特征值即可作為此人的特征,在識(shí)別過(guò)程中,用已有的特征值和提取出的本征值計(jì)算距離,作為人臉識(shí)別的判別依據(jù)。
2 主要算法分析
距離計(jì)算主流的方法有歐式距離和馬氏距離。
歐氏距離(Euclidean distance)可以描述為在n維空間內(nèi),最短的線的長(zhǎng)度。歐氏距離可以表示為:
歐氏距離將臉部特征的之間的差別等同看待,并沒(méi)有對(duì)于主要特征重點(diǎn)考量,而馬氏距離可以解決此問(wèn)題。
馬氏距離也可以定義為兩個(gè)服從同一分布并且其協(xié)方差矩陣為Σ的隨機(jī)變量與的差異程度。對(duì)于樣本集Xi,馬氏距離可以表示為:
其中為樣本平均值,S表示樣本的協(xié)方差。
馬氏距離不受量綱的影響,兩點(diǎn)之間的馬氏距離與原始數(shù)據(jù)的測(cè)量單位無(wú)關(guān),馬氏距離還可以排除變量之間的相關(guān)性的干擾。
3 系統(tǒng)實(shí)現(xiàn)方法
在人臉識(shí)別系統(tǒng)的判別方法設(shè)計(jì)中,參考馬氏距離的加權(quán)思想,對(duì)特征值的歐氏距離進(jìn)行加權(quán)。在提取人臉特征值時(shí),取(樣本數(shù)-1)作為提取的特征值的數(shù)量。查看特征值所對(duì)應(yīng)的圖片效果,以29個(gè)特征值為例,效果如下:
對(duì)于權(quán)值的選取,考慮到相近特征值所表示的特征之間差異性很小,并且其表示的實(shí)質(zhì)性參量的不確定性,所以將一組固定數(shù)量且相鄰的特征值取同一權(quán)值。得到經(jīng)過(guò)加權(quán)的距離后,計(jì)算置信度,置信度定義為:
其中 為訓(xùn)練樣本值,aj為樣本權(quán)值。
如訓(xùn)練樣本取30張人臉圖片,其特征值選30-1=29個(gè),固定若干個(gè)特征值一組,每組用同一權(quán)值aj。特征值越靠前,表示其可參考性越大,所賦予的權(quán)值也應(yīng)該越高。
對(duì)于非加權(quán)算法的歐氏距離,通常認(rèn)為置信度高于0.5表示兩張圖片相似程度高,低于0.5表示相似程度低。但在人臉識(shí)別過(guò)程中發(fā)現(xiàn),在訓(xùn)練樣本不是特別多的情況下判決門(mén)限會(huì)隨著訓(xùn)練樣本的增加而增加,而且判決門(mén)限值也會(huì)高于0.5,實(shí)驗(yàn)中判決門(mén)限一般定在0.8以上,判決門(mén)限的設(shè)定也和前期圖片預(yù)處理的方法有關(guān)。
4 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)訓(xùn)練樣本數(shù)分別取30,40,50,60,70,綜合10個(gè)不同的人在同一位置分別計(jì)算加權(quán)算法置信度和非加權(quán)算法置信度來(lái)作對(duì)比。分析實(shí)驗(yàn)結(jié)果,得到4條平均置信度隨訓(xùn)練樣本數(shù)變化的曲線。訓(xùn)練樣本數(shù)較小的時(shí)候置信度隨訓(xùn)練樣本數(shù)的增加而增加比較明顯。但在訓(xùn)練樣本數(shù)較大的情況下,置信度隨訓(xùn)練樣本數(shù)變化不明顯。對(duì)于正確的樣本,加權(quán)算法所得到的置信度高于非加權(quán)算法得到的值,而對(duì)于錯(cuò)誤的樣本,加權(quán)算法所得到的置信度低于非加權(quán)算法得到的值,所以采用加權(quán)算法可以加強(qiáng)判別過(guò)程的區(qū)分度,提高樣本的識(shí)別度。
參考文獻(xiàn)
[1]吳迪.基于特征臉改進(jìn)算法的人臉識(shí)別技術(shù)的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué)碩士論文,2007.
[2]李.基于主成分分析的人臉識(shí)別[D].濟(jì)南:山東大學(xué)碩士學(xué)位論文,2008.
[3]柯曉華.人臉識(shí)別算法研究及實(shí)現(xiàn)[D].哈爾濱:哈爾濱工程大學(xué)碩士學(xué)位論文,2008.
[4]孫偉,李曉飛.基于PCA的實(shí)時(shí)人臉識(shí)別系統(tǒng)[J].中國(guó)多媒體通信,2013(04).
[5]何振學(xué),張貴倉(cāng),譙鈞,楊林英.對(duì)稱(chēng)核主成分分析及其在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程,2013(03).
[6]郭浩,王國(guó)宇.一種基于中值思想的改進(jìn)人臉識(shí)別方法[J].現(xiàn)代電子技術(shù),2013(02).
[7]李冠楠,李強(qiáng).一種基于人臉核心特征的PCA人臉識(shí)別算法及應(yīng)用[J].電子器件,2012(05).
關(guān)鍵詞:主成分分析 證券公司 競(jìng)爭(zhēng)力
中圖分類(lèi)號(hào):F830.91 文獻(xiàn)標(biāo)志碼:A文章編號(hào):1673-291X(2011)28-0074-03
一、研究背景
隨著中國(guó)經(jīng)濟(jì)持續(xù)穩(wěn)定的發(fā)展,證券化程度的不斷提高,中國(guó)資本市場(chǎng)的規(guī)模不斷擴(kuò)大,這為證券公司創(chuàng)新發(fā)展提供了良好的機(jī)遇,券商特別是已上市的證券公司的綜合競(jìng)爭(zhēng)力也得到了長(zhǎng)足的發(fā)展。在當(dāng)前激烈的市場(chǎng)競(jìng)爭(zhēng)中,如何對(duì)上市類(lèi)證券公司的綜合競(jìng)爭(zhēng)力進(jìn)行衡量和分析,以達(dá)到科學(xué)比較,相互借鑒的良性市場(chǎng)機(jī)制,從而提升公司的競(jìng)爭(zhēng)力,已成為證券監(jiān)管部門(mén)、證券公司和投資者關(guān)注的問(wèn)題。
關(guān)于證券公司綜合競(jìng)爭(zhēng)力評(píng)價(jià)的研究,具有代表性的有單項(xiàng)指標(biāo)評(píng)價(jià)法和綜合指標(biāo)評(píng)價(jià)法。單項(xiàng)指標(biāo)評(píng)價(jià)法以證券業(yè)協(xié)會(huì)公布的證券公司業(yè)績(jī)排名為代表,包括資產(chǎn)、利潤(rùn)、承銷(xiāo)收入等單項(xiàng)指標(biāo)排名,單項(xiàng)指標(biāo)排名只能反映證券公司某一方面的能力,不能反映證券公司的綜合實(shí)力,具有一定的局限性。王曉芳、王學(xué)偉等(2008)選取中國(guó)50家證券公司為研究對(duì)象,選擇經(jīng)營(yíng)中的18個(gè)參考指標(biāo),運(yùn)用因子分析法對(duì)證券公司2006年度的經(jīng)營(yíng)狀況做出了客觀全面的評(píng)價(jià)。運(yùn)用綜合指標(biāo)評(píng)價(jià)法對(duì)中國(guó)證券公司競(jìng)爭(zhēng)力進(jìn)行研究具有積極的意義,但是很少有學(xué)者運(yùn)用綜合評(píng)價(jià)法對(duì)中國(guó)上市類(lèi)證券公司股票競(jìng)爭(zhēng)力進(jìn)行評(píng)價(jià)和分析。
本文以15家上市證券公司為研究對(duì)象,選擇其2008―2010年度反映上市公司獲利能力和經(jīng)營(yíng)發(fā)展能力的六個(gè)指標(biāo),運(yùn)用主成分分析法提取影響這些上市證券公司競(jìng)爭(zhēng)力的綜合指標(biāo),并對(duì)這些公司的綜合競(jìng)爭(zhēng)力進(jìn)行了排名和分析,希望能夠給證券公司和投資者有所幫助。
二、主成分分析法的基本原理
主成分分析是在降低維度思想下產(chǎn)生的處理高維數(shù)據(jù)的統(tǒng)計(jì)方法,即用為數(shù)較少的、信息互不重疊的新變量來(lái)反映原變量提供的大部分信息,從而通過(guò)對(duì)為數(shù)較少的新變量的分析達(dá)到解決問(wèn)題的目的。
主成分分析可廣泛的應(yīng)用于經(jīng)濟(jì)指標(biāo)的評(píng)價(jià),其具體的步驟如下:
首先,對(duì)原始指標(biāo)數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,并基于標(biāo)準(zhǔn)化的數(shù)據(jù)計(jì)算相關(guān)系數(shù)矩陣R。計(jì)算相關(guān)系數(shù)矩陣R的目的是通過(guò)其求出主成分。
其次,求出相關(guān)系數(shù)矩陣R的特征值λk(k=1,2,…n)以及各樣本主成分的方差貢獻(xiàn)率、累計(jì)方差貢獻(xiàn)率,并根據(jù)累計(jì)方差貢獻(xiàn)率選取主成分Zj(j=1,2,…r)。
最后,以每個(gè)主成分的方差貢獻(xiàn)率為權(quán)數(shù),構(gòu)造綜合評(píng)價(jià)函數(shù)F:
F=■αiZi,其中,αi=■,1≤i≤r。
并根據(jù)綜合評(píng)價(jià)函數(shù)對(duì)上市證券公司綜合競(jìng)爭(zhēng)力進(jìn)行排名。
三、實(shí)證結(jié)果與分析
1.樣本數(shù)據(jù)的選取及指標(biāo)體系的構(gòu)建。為了較為全面了解中國(guó)上市證券公司的綜合競(jìng)爭(zhēng)力,特選取如下六個(gè)指標(biāo)進(jìn)行分析:X1:每股凈收益;X2:凈資產(chǎn)收益率;X3:主營(yíng)業(yè)務(wù)收益率;X4:主營(yíng)業(yè)務(wù)增長(zhǎng)率;X5:凈資產(chǎn)增長(zhǎng)率;X6:總資產(chǎn)增長(zhǎng)率。其中前三個(gè)變量反映了上市證券公司的獲利能力,后三個(gè)變量反映了公司的經(jīng)營(yíng)發(fā)展能力。下頁(yè)表1給出了15家上市證券公司關(guān)于以上六個(gè)指標(biāo)在2008―2010年三年取值的加權(quán)平均,權(quán)數(shù)分別取0.2、0.3和0.5。
由于廣發(fā)證券在2010年2月借殼巨虧的S延邊路上市,在2008―2010年度的相關(guān)財(cái)務(wù)指標(biāo)異常,因此,本文選取其余14家上市證券公司為研究對(duì)象。
2.用統(tǒng)計(jì)數(shù)據(jù)進(jìn)行主成分分析。首先,對(duì)原始指標(biāo)數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,并求出其相關(guān)系數(shù)矩陣:
RR=1 0.661-0.06-0.596 -0.152-0.361 0.661 1-0.591 -0.513 0.0700.013-0.06-0.5911 0.340 -0.309 -0.412-0.596-0.513 0.340 10.0290.343-0.1520.070 -0.309 0.029 1 0.742-0.3610.013-0.4120.343 0.742 1
其次,確定主成分分量。其特征值、方差貢獻(xiàn)率和方差累計(jì)貢獻(xiàn)率(如表2所示)。
表2各主成分特征值、方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率
由表2可知,前兩個(gè)主成分的累計(jì)貢獻(xiàn)率已達(dá)到76.033%(大于75%),這說(shuō)明提取的兩個(gè)主成分能夠解釋這六個(gè)變量75%以上的信息。因此選取前兩個(gè)主成分做進(jìn)一步分析,這兩個(gè)主成分分量的計(jì)算公式是:
Z1=-0.844X1-0.835X2+0.397X3+0.835X4+0.176X5+
0.381X6
Z2=-0.162X1+0.363X2-0.739X3-0.017X4+0.819X5+
0.864X6
分析上述數(shù)據(jù)和公式,發(fā)現(xiàn):第一主成分Z1主要反映在X3,X4指標(biāo)上,說(shuō)明主營(yíng)業(yè)務(wù)利潤(rùn)高,主營(yíng)業(yè)務(wù)增長(zhǎng)快。第二主成分Z2主要反映在X5,X6指標(biāo)上,說(shuō)明凈資產(chǎn)和總資產(chǎn)增長(zhǎng)快。在第一主成分和第二主成分中,X1指標(biāo)的系數(shù)都是負(fù)數(shù),表明每股凈收益指標(biāo)在描述上市證券公司獲利能力上是不足的。上市證券公司獲利能力主要體現(xiàn)在反映主營(yíng)業(yè)務(wù)指標(biāo)的第一主成分上,經(jīng)營(yíng)發(fā)展能力主要反映在凈資產(chǎn)和總資產(chǎn)的增長(zhǎng)速度上。
3.各主成分排序。基于上面提取的兩個(gè)主成分對(duì)14家上市證券公司排名,每個(gè)公司在各個(gè)主成分上的得分是按照主成分公式計(jì)算而得。然后根據(jù)提取的兩個(gè)主成分計(jì)算出綜合評(píng)價(jià)函數(shù)F,F(xiàn)=0.4067Z1+0.3536Z2。
該函數(shù)使用各主成分的貢獻(xiàn)率為權(quán)重。利用F函數(shù)對(duì)14家上市證券公司進(jìn)行綜合排名。所有排名(如表3所示)。
四、結(jié)論與分析
從表3可以看出,在主成分Z1中,太平洋、西南證券和山西證券排名靠前,說(shuō)明這三家公司獲利能力較強(qiáng),在主成分Z2中,西南證券,山西證券和華泰證券排名靠前,說(shuō)明這三家公司經(jīng)營(yíng)發(fā)展能力較強(qiáng)。在綜合評(píng)價(jià)函數(shù)F中,西南證券、山西證券和太平洋證券排名靠前,說(shuō)明這三家上市證券公司的綜合競(jìng)爭(zhēng)能力較強(qiáng)。在證券業(yè)協(xié)會(huì)的行業(yè)排名中居前的中信證券、東北證券在這里排名卻靠后,說(shuō)明這幾家公司的綜合競(jìng)爭(zhēng)力在證券類(lèi)上市公司中不具優(yōu)勢(shì)。無(wú)論是第一主成分、第二主成分還是綜合評(píng)價(jià)函數(shù)的得分比較接近,差距不大,說(shuō)明中國(guó)的這些上市類(lèi)證券公司處于平穩(wěn)發(fā)展期,綜合競(jìng)爭(zhēng)力差別不大。
上市類(lèi)證券公司的排名情況與公司財(cái)務(wù)狀況有直接的關(guān)系,然而,選取不同的財(cái)務(wù)指標(biāo)可能會(huì)產(chǎn)生不同的結(jié)果,并且主成分分析法對(duì)指標(biāo)的選擇帶有一定的主觀性。同時(shí),衡量公司競(jìng)爭(zhēng)力的因素還有很多。
參考文獻(xiàn):
[1]王曉芳,王學(xué)偉.基于因子分析的中國(guó)證券公司競(jìng)爭(zhēng)力研究[J].現(xiàn)代商貿(mào)工業(yè),2008,(1):139-141.
[2]哈達(dá).基于主成分分析的上市公司核心競(jìng)爭(zhēng)力評(píng)價(jià)研究[J].內(nèi)蒙古科技與經(jīng)濟(jì),2009,(11):10-13.
[3]諸藝方,章亞男.制酒行業(yè)上市公司股票競(jìng)爭(zhēng)力分析[J].經(jīng)濟(jì)研究導(dǎo)刊,2010,(36):72-73.
關(guān)鍵詞:生態(tài)城市;主成分分析;綜合評(píng)價(jià)
“生態(tài)城市”是20世紀(jì)70年代聯(lián)合國(guó)教科文組織發(fā)起的“人與生物圈(MAB)”計(jì)劃首先提出了“生態(tài)城市”這一概念。隨著人口的迅速增長(zhǎng),工業(yè)化的深入發(fā)展,諸如城市的大氣污染、水污染、垃圾污染、地面沉降、噪音污染;城市的基礎(chǔ)設(shè)施落后、水資源短缺、能源緊張;城市的人口膨脹、交通擁擠、住宅短缺、土地緊張,以及城市的風(fēng)景旅游資源被污染、名城特色被破壞等一系列問(wèn)題日益突出。如何實(shí)現(xiàn)城市經(jīng)濟(jì)社會(huì)發(fā)展與生態(tài)環(huán)境建設(shè)的協(xié)調(diào)統(tǒng)一,就成為國(guó)內(nèi)外城市建設(shè)共同面臨的一個(gè)重大理論和實(shí)際問(wèn)題。因此,建設(shè)生態(tài)城市已成為城市之間競(jìng)爭(zhēng)的焦點(diǎn),許多城市紛紛加快了城市轉(zhuǎn)型發(fā)展的步伐,把建設(shè)“生態(tài)城市”、“花園城市”、“山水城市”、“綠色城市”作為奮斗目標(biāo)和發(fā)展模式。近年來(lái),關(guān)于生態(tài)城市建設(shè)的研究成為國(guó)內(nèi)外的熱點(diǎn)話題。曾芳芳介紹了國(guó)內(nèi)外“生態(tài)城市”的研究背景以及中外學(xué)者對(duì)其內(nèi)涵的認(rèn)識(shí),重點(diǎn)闡述了國(guó)內(nèi)外學(xué)者對(duì)其的研究理論,并提出生態(tài)城市建設(shè)的理論研究在生態(tài)城市評(píng)估方面的不足,為后期的生態(tài)城市發(fā)展理論研究起著重要的作用;李文君等以西安市為例,對(duì)西安市生態(tài)城市建設(shè)進(jìn)行分析,為以后具體的生態(tài)城市的建設(shè)研究提供了借鑒等。商洛作為國(guó)家“南水北調(diào)”中線工程的主要水源地之一,加強(qiáng)對(duì)商洛生態(tài)環(huán)境的保護(hù),顯得尤為重要。本文以商洛市為研究對(duì)象,結(jié)合商洛市城市建設(shè)實(shí)際,構(gòu)建商洛生態(tài)城市評(píng)價(jià)指標(biāo)體系,運(yùn)用主成分分析等方法,深入探討商洛市生態(tài)城市發(fā)展水平及其影響因素,為打造中國(guó)西部最美的山水園林城市規(guī)劃提供建設(shè)性的意見(jiàn)。
一、生態(tài)城市建設(shè)評(píng)價(jià)指標(biāo)體系的構(gòu)建與評(píng)價(jià)方法
(一)生態(tài)城市綜合評(píng)價(jià)指標(biāo)的選取本文指標(biāo)選取主要是通過(guò)頻度統(tǒng)計(jì)方法,參考關(guān)于生態(tài)城市評(píng)價(jià)的相關(guān)研究論文中的指標(biāo)體系,結(jié)合商洛城市建設(shè)的實(shí)際,堅(jiān)持科學(xué)合理、針對(duì)性強(qiáng),反映生態(tài)城市發(fā)展本質(zhì)的指標(biāo)作為商洛市生態(tài)城市綜合評(píng)價(jià)指標(biāo)體系進(jìn)行科學(xué)評(píng)價(jià),具體指標(biāo)體系構(gòu)建詳見(jiàn)表1。(二)數(shù)據(jù)來(lái)源及評(píng)價(jià)方法指標(biāo)體系所用原始數(shù)據(jù)來(lái)源于《商洛市統(tǒng)計(jì)年鑒》(2007-2016),城市環(huán)境質(zhì)量報(bào)告書(shū)、統(tǒng)計(jì)公報(bào)、政府部門(mén)的調(diào)研數(shù)據(jù)等資料和相關(guān)文獻(xiàn)資料、書(shū)籍、學(xué)術(shù)論文、研究報(bào)告等。本文擬采用主成分分析方法,通過(guò)對(duì)城市經(jīng)濟(jì)、社會(huì)和環(huán)境3個(gè)子系統(tǒng)39個(gè)指標(biāo)進(jìn)行分析確定權(quán)重,綜合評(píng)價(jià)商洛市生態(tài)城市發(fā)展水平。
二、商洛市生態(tài)城市建設(shè)水平的實(shí)證分析
生態(tài)城市建設(shè)的主要目標(biāo)就是實(shí)現(xiàn)可持續(xù)發(fā)展,是一項(xiàng)涉及到經(jīng)濟(jì)、社會(huì)、人口、科技、資源與環(huán)境等子系統(tǒng)組成的時(shí)空尺度高度耦合的復(fù)雜動(dòng)態(tài)開(kāi)放巨系統(tǒng)的系統(tǒng)工程。因此,在生態(tài)城市建設(shè)過(guò)程當(dāng)中,要以生態(tài)學(xué)理論為指導(dǎo),充分考慮生態(tài)城市的自身特點(diǎn),不僅關(guān)注生態(tài)城市的整體發(fā)展,還要關(guān)注城市社會(huì)、經(jīng)濟(jì)、環(huán)境子系統(tǒng)在“關(guān)系”上的協(xié)調(diào)。文章從經(jīng)濟(jì)、社會(huì)與環(huán)境三個(gè)子系統(tǒng)方面入手,通過(guò)SPSS19.0對(duì)這39個(gè)指標(biāo)10年來(lái)的各具體數(shù)據(jù)進(jìn)行主成分分析,提取影響生態(tài)城市發(fā)展的因子,更好地為商洛生態(tài)城市建設(shè)規(guī)劃提供參考。
(一)經(jīng)濟(jì)子系統(tǒng)生態(tài)化建設(shè)水平的影響因素
對(duì)經(jīng)濟(jì)子系統(tǒng)的12個(gè)指標(biāo)通過(guò)主成分分析,確定兩個(gè)主成分F1、F2,由表2分析可以看出各指標(biāo)與各主成分之間的相關(guān)程度。第一主成分與城鎮(zhèn)人均可支配收入、農(nóng)村人均純收入、人均GDP、財(cái)政一般預(yù)算收入、固定資產(chǎn)投資占GDP比重等指標(biāo)相關(guān)程度較高,均達(dá)75%以上,且都是衡量經(jīng)濟(jì)發(fā)展水平的重要指標(biāo),主要反映了經(jīng)濟(jì)發(fā)展的整體水平。F1中尤其是城鎮(zhèn)人均可支配收入、農(nóng)村人均純收入、人均GDP、財(cái)政一般預(yù)算收入的相關(guān)程度高達(dá)97%以上,說(shuō)明這幾個(gè)指標(biāo)在反映商洛經(jīng)濟(jì)發(fā)展水平上,對(duì)其影響更大。第二主成分主要與GDP增長(zhǎng)率、一般財(cái)政預(yù)算收入增長(zhǎng)率、旅游業(yè)增加值占GDP比重等指標(biāo)有一定的相關(guān)性,這些指標(biāo)相比第一主成分指標(biāo),相關(guān)程度所占百分比較低,但是對(duì)經(jīng)濟(jì)發(fā)展的影響又不可忽視。經(jīng)濟(jì)被視為一個(gè)城市、區(qū)域、乃至國(guó)家發(fā)展的“硬實(shí)力”,其發(fā)展水平的高低將直接決定社會(huì)發(fā)展的各個(gè)方面。因此,在建設(shè)生態(tài)城市的同時(shí),要統(tǒng)籌好影響經(jīng)濟(jì)發(fā)展的基礎(chǔ)指標(biāo)和潛在影響力指標(biāo)因子,才能為生態(tài)城市的建設(shè)提供更好的發(fā)展基礎(chǔ)和動(dòng)力。
(二)社會(huì)子系統(tǒng)生態(tài)化建設(shè)水平的影響因素
通過(guò)對(duì)社會(huì)子系統(tǒng)15個(gè)指標(biāo)進(jìn)行主成分分析,確定三個(gè)主成分F1、F2、F3,由表3可以看出:第一主成分(F1)與人均保險(xiǎn)費(fèi)、在校大學(xué)生人數(shù)、城市化水平、衛(wèi)生技術(shù)人員、醫(yī)院床位數(shù)等指標(biāo)相關(guān)程度較高,其相關(guān)程度都在90%以上,這些指標(biāo)既是對(duì)城市功能建設(shè)、社會(huì)保障、教育醫(yī)療等基礎(chǔ)設(shè)施方面的成績(jī)的反映,同時(shí)也是影響社會(huì)生態(tài)化發(fā)展的主要因素。因此,商洛市生態(tài)城市建設(shè)中社會(huì)子系統(tǒng)生態(tài)化的發(fā)展要對(duì)上述指標(biāo)不斷優(yōu)化和升級(jí),有利于商洛生態(tài)城市的總體建設(shè)。與第二主成分(F2)相關(guān)程度較高的指標(biāo)有:城鎮(zhèn)恩格爾系數(shù)、農(nóng)村恩格爾系數(shù)、人均城市道路面積等指標(biāo),主要反映了商洛人民生活質(zhì)量和城市社保障水平,這是對(duì)第一主成分的有力補(bǔ)充,其發(fā)展程度必然對(duì)社會(huì)生態(tài)化產(chǎn)生重要影響。第三主成分(F3)主要是常住人口、人均生活用水量、授權(quán)專(zhuān)利數(shù)指標(biāo),其中關(guān)于人口的發(fā)展又是對(duì)經(jīng)濟(jì)、社會(huì)和生態(tài)發(fā)展等方面都起著巨大的影響。較多的人口可以為區(qū)域的發(fā)展提供充足的勞動(dòng)力和消費(fèi)市場(chǎng);但是過(guò)多的人口也會(huì)對(duì)資源、環(huán)境保護(hù)等方面產(chǎn)生巨大的壓力。所以,可以將第三主成分解釋為人口質(zhì)量與數(shù)量對(duì)商洛生態(tài)城市建設(shè)的影響因素。
(三)環(huán)境子系統(tǒng)生態(tài)化建設(shè)水平的影響因素
由表4可以看出,第一主成分(F1)與廢氣治理設(shè)施處置能力、城鎮(zhèn)人均公園綠地面積、工業(yè)廢水排放量、工業(yè)固體廢物綜合處置量、工業(yè)固體廢物排放量等指標(biāo)其相關(guān)程度達(dá)到75%以上,這些指標(biāo)主要說(shuō)明工業(yè)三廢的處理水平及環(huán)境質(zhì)量狀況。同時(shí)說(shuō)明在生態(tài)城市的建設(shè)中對(duì)生態(tài)環(huán)境的改善應(yīng)重點(diǎn)放在工業(yè)三廢的處理方面,不斷提高生態(tài)環(huán)境質(zhì)量。第二主成分(F2)與污水處理率、工業(yè)固體廢物利用率、人均水資源量等指標(biāo)有較大的相關(guān)性,說(shuō)明商洛在生態(tài)城市建設(shè)過(guò)程中對(duì)水資源的保護(hù)及固體廢棄物的利用程度。第三主成分(F3)與全年城市空氣質(zhì)量達(dá)標(biāo)率等指標(biāo)有關(guān),主要反映了城市環(huán)境治理后的天氣狀況。通過(guò)分析說(shuō)明,商洛生態(tài)化城市建設(shè)中對(duì)環(huán)境的保護(hù)不僅要注重工業(yè)三廢的處理,同時(shí)還要兼顧水環(huán)境污染和空氣污染保護(hù)防治,進(jìn)而使商洛環(huán)境質(zhì)量整體水平得到有效提高。
三、結(jié)論
生態(tài)城市建設(shè)的主要目標(biāo)就是實(shí)現(xiàn)可持續(xù)發(fā)展,本文通過(guò)經(jīng)濟(jì)、社會(huì)與環(huán)境系統(tǒng)的實(shí)證分析結(jié)果來(lái)看,生態(tài)城市建設(shè)涉及到各個(gè)方面,商洛市生態(tài)城市建設(shè)不僅要注重整體發(fā)展水平,還要重視經(jīng)濟(jì)、社會(huì)、環(huán)境各子系統(tǒng)之間的協(xié)調(diào)發(fā)展,共同促進(jìn)商洛市生態(tài)城市建設(shè)的步伐,促進(jìn)商洛經(jīng)濟(jì)又好又快發(fā)展。通過(guò)經(jīng)濟(jì)子系統(tǒng)12個(gè)指標(biāo)主成分分析得出:在生態(tài)城市建設(shè)過(guò)程中,經(jīng)濟(jì)生態(tài)化要把重點(diǎn)放在與第一主成分相關(guān)程度較高的指標(biāo)(城鎮(zhèn)人均可支配收入、農(nóng)村人均純收入、人均GDP、財(cái)政一般預(yù)算收入、固定資產(chǎn)投資占GDP比重)方面,主要反映在經(jīng)濟(jì)發(fā)展水平方面。但由于商洛地處秦嶺腹地,自然環(huán)境復(fù)雜,基礎(chǔ)薄弱,經(jīng)濟(jì)發(fā)展水平低。因此在生態(tài)城市化建設(shè)中應(yīng)不斷加強(qiáng)對(duì)外交流學(xué)習(xí),借鑒成功經(jīng)驗(yàn),大力發(fā)展特色區(qū)域經(jīng)濟(jì),不斷提高經(jīng)濟(jì)發(fā)展水平,促進(jìn)商洛經(jīng)濟(jì)生態(tài)化建設(shè)步伐。但與第二主成分相關(guān)的指標(biāo)也不容忽視。通過(guò)對(duì)社會(huì)子系統(tǒng)的15個(gè)指標(biāo)主成分分析得出:在生態(tài)城市建設(shè)過(guò)程中,社會(huì)生態(tài)化的重點(diǎn)放在與第一主成分(F1)相關(guān)程度較高的指標(biāo)(人均保險(xiǎn)費(fèi)、在校大學(xué)生人數(shù)、城市化水平、衛(wèi)生技術(shù)人員、醫(yī)院床位數(shù))等方面,不斷完善城市功能、社會(huì)保障、教育醫(yī)療等基礎(chǔ)設(shè)施的建設(shè),促進(jìn)商洛市社會(huì)生態(tài)化進(jìn)程。通過(guò)對(duì)社會(huì)子系統(tǒng)的12個(gè)指標(biāo)進(jìn)行主成分分析得出:環(huán)境生態(tài)化重點(diǎn)要放在與第一主成分相關(guān)程度高的指標(biāo)(廢氣治理設(shè)施處置能力、城鎮(zhèn)人均公園綠地面積、工業(yè)廢水排放量、工業(yè)固體廢物綜合處置量、工業(yè)固體廢物排放量)等方面。生態(tài)環(huán)境是經(jīng)濟(jì)和社會(huì)協(xié)調(diào)發(fā)展的前提,隨著城市人口的不斷增多,工業(yè)化發(fā)展的不斷深入,商洛市環(huán)境生態(tài)化要不斷提高對(duì)工業(yè)三廢的處理及利用水平,合理開(kāi)發(fā)利用各種資源,防治水污染和空氣污染,優(yōu)化生態(tài)環(huán)境,不斷提高環(huán)境質(zhì)量,確保經(jīng)濟(jì)、社會(huì)和環(huán)境的協(xié)調(diào)發(fā)展,促進(jìn)商洛市生態(tài)城市建設(shè)整體水平的提高。
作者:王高建 單位:商洛學(xué)院
參考文獻(xiàn):
[1]曾芳芳.國(guó)內(nèi)外生態(tài)城市建設(shè)的理論研究[J].科技廣場(chǎng),2011(10)
[2]李文君;田巧娣.基于主成分分析法的生態(tài)城市建設(shè)綜合評(píng)價(jià)———以陜西省西安市為例.經(jīng)濟(jì)視角(上旬刊),2015(1)
[3]周曉唯,王拓.陜西省生態(tài)城市建設(shè)評(píng)價(jià)指標(biāo)體系[J].城市環(huán)境與城市生態(tài),2009(6)
[4]趙維良,紀(jì)曉嵐,柳中權(quán).主成分分析在城市生態(tài)安全評(píng)價(jià)中的應(yīng)用——以上海為例[J].科技進(jìn)步與對(duì)策,2009(3)
關(guān)鍵詞 PM2.5 線性插值 Box-Cox變換 主成分分析 預(yù)測(cè)分析
中圖分類(lèi)號(hào):X823 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/ki.kjdkz.2016.11.071
0 引言
從長(zhǎng)春市2014年10、11、12月份月平均PM2.5濃度以及優(yōu)良級(jí)天數(shù)監(jiān)測(cè)結(jié)果(數(shù)據(jù)來(lái)自吉林省環(huán)境保護(hù)廳)可以看出:這三個(gè)月長(zhǎng)春市優(yōu)良級(jí)天數(shù)比例均小于50.0%,幾乎整個(gè)冬季都處于連續(xù)污染狀態(tài),霧霾問(wèn)題嚴(yán)重,再加上嚴(yán)寒的天氣,使得市民易于感染呼吸道疾病,甚至加重比如敏感、哮喘病等類(lèi)患者的病情。因此準(zhǔn)確預(yù)測(cè)并及時(shí)公布大氣環(huán)境狀況變得越來(lái)越重要。
近年來(lái),專(zhuān)家學(xué)者開(kāi)展了一些相關(guān)的研究工作。劉小生等①提出了一種基于基因表達(dá)式編程的PM2.5濃度預(yù)測(cè)研究;彭斯俊等②提出了一種基于ARIMA模型的PM2.5預(yù)測(cè)模型;陳俏等③提出了一種基于支持向量機(jī)和回歸法的大氣污染物濃度預(yù)測(cè)模型。這些文獻(xiàn)通過(guò)研究個(gè)別因素對(duì)大氣環(huán)境狀況提出了預(yù)測(cè)方法,但是氣象因素對(duì)PM2.5的影響是十分復(fù)雜的,實(shí)際情況中往往是不同氣象因素相互影響的結(jié)果。尤其是ARIMA模型只突出了時(shí)間因素在預(yù)測(cè)中的作用,沒(méi)有考慮到外界具體因素的影響,因而存在著預(yù)測(cè)誤差的缺陷,當(dāng)遇到外界發(fā)生較大變化往往會(huì)有較大偏差。
本文旨在用與PM2.5濃度相關(guān)性強(qiáng)的因素,綜合考慮PM10、CO、NO2、SO2四項(xiàng)指標(biāo)對(duì)PM2.5濃度的影響,并基于主成分分析理論提取幾個(gè)互不相關(guān)的主成分進(jìn)行回歸分析,最終得到準(zhǔn)確度較高的大氣環(huán)境預(yù)測(cè)模型。
1 材料與方法
1.1 數(shù)據(jù)預(yù)處理
1.1.1 補(bǔ)充缺失數(shù)據(jù)
本文數(shù)據(jù)來(lái)自天氣后報(bào)網(wǎng),共研究PM2.5、PM10、CO、NO2、SO2五項(xiàng)指標(biāo),個(gè)別日期(共4天)的數(shù)據(jù)缺失。這時(shí),我們使用SAS統(tǒng)計(jì)分析軟件,運(yùn)用插值法補(bǔ)全缺失值。
1.1.2 Box-Cox非線性變換④⑤
將原始數(shù)據(jù)中PM2.5、PM10、CO、NO2、SO2等因子依次記為、、、、,因事先由散點(diǎn)圖分析可得,PM2.5與PM10、CO具有良好的線性關(guān)系,考慮到變換的簡(jiǎn)便性最終選定對(duì)PM2.5、PM10和CO做變換%d的值為0,記變換后的PM2.5、PM10和CO為、和;對(duì)NO2和SO2進(jìn)行Box-Cox變換的過(guò)程中,最優(yōu)%d的取值是依據(jù)最大似然估計(jì)的方法原理來(lái)確定,由SAS統(tǒng)計(jì)軟件計(jì)算得到,最終選擇NO2和SO2的最優(yōu)%d值依次為0.5、0,經(jīng)過(guò)Box-Cox變換后的NO2和SO2依次用下列符號(hào)標(biāo)記:和。
1.2 主成分分析原理
主成分分析⑥是將多指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法。這些主成分能夠反映原始變量的絕大部分信息,它們通常表示為原始變量的線性組合,且各個(gè)主成分之間互不相關(guān)。這樣在研究復(fù)雜問(wèn)題時(shí)就可以只考慮少數(shù)幾個(gè)主成分且不止于損失太多信息,從而更容易抓住主要矛盾,解釋事物內(nèi)部變量之間的規(guī)律性,同時(shí)使問(wèn)題得以簡(jiǎn)化,提高分析效率。
2 結(jié)果
2.1 主成分分析
本過(guò)程主要通過(guò)SAS軟件⑦實(shí)現(xiàn),詳細(xì)程序參照附件。輸出結(jié)果(表1)給出了各變量之間的相關(guān)系數(shù)矩陣。可以看出:與之間的相關(guān)系數(shù)為0.8341,呈現(xiàn)非常強(qiáng)的相關(guān)性;
與,與之間的相關(guān)系數(shù)均為0.6800以上,有較強(qiáng)的相關(guān)性,其他變量之間相關(guān)性則相對(duì)較弱。不滿足多元線性回歸的基本假定條件,這也是本文選擇主成分回歸的主要原因之一。
輸出結(jié)果(表2)給出了相關(guān)系數(shù)矩陣的特征值、上下特征值之差、各主成分的方差貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率。可以看出,第一主成分的方差貢獻(xiàn)率為71.34%,前兩個(gè)主成分的累計(jì)貢獻(xiàn)率已達(dá)87.69%,因此,只需前面兩個(gè)主成分就可以概括這組數(shù)據(jù)。根據(jù)相關(guān)系數(shù)矩陣的各個(gè)特征值的特征向量,可以寫(xiě)出前三主成分得分:
2.2 主成分回歸
現(xiàn)在用對(duì)前兩個(gè)主成分和做普通最小二乘回歸,得到主成分回歸方程為:
=3.93932+0.36567Ha0.01363 (3)
但是斜率的t檢驗(yàn)p值0.4123>0.05,未通過(guò)顯著性檢驗(yàn),即認(rèn)為與之間的線性回歸關(guān)系不顯著,需對(duì)模型進(jìn)一步的調(diào)整。
經(jīng)過(guò)多次對(duì)u和主成分、、之間進(jìn)行不同模型模擬對(duì)比分析,最終采用逐步回歸法選取與、做最小二乘回歸,輸出結(jié)果如表3。雖然信息量從原來(lái)的87.69%降到了79.78%,但截距和斜率的t檢驗(yàn)p值
為了得到和、、、之間的關(guān)系,運(yùn)用R軟件⑧編寫(xiě)計(jì)算系數(shù)的函數(shù)代碼作變換,得到還原后的主成分回歸方程為:
3 結(jié)果分析
3.1 殘差分析
回歸方程通過(guò)了t檢驗(yàn),只是表明變量之間的線性關(guān)系是顯著的,但不能保證數(shù)據(jù)擬合得很好,也不能排除由于意外原因而導(dǎo)致的數(shù)據(jù)不完全可靠,比如異常值出現(xiàn)、周期性因素干擾等。借助SAS統(tǒng)計(jì)分析軟件以回歸預(yù)測(cè)值作橫軸,以殘差 =Ha作縱軸,將相應(yīng)的殘差點(diǎn)畫(huà)在直角坐標(biāo)系上,得到殘差圖如圖1。
從殘差圖上看出,殘差是圍繞隨機(jī)波動(dòng)的,表明模型中不存在異方差、相關(guān)性問(wèn)題,模型的基本假定是滿足的。
3.2 預(yù)測(cè)
為了更好地反映模型的擬合效果,我們對(duì)2015年1月2日到3月27日的PM2.5進(jìn)行預(yù)測(cè),并與實(shí)際值對(duì)比。預(yù)測(cè)曲線圖如圖2,除了少數(shù)幾天PM2.5預(yù)測(cè)值偏差較大外,其它模擬效果比較樂(lè)觀,而且相對(duì)誤差相對(duì)較小,很大程度上接近了PM2.5的實(shí)際觀測(cè)值。進(jìn)一步地證明該模型能夠較準(zhǔn)確地預(yù)測(cè)未來(lái)短期的PM2.5趨勢(shì)和水平。
4 結(jié)論
本文利用長(zhǎng)春市2014年空氣質(zhì)量歷史數(shù)據(jù),基于主成分分析理論建立了大氣環(huán)境預(yù)測(cè)模型,并預(yù)測(cè)2015年1月至3月的污染物PM2.5濃度,通過(guò)將其與實(shí)際值檢測(cè)值進(jìn)行對(duì)比分析,表明運(yùn)用此模型在PM10、CO、NO2、SO2各項(xiàng)指標(biāo)已知的情況下,能夠?qū)M2.5進(jìn)行準(zhǔn)確性預(yù)測(cè)。
模型的判定系數(shù)和修正分別為0.9225和0.9221,均方殘差平方根為0.1866。這說(shuō)明回歸方程的擬合效果非常好,能夠很好地反映并及時(shí)公_大氣環(huán)境狀況,讓公眾更加精確地感知到本地空氣質(zhì)量的真實(shí)情況,還可以有的放矢地治理大氣污染,通過(guò)數(shù)據(jù)分析找出污染源頭。
注釋
① 劉小生,李勝,趙相博.基于基因表達(dá)式編程的PM2.5濃度預(yù)測(cè)研究[J].江西理工大學(xué)學(xué)報(bào),2013.34(5):1-5.
② 彭斯俊,沈加超,朱雪.基于ARIMA模型的PM2.5預(yù)測(cè)[J].安全與環(huán)境工程,2014.21(6):125-128.
③ 陳俏,曹根牛,陳柳.支持向量機(jī)應(yīng)用于大氣污染濃度預(yù)測(cè)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010.20(1):250-252.
④ 張誠(chéng).基于Box-Cox變換的城市火災(zāi)起數(shù)的模型研究[D].合肥工業(yè)大學(xué)碩士學(xué)位論文,2013.
⑤ 胡宏昌,樊獻(xiàn)花.廣義Box-Cox變換[J].周口師范學(xué)院學(xué)報(bào),2006.23(5):17-19.
⑥ 何曉群.應(yīng)用回歸分析(第三版)[M].北京:中國(guó)人民大學(xué)出版社,2011.
[論文摘要]根據(jù)相似性度量理論中的χ2統(tǒng)計(jì)量,在專(zhuān)家評(píng)級(jí)的基礎(chǔ)上,構(gòu)造出定性指標(biāo)的相關(guān)系數(shù)矩陣,利用主成分分析法選取主成分,并作因子分析,進(jìn)而根據(jù)因子載荷矩陣,得到主成分與各原始指標(biāo)間的相關(guān)系數(shù),最后在一定閾值標(biāo)準(zhǔn)下,舍掉相關(guān)系數(shù)絕對(duì)值較小的指標(biāo),從而達(dá)到用客觀合理的方法對(duì)定性指標(biāo)進(jìn)行篩選的目的。該方法可被借鑒應(yīng)用于物流領(lǐng)域中供應(yīng)商定性評(píng)估指標(biāo)的篩選。
一、引言
供應(yīng)商評(píng)估和選擇是企業(yè)的一個(gè)重要決策,一個(gè)好的供應(yīng)商是指供應(yīng)商擁有制造高質(zhì)量產(chǎn)品的加工技術(shù),擁有足夠的生產(chǎn)能力,以及能夠在獲得利潤(rùn)的同時(shí)提供有競(jìng)爭(zhēng)力的產(chǎn)品。同一產(chǎn)品在市場(chǎng)上的供應(yīng)商數(shù)目越來(lái)越多,供應(yīng)商的多樣性更使得供應(yīng)商的評(píng)估和選擇工作變得復(fù)雜,需要一個(gè)規(guī)范的標(biāo)準(zhǔn)來(lái)操作。供應(yīng)商評(píng)估首先要解決的是供應(yīng)商評(píng)估指標(biāo)體系的確立問(wèn)題。
一個(gè)具體的綜合評(píng)價(jià)問(wèn)題,評(píng)價(jià)指標(biāo)的選取是否合適,直接影響到綜合評(píng)價(jià)的結(jié)論[1]。指標(biāo)并不是選得越多越好,太多重復(fù)性的指標(biāo)會(huì)增加指標(biāo)權(quán)重確定的難度。綜合各學(xué)者的觀點(diǎn),對(duì)供應(yīng)商評(píng)估的指標(biāo)可以包括技術(shù)水平、產(chǎn)品質(zhì)量、生產(chǎn)能力、供應(yīng)能力、價(jià)格、地理位置、可靠性(信譽(yù))、售后服務(wù)、柔性等[2],這些都是定性指標(biāo)。對(duì)定性指標(biāo)的篩選,以前用得較多的是模糊數(shù)學(xué)的方法[3],主觀性較強(qiáng),最后得出的結(jié)果可能差異非常大。這兩年,有一些學(xué)者引進(jìn)粗糙集理論對(duì)指標(biāo)進(jìn)行屬性約簡(jiǎn)[4],該方法實(shí)用性強(qiáng),不失為定性指標(biāo)篩選的一個(gè)好方法。然而,需要事先知道各樣本對(duì)應(yīng)的決策屬性的值,使得該方法在很多的綜合評(píng)價(jià)問(wèn)題得不到應(yīng)用。
對(duì)定量指標(biāo)的篩選有一些統(tǒng)計(jì)的方法,如:條件廣義方差極小[5]、極大不相關(guān)[6]、灰關(guān)聯(lián)分析[7]等,這些方法客觀性較強(qiáng),評(píng)價(jià)結(jié)果比較穩(wěn)定。定性指標(biāo)與定量指標(biāo)區(qū)別的關(guān)鍵在于定量指標(biāo)是可度量的而定性指標(biāo)不可度量,如果把定性指標(biāo)定量化,定量指標(biāo)的篩選方法就可以為定性指標(biāo)所用。然而,對(duì)定性指標(biāo)的定量化研究多采用模糊數(shù)學(xué)的方法[8],該方法應(yīng)用結(jié)果并不能讓人滿意。那么,是否可以考慮避開(kāi)定性指標(biāo)定量化這一問(wèn)題,另辟蹊徑,嫁接定量指標(biāo)篩選的統(tǒng)計(jì)分析方法對(duì)定性指標(biāo)進(jìn)行篩選呢?
在定量的指標(biāo)分析中,相關(guān)系數(shù)是一個(gè)重要的量,它能相當(dāng)好地反映變量之間的線性相關(guān)的程度。主成分分析法就是建立在相關(guān)系數(shù)矩陣基礎(chǔ)上的,在主成分分析法基礎(chǔ)上作因子分析,根據(jù)因子載荷矩陣中主成分與各原始指標(biāo)的相關(guān)系數(shù)的絕對(duì)值大小,就可以實(shí)現(xiàn)對(duì)原始指標(biāo)的取舍。因此,對(duì)于定性指標(biāo),如果能求出兩兩指標(biāo)間的相關(guān)系數(shù),而不必對(duì)指標(biāo)一一進(jìn)行定量化處理,也能對(duì)指標(biāo)進(jìn)行篩選。現(xiàn)在問(wèn)題的關(guān)鍵在于,對(duì)定性指標(biāo)是否能找出較好地反映變量間線性相關(guān)程度的量?Pearson的χ2統(tǒng)計(jì)量為這一問(wèn)題的解決帶來(lái)了曙光。
二、用Pearson的χ2統(tǒng)計(jì)量求定性指標(biāo)的相關(guān)系數(shù)
設(shè)x,y都是離散的隨機(jī)變量,x可以是r個(gè)狀態(tài)x,x,…,x之一,x不一定是數(shù),但可以用指定的數(shù)或字母等來(lái)表示這一狀態(tài),這樣的離散變量是定性資料的一種概率性的描述方法。類(lèi)似地,y可以處于y,y,…,y這c個(gè)狀態(tài)之一。如果觀察了(x,y)的n個(gè)樣本,就可以計(jì)算出x=x,y=y的頻數(shù)、x=x的頻數(shù)以及y=y的頻數(shù)i Pearson據(jù)此定義了χ2統(tǒng)計(jì)量[9]
三、供應(yīng)商定性指標(biāo)篩選模型的構(gòu)建及其求解
作為x與y關(guān)聯(lián)性的度量值。文獻(xiàn)[1]指出,χ2有下列性質(zhì):0≤x≤n(min(r,c)-1)(2)由此,如果引入θ=x/n(min(r,c)-1)θ≥0(3)θ就在[0,1]之內(nèi),它與相關(guān)系數(shù)ρ的平方在[0,1]之內(nèi)相仿,那么θ就可以作為x與y相關(guān)系數(shù)的近似值。
相關(guān)系數(shù)問(wèn)題的解決,為定性指標(biāo)篩選方法的尋找提供了一塊墊腳石。主成分分析是建立在相關(guān)系數(shù)矩陣基礎(chǔ)上的一種多元統(tǒng)計(jì)方法,對(duì)該方法的進(jìn)一步分析可以達(dá)到對(duì)指標(biāo)篩選的目的。因此,結(jié)合Pearson的χ2統(tǒng)計(jì)量和因子分析法,可以構(gòu)造定性指標(biāo)篩選模型及其求解步驟如下:
(一)利用χ2統(tǒng)計(jì)量求定性指標(biāo)的相關(guān)系數(shù)為避免符號(hào)過(guò)多引起歧義,對(duì)定性指標(biāo)仍用x和y來(lái)表示,只是對(duì)x和y的描述稍加改變即可。為簡(jiǎn)明起見(jiàn),下面列了一個(gè)r×c雙向列聯(lián)表。指標(biāo)x有r個(gè)水平x,x,…,x,指標(biāo)y有c個(gè)水平y(tǒng),y,…,y。觀察了(x,y)的n個(gè)樣本,其中指標(biāo)x處在水平x、指標(biāo)y處在水平y(tǒng)的個(gè)體數(shù)為表中之
分別是x處在水平x的個(gè)體數(shù)和y處在水平四、計(jì)算示例y的個(gè)體數(shù)。于是,首先計(jì)算式(1),然后計(jì)算式(3),把得到的數(shù)開(kāi)方并取非負(fù)值,即可求得x與y的相關(guān)系數(shù)。同理,可以求出其他兩兩指標(biāo)的相關(guān)系數(shù),并構(gòu)造出關(guān)于所有指標(biāo)的相關(guān)系數(shù)矩陣。
(二)在相關(guān)系數(shù)矩陣基礎(chǔ)上用主成分分析法確定主成分求相關(guān)系數(shù)矩陣的特征值和特征向量,對(duì)特征值按照從大到小的順序進(jìn)行排序,并一一計(jì)算貢獻(xiàn)率和累積貢獻(xiàn)率,按照累積貢獻(xiàn)率的值對(duì)綜合指標(biāo)進(jìn)行取舍。一般的,取臨界值為85%。一旦累積貢獻(xiàn)率超過(guò)85%,剩下的特征值對(duì)應(yīng)的綜合指標(biāo)即被舍掉了,前面的幾個(gè)綜合指標(biāo)被確定為主成分。
(三)在主成分分析基礎(chǔ)上作因子分析,求得因子載荷矩陣對(duì)主成分作因子分析,即用各主元對(duì)應(yīng)的特征值的平方根乘以該特征值對(duì)應(yīng)的特征向量各分量,組合而成的矩陣即為因子載荷矩陣,該矩陣的各分量反映的是各原始指標(biāo)與主成分的相關(guān)系數(shù)。
(四)確定閾值,對(duì)定性指標(biāo)進(jìn)行篩選在綜合評(píng)價(jià)中,主成分是最后確定為對(duì)樣本進(jìn)行綜合評(píng)價(jià)的量。因此,原始指標(biāo)與主成分相關(guān)系數(shù)越小,對(duì)綜合評(píng)價(jià)的結(jié)果影響力也就越小。對(duì)原始指標(biāo)與主成分的相關(guān)系數(shù)進(jìn)行排序,按一定標(biāo)準(zhǔn)確定閾值,把小于該閾值的相關(guān)系數(shù)對(duì)應(yīng)的原始指標(biāo)篩選掉,就可以達(dá)到對(duì)定性指標(biāo)篩選的目的。
某生產(chǎn)企業(yè)針對(duì)供應(yīng)商的評(píng)估列出下列指標(biāo):技術(shù)水平(X1)、產(chǎn)品質(zhì)量(X2)、生產(chǎn)能力(X3)、供應(yīng)能力(X4)、價(jià)格(X5)、地理位置(X6)、可靠性(信譽(yù))(X7)、信息共享和相互信任(X8)、類(lèi)似的產(chǎn)品經(jīng)驗(yàn)(X9)、地理范圍和提供的服務(wù)范圍(X10)、客戶的兼容性(X11)、售后服務(wù)(X12)、供貨期(X13)、交貨準(zhǔn)確率(X14)、柔性(X15)[10]。現(xiàn)在要對(duì)某供應(yīng)商進(jìn)行評(píng)估,首先需要對(duì)評(píng)價(jià)指標(biāo)進(jìn)行篩選。可以考慮在供應(yīng)商評(píng)估和選擇小組評(píng)級(jí)的基礎(chǔ)上用上述模型實(shí)現(xiàn)對(duì)上述15個(gè)指標(biāo)進(jìn)行篩選。
供應(yīng)商評(píng)估和選擇小組選擇A、B、C、D、E五個(gè)等級(jí)之一分別對(duì)被評(píng)價(jià)對(duì)象的上述15個(gè)指標(biāo)進(jìn)行評(píng)價(jià),其中,A、B、C、D、E分別代表“很好”、“較好”、“一般”、“差”和“很差”。9份評(píng)級(jí)結(jié)果如下表2:
現(xiàn)在要根據(jù)前述理論、模型及求解方計(jì)算出這15個(gè)指標(biāo)兩兩間的相關(guān)系數(shù)。以標(biāo)X1和X2為例,X1和X2有同樣的5個(gè)水平AB、C、D、E,分別對(duì)應(yīng)腳標(biāo)1、2、3、4、5比如
如此類(lèi)推,窮極X1和X2的5個(gè)水平的率,即可計(jì)算出(1)式,然后計(jì)算(3式,最后開(kāi)方取非負(fù)值,就可以得到X1X2的相關(guān)系數(shù)約為0.14。類(lèi)似地,可以求其他指標(biāo)間的相關(guān)系數(shù),進(jìn)而可以構(gòu)建出下的相關(guān)系數(shù)矩陣:
由R的特征值我們計(jì)算出第一主成分的差貢獻(xiàn)率為79.6%,于是,我們只用第一成分這一綜合評(píng)價(jià)指標(biāo)就能較好地反映原數(shù)據(jù)的變換情況。對(duì)第一主成分的特征值方再與第一主成分對(duì)應(yīng)的特征向量各分量法指乘,這樣得到的向量的每個(gè)分量分別對(duì)應(yīng)第一主成分與各原始指標(biāo)的相關(guān)系數(shù),相關(guān)系數(shù)絕對(duì)值的大小反映了綜合評(píng)價(jià)指標(biāo)(第一主成分)與各原始指標(biāo)的關(guān)系密切程度,因此,對(duì)相關(guān)系數(shù)先取絕對(duì)值,再按照絕對(duì)值的大小從大到小進(jìn)行排列。排列結(jié)果如下表3:
由表3可以看出,X4、X9、X11這三項(xiàng)指標(biāo)與綜合評(píng)價(jià)指標(biāo)的密切度明顯低于其他指標(biāo)。經(jīng)過(guò)分析發(fā)現(xiàn),供貨能力(X4)與供貨期(X13)和交貨準(zhǔn)確率(X14)內(nèi)容重合度很高,用供貨期和交貨準(zhǔn)確率這兩項(xiàng)指標(biāo)就可以代表供貨能力,因此供貨能力屬重復(fù)指標(biāo),應(yīng)該刪掉。同時(shí),類(lèi)似的產(chǎn)品經(jīng)驗(yàn)(X9)和客戶的兼容性(X11)與綜合評(píng)價(jià)指標(biāo)的密切度低很可能是因?yàn)閷?duì)這兩項(xiàng)指標(biāo)的界定沒(méi)有一個(gè)很明確的標(biāo)準(zhǔn),從表2也可以看出9位評(píng)價(jià)者對(duì)這兩項(xiàng)指標(biāo)評(píng)級(jí)差異度非常大。因此,X9和X11對(duì)整個(gè)評(píng)價(jià)中干擾度較大,也應(yīng)該考慮刪除。
五、結(jié)束語(yǔ)
本文根據(jù)相似性度量理論中的χ2統(tǒng)計(jì)量,在專(zhuān)家評(píng)級(jí)的基礎(chǔ)上,構(gòu)造出相關(guān)系數(shù)矩陣,進(jìn)而用主成分分析法和因子分析法,對(duì)一個(gè)評(píng)價(jià)對(duì)象的多評(píng)價(jià)因素指標(biāo)進(jìn)行篩選。而且,為提高計(jì)算的精度,可以采取增加樣本的方法,使頻率盡可能地接近于概率。從前面的示例可以看出,基于Pearson的χ2統(tǒng)計(jì)量的定性指標(biāo)篩選方法能取得比較科學(xué)、合理的結(jié)果,因此可以為涉及主觀因素眾多的供應(yīng)商評(píng)估和選擇問(wèn)題所借鑒。
參考文獻(xiàn)
[1]胡永宏,賀思輝,綜合評(píng)價(jià)方法[M],北京:科學(xué)出版社,2000:21
[2]魏際剛,鄭志軍,企業(yè)物流管理基礎(chǔ)[M],深圳:海天出版社,2004:42-43