您的当前位置:首页正文

多元统计分析我国城镇居民消费性支出

2022-07-27 来源:好走旅游网


理学院《应用多元统计分析》课程论

专 业: 统计学 班 级: 112班

论文题目: 多元统计分析中国城镇居民人均消费水平

姓 名: 杨晓丹 学 号 *********** 指 导 教 师: 韩明 职 称 教授

2013年12月12日

摘要

本文通过选取2011年我国31个省市自治区城镇居民在食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务及其他商品和服务等方面的人均消费性支出,运用聚类分析及主成分分析对各地区进行比较和分析。用聚类分析将各地区进行分类,对分类的地区进行比较,用主成分分析根据所选主要成分将各地区排名。找出各地区城镇居民在消费性支出方面存在的差异,并提出相应缩小差异的建议。除了地区间的比较,将结果同前一年比较,明确地区经济发展变化。

关键字:人均消费性支出 聚类分析 主成分分析

I

目 录

摘要 ............................................... I 1 绪论 ............................................ 1

1.1 选题背景和研究现状 ............................... 1 1.2研究目的 .......................................... 1

2 内容 ............................................ 2

2.1数据收集 .......................................... 2 2.2聚类分析 .......................................... 3 2.3主成分分析 ........................................ 4 2.4结果对比 .......................................... 8

3 总结 ........................................... 10 参考文献 .......................................... 11 附录 ............................................. 12

II

1 绪论

1.1 选题背景和研究现状

近年来,我国国民经济得到了迅速发展,人民生活水平进一步提高,物质文明建设达到了前所未有的水平。但由于我国各地区经济发展水平不均衡,加之各地人口、资源、政策等各方面存在的差异,使各地区居民人均消费水平参差不齐,不同的地区具有不同的特点。在这一背景下,研究我国各地区城镇居民家庭平均每人全年消费性支出情况,比较地区间的差异和差距,通过与前几年结果作对比,进而明确促进和抑制我国城镇居民人均消费性支出发展的影响因素。

1.2研究目的

消费结构可以反映居民的生活质量和经济发展水平。一般来说,经济越发达的地区,其消费结构就越趋向于追求安逸享受的消费结构。在这样的消费结构中,教育文化娱乐服务支出所占的比例就会较大。反之,在经济较不发达的地区中,生活必需品消费支出所占的比例就会较大。随着社会主义市场经济体制的逐步完善,我国的社会生产力不断日益加快发展,经济总量和综合实力迅速上升,城镇居民的生活水平显著提高。相对过去而言,居民食品方面的消费支出比重在逐渐下降,而在交通通讯、文化娱乐等方面的消费支出比重越来越大。消费结构的变化,反映居民需求的变化。研究我国城镇居民消费性支出情况及其影响因素,对建立合理的消费结构,扩大内需,搞活社会主义市场经济,制定产业政策,促进国民经济的发展都有着极其重要的意义。

1

2 内容

2.1数据收集

表1 我国各地区城镇居民家庭平均每人全年消费性支出情况

【1】

地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 食品 衣着 居住 家庭设备 医疗保健 交通和通信 教育文化 其他商品 1562.55 1174.62 809.85 832.74 1162.87 929.37 839.31 723.58 1826.22 1193.81 1109.42 690.66 1179.84 914.88 1013.82 977.52 814.81 940.79 1370.28 884.85 729.86 1079.27 1020.16 857.55 570.46 428.03 914.26 660.48 723.23 885.36 791.43 1523.32 1415.39 955.95 851.30 1239.36 1208.30 1108.51 1082.96 1140.82 962.45 1248.90 907.58 773.26 641.23 938.86 919.83 915.72 790.76 948.18 779.08 783.34 1050.62 735.26 578.33 822.41 424.10 1100.51 874.05 854.25 978.12 912.99 3521.20 2699.53 1526.60 1487.66 2003.54 1899.06 1541.37 1363.62 3808.41 2262.19 3728.23 1365.01 2470.18 1310.21 2203.99 1573.64 1382.20 1975.50 3630.62 2000.57 1830.80 1718.73 1757.52 1395.28 1905.86 1278.00 1502.44 1289.80 1293.45 1637.61 1377.67 3306.82 2116.01 1203.99 1419.43 1812.07 1614.52 1468.34 1190.87 3746.38 2695.52 2816.12 1631.28 1879.02 1429.30 1538.44 1373.94 1489.67 1526.10 2647.94 1502.65 1141.81 1474.88 1369.47 1331.43 1350.65 514.44 1857.60 1158.30 967.90 1441.18 1122.18 975.37 836.82 387.40 415.44 765.13 643.15 562.48 476.89 1394.86 647.06 811.51 467.77 667.00 389.06 518.27 484.76 347.68 434.25 773.17 349.48 360.91 540.63 532.52 311.57 381.38 527.74 500.42 413.37 406.93 521.47 493.56 6905.51 1612.12 1923.71 6663.31 1274.91 1763.44 3927.26 1020.03 1372.25 3558.04 1094.58 1327.78 4962.40 1859.84 1418.60 5254.96 1295.08 1385.62 4252.85 1272.43 1468.29 4348.45 1194.59 1185.96 8905.95 1558.24 2225.68 6060.91 1338.75 1187.74 7066.22 1658.21 1518.06 5246.76 4675.16 954.30 1501.39 978.76 1114.49 6534.94 1167.05 1661.84 4827.61 1463.71 1510.84 4212.76 1265.53 1087.08 5363.68 1259.76 1172.11 4943.89 1123.49 1292.55 7471.88 1065.71 2005.15 5074.49 5673.65 778.29 1237.91 615.59 1342.29 5847.90 1516.13 1205.66 5571.69 1099.76 1226.14 4565.85 5184.18 853.39 1102.99 827.84 781.12 873.83 4802.26 1127.95 5040.47 1224.95 1193.81 4182.47 1049.68 1139.85 4260.27 1026.26 1055.15 4483.44 1265.75 1247.14 4537.46 1209.04 888.16 单位:元

——资料来源:2012年《中国统计年鉴》

2

2.2聚类分析

运用R对表1数据进行Q型聚类分析。 得到聚类图如下

从上图可以看出

a) 如果根据各地区城镇居民人均全年消费状况把31各地区分为2类,结果为:

第一类:上海 第二类:其他地区

这样分类不能突出城市之间的差距,只能说明上海市经济在我国最为发达。 b) 如果根据各地区城镇居民人均全年消费状况把31各地区分为3类,结果为:

第一类:上海

第二类:北京,天津,浙江,广东,江苏,福建、内蒙古

第三类:其他地区

这样分类只显示了经济较为发达地区,而没有对其他地区进行细分。 c) 如果根据各地区城镇居民人均全年消费状况把31各地区分为5类,结果为:

3

第一类:上海

第二类:西藏 第三类:其他地区 第四类:内蒙古

第五类:北京,天津,浙江,广东,江苏,福建。

上海是国际大都市,经济最为发达。西藏有其特殊的政治背景和特殊的地理位置。内蒙古位于我国北部边疆,地理位置较为特殊,故独自归为一类。北京,天津,浙江,广东,江苏,福建这些城市经济都比较发达,人均消费性支出高。这样分类较为合理。

2.3主成分分析

(1)计算相关矩阵:

x1 x2 x3 x4 x5 x6 x7 x8 主成分的标准差 特征值 方差贡献率 方差累计贡献率 x1 0.359 0.735 0.784 0.383 0.874 0.827 0.826 x2 1 0.39 x3 0.39 1 x4 x5 x6 x7 x8 1 0.359 0.735 0.784 0.383 0.874 0.827 0.826 0.603 0.734 0.489 0.578 0.648 0.829 0.583 0.807 0.802 0.784 0.57 1 0.83 0.904 0.854 0.892 0.828 0.853 0.537 0.623 0.623 0.603 0.829 1 0.734 0.583 0.57 0.489 0.807 0.83 0.537 1 0.578 0.802 0.904 0.623 0.892 1 0.648 0.784 0.854 0.623 0.828 0.853 1 (2)求相关矩阵的特征值 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 2.441 1.006 0.616 0.477 0.414 0.343 0.283 0.236 5.957 1.012 0.379 0.227 0.1715 0.118 0.0803 0.0555 0.745 0.126 0.047 0.028 0.021 0.015 0.01 0.007 0.745 0.871 0.918 0.947 0.968 0.983 0.993 1 (3)确定主成分

由所得结果可以看出前两个特征值的累计贡献率已达到87.1%,这说明前两个主成分已基本包含了全部指标具有的信息。因此,我们提取2个特征值。

4

碎石图

碎石图表现出从第三个主成分开始折线变得平坦,这与提取两个主成分相符。 (4)主成分得分 Comp.1 -5.579 -2.971 1.5422 1.577 -1.792 -0.516 0.3748 1.3295 -7.463 -1.44 Comp.2 -0.765 -0.323 -0.243 -0.292 -2.344 -0.909 -1.036 -1.031 1.3955 0.0623 Comp.3 -0.549 -1.033 -0.983 -0.564 0.5618 -0.461 -0.794 -0.461 0.635 0.9172 Comp.4 -0.1299 -0.7241 0.32017 0.72531 0.53254 -0.3777 0.23416 -0.289 0.5405 0.0183Comp.5 -0.4656 0.51763 -0.0597 -0.2152 0.3647 0.35779 0.37148 0.27707 0.77912 -0.805Comp.6 0.24 0.2143 -0.195 -0.219 -0.311 0.1466 -0.122 0.0952 0.4265 0.7406 Comp.7 -0.172 0.2199 -0.149 -0.512 0.0813 0.0191 -0.238 -0.053 -0.365 -0.182 Comp.8 -0.1896 -0.3201 -0.0974 0.0942 -0.0086 -0.1164 0.1923 -0.0066 0.12029 0.1946北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 5

1 1 -0.622 0.35798 0.26466 -0.2401 -0.0965 -0.2018 -0.2301 -0.337 -0.2854 -0.5897 0.08951 0.11765 0.18549 -0.4274 -0.4657 1.08497 -0.2396 0.14483 0.16702 0.06385 0.13717 6

-0.687 0.2013 -0.355 0.3163 -0.904 0.1002 0.1236 -0.302 -0.506 0.0813 0.0594 0.0935 0.0782 0.1686 -0.219 -0.217 0.6449 0.0103 0.0739 -0.056 0.279 -0.174 0.0227 0.335 -5E-04 0.1602 -0.134 0.6762 0.0373 0.1066 -0.007 0.3031 0.8738 0.2829 -0.021 -0.297 -0.351 0.0633 -0.231 -0.07 -0.14 -0.084 1 0.19153 0.79671 0.06211 0.0459 0.09452 -0.3724 0.4797 -0.0402 -0.1029 -0.2868 -0.1601 -0.0986 -0.2344 -0.0056 0.05263 -0.0085 0.17984 0.13856 -0.2163 -0.036 -0.3426 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 -3.792 0.99 -1.346 1.8816 -0.367 1.0431 1.1009 0.7544 -3.6 1.3763 1.7265 -0.383 0.653 2.3654 2.0057 3.4519 0.3037 2.103 2.2551 0.6999 1.7164 -0.493 0.5372 1.3583 0.7425 -0.619 -0.751 -0.376 0.4164 2.1676 1.2983 1.8193 -0.998 0.7267 1.1632 -0.133 1.2807 -0.742 -0.273 -0.195 -0.709 -0.737 0.6792 -0.872 0.2285 0.3598 0.0538 0.3036 0.232 0.1027 -0.515 -0.459 -0.89 0.7091 0.5472 0.1849 0.7184 1.352 -0.174 -0.277 -0.096 -0.054 0.5964 -1.1665 -0.1703 0.45752 0.63732 0.58858 0.45981 -0.1313 0.30695 -0.0052 -0.1326 -0.6272 0.04148 0.3385 0.54352 -0.9759 -0.6567 -0.1923 -0.0813 -0.0546 0.19828 -0.2284

(5)计算综合得分和各地区排名

根据加权法计算出的综合得分,其计算公式如下:

C0.744625C10.126475C2/0.7446250.1264750.854810C10.145190C2

得出各地区主成分得分及排名如下: Comp.1 Comp.2 C 排名 2 -5.57946 -0.76519 -4.88048 北京 8 -2.97113 -0.32325 -0.58668 天津 21 1.54222 -0.24295 1.283032 河北 22 1.576995 -0.29221 1.305605 山西 5 内蒙古 -1.79205 -2.34353 -1.87212 13 -0.51622 -0.90853 -0.57318 辽宁 9 0.374841 -1.03615 0.169978 吉林 20 黑龙江 1.329501 -1.03087 0.986799 1 -7.46273 1.39549 -6.1766 上海 6 -1.44028 0.06235 -1.22211 江苏 3 -3.7915 -0.49283 -3.31257 浙江 19 0.990036 0.537194 0.924288 安徽 7 -1.34641 1.358265 -0.95372 福建 26 1.881636 0.742454 1.716238 江西 11 -0.36729 -0.61897 -0.40383 山东 17 1.043103 -0.75061 0.782675 河南 18 1.100941 -0.376 0.886504 湖北 16 0.754378 0.41636 0.705301 湖南 4 -3.59994 2.16758 -2.76255 广东 24 1.376258 1.298305 1.36494 广西 27 1.726491 1.819287 -0.47273 海南 10 -0.38348 -0.99818 1.739964 重庆 15 0.652956 0.726721 0.663666 四川 30 2.365351 1.163187 2.190809 贵州 25 2.005742 -0.13302 1.695215 云南 31 3.451924 1.280706 3.136685 西藏 12 0.303669 -0.7417 0.151892 陕西 28 2.102971 -0.27298 1.758007 甘肃 29 2.255122 -0.19533 1.899341 青海 14 0.699938 -0.70867 0.495422 宁夏 23 1.716422 -0.73694 1.360218 新疆 由所得排名可以看出排名第一的是上海,第二是北京,第三是浙江。排名后三位的是青海,贵州,西藏

上海、北京、浙江等地区城镇居民消费性支出较高,这应该与这些地区的经济水平较为发达相关。

7

青海、贵州、西藏等地区城镇居民消费性支出偏低,这应该与这些地区经济水平较为落后相关,而经济水平落后则与当地的地理位置,人口密集度等相关。 其他消费性支出较为靠前的地区集中于我国东南部沿海地区,而我国中西部地区消费性支出中游偏下。

2.4结果对比

2010年通过主成分分析得到排名结果如下【2】

省市 Z 排名 省市 Z 上海 32.445 1 吉林 0.277 北京 22.165 2 宁夏 -1.778 广东 14.099 3 陕西 -2.14 天津 11.732 4 四川 -2.675 浙江 11.623 5 湖南 -2.689 内蒙古 7.628 6 河南 -3.256 江苏 3.832 7 安徽 -3.634 辽宁 3.122 8 河北 -4.394 福建 2.647 9 湖北 -4.765 重庆 1.289 10 黑龙江 -5.027 山东 1.07 11 广西 -5.225 2011年排名结果如下 Comp.1 Comp.2 C -6.1766 排名 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 排名 12 13 14 15 16 17 18 19 20 21 22 省市 山西 新疆 甘肃 江西 云南 海南 贵州 青海 西藏 Z -6.387 -6.542 -7.241 -7.325 -8.852 -9.088 -9.214 -9.292 -12.407 排名 23 24 25 26 27 28 29 30 31 上海 北京 浙江 广东 内蒙古 江苏 福建 天津 吉林 重庆 山东 陕西 辽宁 宁夏 四川 湖南 河南 湖北 -7.46273 1.39549 -3.7915 -5.57946 -0.76519 -4.88048 -0.49283 -3.31257 -2.76255 -1.22211 -3.59994 2.16758 -1.44028 0.06235 -1.79205 -2.34353 -1.87212 -1.34641 1.358265 -0.95372 -2.97113 -0.32325 -0.58668 0.374841 -1.03615 0.169978 -0.38348 -0.99818 1.739964 -0.36729 -0.61897 -0.40383 0.303669 -0.7417 0.151892 -0.51622 -0.90853 -0.57318 0.699938 -0.70867 0.495422 0.652956 0.726721 0.663666 0.754378 0.41636 1.100941 -0.376 0.705301 0.886504 8

1.043103 -0.75061 0.782675

安徽 黑龙江 河北 山西 新疆 广西 云南 江西 海南 甘肃 青海 贵州 西藏 0.990036 0.537194 0.924288 1.329501 -1.03087 0.986799 1.54222 -0.24295 1.283032 1.576995 -0.29221 1.305605 1.716422 -0.73694 1.360218 1.376258 1.298305 1.36494 2.005742 -0.13302 1.695215 1.881636 0.742454 1.716238 1.726491 1.819287 -0.47273 2.102971 -0.27298 1.758007 2.255122 -0.19533 1.899341 2.365351 1.163187 2.190809 3.451924 1.280706 3.136685 19 20 21 22 23 24 25 26 27 28 29 30 31 同样以衣着和食品为两个主要成分排名,比较2010年与2011年的结果,2011年浙江省名次跃居第三,内蒙古,江苏,福建的排名也有所上升,而排名靠后的地区大致没有变化。说明经济发达的地区,经济速度飞快,在不断发展,且地区之间的竞争激烈。而经济相对较落后的地区发展速度缓慢。我国应该注重这些相对较落后地区,通过相应政策刺激这些地区的消费,进而拉动经济。

9

3 总结

从聚类分析,主成分分析的分析结果看,尽管不同的分析方法所得的结果不同,但是上海、北京、天津、浙江、广东的城镇居民人均消费性支出都处于较高位置,而青海、甘肃、西藏的人均消费性支出处于低位。对比前一年的排名结果可知,我国各地区的人均消费性支出排名总体没有太大差异,北京、上海、浙江、广东依旧名列前茅,而青海、西藏、贵州等地依旧落后于其他地区。城镇居民的人均消费性支出直接反应地区的经济发展水平。消费拉动经济,促进消费,改善消费结构的关键在于提高居民的收入。其中教育文化消费在消费中占据很大的比例,要鼓励居民学习,引导居民正确的消费观,构建学习型社会,创造财富,拉动消费。我国应该采取相应政策,刺激消费,缩小地区间差距。

10

参考文献

[1] 2012年中国统计年鉴

[2] http://www.doc88.com/p-935448700983.html

11

附录

聚类分析

> one<-read.csv(\"E://11.csv\") > x1<-one[,2] > x1

[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85 [8] 4348.45 8905.95 6060.91 7066.22 5246.76 6534.94 4675.16 [15] 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65 [22] 5847.90 5571.69 4565.85 4802.26 5184.18 5040.47 4182.47 [29] 4260.27 4483.44 4537.46 > x2<-one[,3] > x3<-one[,4] > x4<-one[,5] > x5<-one[,6] > x6<-one[,7] > x7<-one[,8] > x8<-one[,9]

> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8) > d<-dist(scale(X))

> hc1<-hclust(d,'average')

> opar<-par(mfrow=c(2,1),mar=c(5.2,4,0,0)) >

plclust(hc1,hang=-1);re1<-rect.hclust(hc1,k=5,border='red')

> par(opar)

主成分分析

> one<-read.csv(\"E://11.csv\") > x1<-one[,2] > x1

[1] 6905.51 6663.31 3927.26 3558.04 4962.40 5254.96 4252.85 4348.45 8905.95 6060.91 7066.22 5246.76

[13] 6534.94 4675.16 4827.61 4212.76 5363.68 4943.89 7471.88 5074.49 5673.65 5847.90 5571.69 4565.85

[25] 4802.26 5184.18 5040.47 4182.47 4260.27 4483.44 4537.46 > x2<-one[,3] > x3<-one[,4] > x4<-one[,5] > x5<-one[,6] > x6<-one[,7] > x7<-one[,8] > x8<-one[,9]

> X<-data.frame(x1,x2,x3,x4,x5,x6,x7,x8)

12

计算相关矩阵:

> cor(X)

)求相关矩阵的特征值和主成分负荷

> PCA=princomp(X,cor=T) > PCA

> PCA$loadings

确定主成分

> X.pr<-princomp(X,cor=T) > summary(X.pr,loadings=T)

画碎石图

> screeplot(PCA,type='lines')

主成分得分

> PCA$scores

13

因篇幅问题不能全部显示,请点此查看更多更全内容