工商管理学院
《应用统计学》
实验作业
班 级 学 号 姓 名 上课教师
2017年11月
实验二 建立数据文件
1.建立一个数据文件记录试录入以下数据,并按要求进行变量定义。 数据:
学号 姓名 性别 男 男 男 男 男 女 女 女 女 女 男 男 男 男 男 女 女 女 女 女 生日 身高体重英语(总数学(总生活费($人(cm) (kg) 分100分) 分100分) 民币) 47.54 37.83 38.66 41.68 43.36 47.35 47.44 47.87 33.85 33.84 49.23 54.54 50.67 44.56 58.87 44.14 53.34 36.46 30.17 40.45 75 78 65 79 82 81 77 67 64 70 84 85 79 75 76 80 79 75 90 71 79 76 88 82 77 74 69 73 77 80 85 80 79 80 69 83 82 97 75 80 345.00 435.00 643.50 235.50 867.00 1233.00 767.80 553.90 343.00 453.80 843.00 657.40 1863.90 462.20 476.80 452.80 244.70 253.00 200201 刘一迪 200202 许兆辉 200203 王鸿屿 200204 200206 江飞 段燕 200205 袁翼鹏 200207 安剑萍 200208 赵冬莉 200209 叶敏 200210 毛云华 200211 孙世伟 200212 杨维清 200213 欧阳飞 200214 贺以礼 200215 张放 200216 陆晓蓝 200217 吴挽君 200218 200219 李利 韩琴 1982.01.12 156.42 1982.06.05 155.73 1982.05.17 1982.08.31 1982.09.17 1982.12.21 1982.10.18 1982.06.01 1982.09.12 1981.10.13 1981.12.6 1981.11.21 1981.09.28 1981.12.08 1981.10.07 1981.09.09 1981.09.14 1981.10.15 1981.12.02 144.6 161.5 161.3 158 161.5 164.3 144 157.9 176.1 168.5 164.5 153 164.7 160.5 147 153.2 157.9 1982.07.06 162.76 200220 黄捷蕾 要求:将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。
(1)变量名同表格名,以“()”内的内容作为变量标签。对性别(Sex)设值标签“男=0;女=1”。
(2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。
(3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。 答案:1准备工作。打开SPAA
2选择变量视图,依次录入学号,姓名,性别等。
2.对大学生创业问题设计一份调查问卷。要求格式正确,题目类型包括开放题、封闭题(单选、多选都有)、半封闭题三种类型,题目个数10-15个。
答案:
3.用第2题得到的调查问卷进行模拟调查(10份),并将得到的结果录入到SPSS中,(1)将录入结果保存为xxx.sav文件,并将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。
答案:
实验三 数据的整理
1. 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管理,收获后,测得各个地块生产的小麦的千粒重(g)数据资料如表3-1所示。 表3-1 某地区小麦种植
id 甲村 中麦9号 豫展1号 id 乙村 中麦9号 豫展1号 1 43.11 48.91 6 43.87 44.75 2 42.15 45.63 7 36.71 45.67 3 37.59 41.59 8 43.59 43.15 4 38.23 44.23 9 40.83 46.71 5 40.19 37.43 10 42.51 39.55 要求:分别按照“小麦品种”和“村”对小麦的千粒重(g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。
步骤:1.准备工作。打开3-1文件,通过文件--打开,将文件放入打开窗口。 2.选择数据---分类汇总。
3.打开分类汇总窗口,将小麦品种放入分组变量对话框中,将千粒重放入变量摘要对话
框中。
4.选择函数选项,在函数对话框中选择均值选项 5.选择继续--确定,得出结果。
以此方式得出村对小麦千粒重的分类汇总。
2.某地20家企业的情况如表3-2所示。
表3-2 企业年产值与年工资总额 编号 部门 所有制类型 年产值(万元) 职工人数(人) 年工资总额(万元) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 工业 交通 商业 交通 工业 工业 邮电通讯 商业 交通 工业 工业 交通 工业 工业 商业 邮电通讯 工业 工业 商业 交通 国有 国有 集体 个体 集体 国有 国有 个体 个体 国有 集体 个体 国有 集体 股份制 国有 国有 股份制 国有 国有 2805.58 1265.40 256.50 26.88 560.00 800.50 2580.98 125.45 590.60 950.00 1556.00 950.00 335.00 2455.08 1780.58 2500.00 775.00 3305.00 498.08 965.58 1235 605 105 20 223 568 890 65 148 325 485 354 105 680 646 485 354 1015 202 246 812.63 435.60 68.58 14.00 156.07 256.74 854.40 65.16 130.24 268.13 394.20 257.90 82.43 639.20 471.25 486.98 272.58 912.00 139.20 159.95 要求:根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题:
(1)调用排序命令对企业按部门、年产值的主次顺序进行排序。
步骤:1准备工作。打开3-2文件,通过文件--打开,将文件放入文件打开窗口。 2. 选择数据--排序个案。
3. 打开排序个案对话框,将部门和年产值放入排序依据对话框中。 4. 在排列顺序中选择降序。
5. 选择确定按钮,得出结果。
(2)调用分类汇总命令分别按部门和所有制类型对年产值等指标进行分类汇总,并统计单位个数,分别以“将汇总变量添加到活动数据集”和“创建只包含汇总变量的新数据集”保存结果。
答案:1.选择数据--分类汇总。
2. 在分类汇总对话框中,将部门放入分组变量中,将年产值放入变量摘要中。
3. 在保存对话框中,选择将汇总变量添加到活动数据集选项。 4. 选择确定,得出结果。
1. 选择数据--分类汇总。
2. 在分类汇总对话框,将所有制形式放入分组变量对话框中,将年产值放入变量摘要对话框中。
3. 在函数选项中,选择均值均值选项。
4. 在保存对话框中,选择创建只包含汇总变量的新数据,将名称命名为所有制形式。 5. 选择确定选项,得出结果。
3. 根据习题2的数据文件进行“选择个案”实验练习,并回答下列问题:
(1)选择随机抽样方法,抽取约30%的个案作为样本,将此执行两次,所得到的样本是否相同?
步骤:1.选择数据--排序个案
2. 打开排序个案对话框,选择随机个案样本,在样本尺寸中选择大约,填入
30.
3. 选择继续--确定,得出结果。 4. 重复此方式,得出结果。 分析:得出结果不同。
(2)选择满足职工人数300人以上的个案; 步骤:1选择数据--选择个案
2. 在选择个案对话框中,选择如果条件满足选项。 3. 在选择个案对话框中,输入职工人数(人) >300
4. 选择继续--确定,得出结果。 (3)选择观测值在5至15之间的样本。
答案:1.选择数据--选择个案-选择基于时间或个案全距。
2.在选择个案范围对话框中,将观测值设置为5 15.
3. 选择继续--确定,得出结果。
实验四 描述性统计分析和统计报告概述
1. 根据数据4-1.sav,对某高班学生的体重做描述性分析,并对结果做简单的分析。 步骤:1准备工作。打开4-1文件,通过文件--打开将文件放入打开窗口。 2. 选择分析--描述统计--描述。
3. 在描述分析的对话框中,将体重放入变量对话框中。 4. 选择统计量选项,勾选标准差,方差,均值等。 5. 点击确定,得出结果。
2. 根据数据4-2.sav,分析不同性别演员获得奥斯卡的年龄差异性。 步骤:1准备工作。打开4-2文件,通过文件--打开将文件放入打开窗口。 选择分析--描述统计---描述。
3. 在打开描述对话框中,将男演员和女演员的年龄选入变量对话框。
4. 选择选项,在选项对话框中,选择均值,偏值等。 5.选择确定,得出结果。
描述统计量 男演员 male 女演员female 有效的 N (列表状态) N 统计量 36 36 36 极小值 统计量 31 21 极大值 统计量 76 80 均值 统计量 45.14 38.94 标准差 统计量 10.406 13.546 统计量 偏度 标准误 .393 .393 统计量 峰.898 1.503 .7042.111 分析:男演员获得奥斯卡奖的最小年龄为31岁,最大为76岁,女演员获得奥斯卡奖最小年龄为21岁,最大年龄沃日80岁,男演员获得奥斯卡奖的平均年龄大于女演员,且男演员获得奥斯卡的年龄差要小于女演员。
3. 根据数据4-3.sav,进行下列统计和分析。
(1)对机械厂各部门职工人数进行频数分析,并绘制饼图;
步骤:1准备工作。打开文件4-3通过文件--打开将文件放入打开窗口。 2. 选择分析--描述统计--频率。
3. 在频率对话框中将车间部门放入变量对话框中。 4. 选择统计量对话框,选择均值,偏值等选项。 5. 在图表选项中,选择饼图。 6. 选择确定,得出结果。
统计量 车间部门 N 有效 缺失 均值 中值 标准差 偏度 偏度的标准误 百分位数 25 50 75 429 0 2.78 2.00 2.186 .787 .118 1.00 2.00 4.00
分析:从图中所知,在机器加工产的工人所占比例最多,在汽车队的工人最少。 (2)先将职工月平均工资按[200,300],[301,400],[401,500],[501,550]分为四等,再运用频数分析方法对各工资等级中职工总人数统计。
步骤:1选择数据--选择个案。
2.在选择个案对话框中,选择如果 ,在弹出选择个案的对话框中,打入wage >= 200& wage <= 300
3.选择确定。
4.选择分析---描述统计--频率,将wage >= 200& wage <= 300放入变量对话框中。 5.选择确定,得出结果。 6.依次方式得出。
wage >= 200 & wage <= 300 (FILTER) 有效 Selected 频率 148 百分比 100.0 有效百分比 100.0 累积百分比 100.0 wage >= 301 & wage <= 400 (FILTER) 有效 Selected 频率 172 百分比 100.0 有效百分比 100.0 累积百分比 100.0 wage >= 401 & wage <= 500 (FILTER) 有效 Selected 频率 94 百分比 100.0 有效百分比 100.0 累积百分比 100.0 wage >= 501 & wage <= 550 (FILTER) 有效 Selected 频率 13 百分比 100.0 有效百分比 100.0 累积百分比 100.0
4.某研究者对某化工厂工人的工龄、性别、年龄和月工资情况进行了调查,见数据4-4.sav,试以被调查工人的工龄和性别为分组变量,对工人的月工资情况进行观测量概述。 步骤:1.分析--报告---个案汇总
2. 在个案汇总的对话框中,将工龄和性别放入分组变量对话框中,将月工资放入变量对话
框中。
3. 在统计量中选择均值作为单元格统计量。 4. 选择选项对话框,将选项标题设置为分类汇总。
5.选择确定,得出结果。
案例处理摘要 月工资 * 工龄 * 性别 N 106 已包含 百分比 100.0% N 案例 已排除 百分比 0 .0% N 106 总计 百分比 100.0%
个案汇总
月工资 工龄 1
性别 男 女 总计
2
男 女 总计
总计
男 女 总计
N
23 53 76 6 24 30 29 77 106 均值 773.57 763.62 766.63 958.33 891.67 905.00 811.79 803.53 805.79
实验五 单一样本t检验
1.某品牌洗衣粉生产过程中的设计重量为500克,低于这一重量被认为是不合格产品。随机抽取了10袋洗衣粉,经过测量的洗衣粉重量数据。假定总体服从正态分布,显著性水平为0.05,检验该样本结果能否表示该生产过程运作正常?(基本数据见5-1.sav,洗衣粉重量)
步骤:1.准备工作。打开文件5-1,通过文件---打开将文件放入打开窗口。 2. 分析---比较均值---单样本T检验
3. 在检验对话框中,将重量放入检验对话框中。 4. 将检验值设置为
500.
5. 选择选项按钮,将置信区间设置为95. 6. 选择确定,得出结果。
单个样本统计量 重量 N 10 均值 500.70 标准差 6.183 均值的标准误 1.955
单个样本检验
重量 t .358 df 9 检验值 = 500
差分的 95% 置信区间 Sig.(双侧) .729 均值差值 .700 下限 -3.72 上限 5.12 分析:洗衣粉的平均重量为500.7克,标准差为6.183,所得t值为0.358,样本均值和检验值差为0.729>0.05,则不能拒绝原假设,不存在显著差异。,
2.我国2011年城镇单位就业人员年平均工资为41047.1元,浙江省11座城市城镇单位就业人员年平均工资如数据4-3.sav所示,假定总体服从正态分布,显著性水平为0.05,检验浙江城镇单位就业人员年平均工资和全国年平均工资水平是否有显著性差异(基本数据见5-2.sav )。
步骤:1准备工作。打开5-1文件,通过文件--打开将文件放入打开窗口。
2. 选择分析---比较均值--单样本T检验。
3. 打开单样本T检验,将平均工资放入检验变量对话框中,在选项中将置信区间设置为95. 4. 将检验值设置为41047.1 5. 选择继续---确定,得出答案。
单个样本统计量 平均工资 N 11 均值 46137.73 标准差 5169.869 单个样本检验 均值的标准误 1558.774 平均工资 t 29.599 df 10 检验值 = 0
差分的 95% 置信区间 Sig.(双侧) .000 均值差值 46137.727 下限 42664.56 上限 49610.89 分析:浙江省内城镇平均工资为46137.73,得t值为29.599,样本均值和检验值的差为0.00<0.05,则拒绝原假设,存在明显差异。
3. 某班学生的高考数学成绩见数据5-3.sav,试对其做独立样本T检验,以研究该班学生不通性别学生之间成绩有误明显差别。
步骤:1准备工作。打开文件5-3,通过文件-打开将文件放入打开窗口。 2. 选择分析--比较均值--独立样本T检验。
3. 在打开独立样本T检验对画框中,将高考数学成绩放入检验变量对话框中,将性别放入分组变量对话框中,选择定义组,将性别定义成 1
2.
4. 选择确定按钮。
5. 在选项中,选择均值,标准差等等。
组统计量
高考数学成绩
性别 男 女
N
16 16 均值 126.88 119.88 标准差 11.454 9.018 均值的标准误
2.863 2.254 独立样本检验 方差方程的 Levene 检验 均值方程的 t 检验 F 假设方差相等 假设方差不相等 .407 Sig. .529 t 1.921 1.921 df 30 28.434 Sig.(双侧) 均值差值 .064 .065 7.000 7.000 标准误差值 3.644 3.644 差分的 95% 置信区间 下限 -.443 -.460 上限 高考数学14.443成绩 14.460分析:高考数学成绩,男生平均分为126.88,女生为119.88,得出t值为1.921,所对应的p值为0.064,>0.05,则不能拒绝原假设,男女高考数学成绩不存在显著差异。在假设方差不存在的情况下,所得p值为0.065>0.05,不能拒绝原假设,男女高考数学成绩不存在显著差异。
4为研究一种减肥药品的效果,将抽取了20名试验者进行试验,服用该产品一个疗程前后的体重,试用配对样本t检验的方法判断该药物能否引起实验者体重的明显变化。数据见5-4.sav。
步骤:1准备工作。打开文件5-3,通过文件-打开将文件放入打开窗口。 2. 选择分析--比较均值--配对样本T检验。
3. 在配对样本对话框中,将服药前后的体重分别放入对话框中。 4. 选择确定,得出结果。
成对样本统计量
对 1 服药前体重 服药后体重 均值 74.540 74.000 N 20 20 标准差 9.2440 6.9309 均值的标准误 2.0670 1.5498 成对样本检验 对 1 成对差分 均值 标准差 均值的标准误 服药前体重 - 服药后体重 .5400 差分的 95% 置信区间 3.1488 .7041 t 下限 -.9337 df 上限 Sig.(双侧) .767 2.0137 成对样本相关系数 对 1 服药前体重 & 服药后体重 N 20 相关系数 .964 Sig. .000 分析:服药前的平均体重为74.54,服药后的体重为74,相对应的样本均值和检测值的
差为0.00<0.05,则拒绝原假设,存在明显差异。
实验六 统计抽样与参数估计
1. 背景资料:有几位大学生组成的调查组,为了解他们所在地区居民的收入情况,作
为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表6-1所示。
表6-1 样本数据 单位:万元
3.12 1.88 2.13 2.11 3.21 0.90 1.67 2.45 3.50 2.87 1.66 1.89 2.50 3.26 2.36 1.76 0.68 0.88 0.75 2.44 2.50 3.20 1.60 1.30 2.10 2.15 2.80 2.50 3.10 0.60 1.10 2.10 2.61 1.46 0.92 4.20 3.65 1.32 3.39 4.00 2.60 1.35 1.80 2.90 2.20 2.30 1.50 1.10 0.90 1.50 2.60 2.30 2.40 1.15 0.70 2.70 1.30 1.20 1.50 2.60 2.50 2.50 1.15 2.13 2.50 1.90 1.40 0.75 0.85 1.70 1.60 2.40 2.10 3.10 2.69 3.34 3.88 2.66 2.15 2.60 1.80 1.90 1.80 0.95 0.75 1.48 1.60 2.50 2.30 2.60 2.55 2.45 1.65 1.80 2.66 2.35 2.44 1.88 3.25 3.85 1.35 2.15 2.60 1.90 2.66 2.49 4.10 2.58 1.98 1.25 3.12 2.11 3.00 4.32 5.80 1.55 2.18 2.67 2.88 1.95 1.49 2.45 2.66 1.78 2.75 3.35 3.40 1.50 2.80 2.40 1.90 2.66 2.70 1.66 2.22 2.90 3.50 2.77 3.42 2.75 1.89 1.45 3.12 3.33 2.69 1.58 2.58 1.86 2.85 3.55 3.19 3.78 3.77 2.99 2.08 3.03 2.89 2.42 2.90 1.54 1.11 2.60 2.80 3.20 3.33 4.11 4.00 2.68 1.80 2.35 2.20 1.50 3.80 2.40 2.30 3.90 4.10 5.90 3.55 4.22 2.83 1.25 1.88 2.31 0.84 1.60 0.90 3.88 3.21 2.86 2.30 3.10 2.90 3.40 4.18 6.22 3.58 4.33 2.87 1.68 2.44 2.57 2.83 2.91 1.71 1.41 2.86 3.96 3.11 4.05 2.66 2.10 1.66 2.31 2.97 2.95 1.10 2.22 1.22 3.13 3.41 2.54 2.87 1.66 3.44 3.16 2.77 2.37 2.14 2.09 5.20 3.21 3.66 2.95 3.62 2.11 2.57 2.84 2.12 2.40 2.80 2.69 2.15 1.76 1.55 2.99 3.56 3.22 3.10 1.56 2.01 3.04 2.20 2.87 3.44 2.11 2.54 3.44 2.10 3.65 3.22 2.16 2.88 2.09 3.07 2.17 3.04 2.09 1.08 2.74 3.63 3.45 4.04 2.92 2.13 2.61 3.51 2.83 3.16 1.92 2.93 3.82 3.51 2.87 2.49 1.66 2.60 3.03 2.59 2.33 1.09 0.68 1.22 0.69 3.26 3.21 3.88 2.56 4.34 2.68 2.10 3.81 3.26 4.35 5.11 3.99 2.18 2.69 2.25 3.37 5.21 4.23 2.16 3.44 2.99 3.65 3.94 3.71 2.17 3.77 2.46 2.76 3.57 3.47 3.71 3.04 2.74 2.34 3.23 1.69 2.18 2.46 3.33 3.87 3.25 3.17 3.22 3.09 2.99 2.79 2.48 3.24 1.76 3.21 2.45 3.45 1.54 1.27 6.12 4.38 3.22 3.68 3.82 3.41 2.77 2.09 3.07 1.45 3.22 1.54 3.41 3.76 2.45 2.97 2.93 2.56 2.12 3.42 3.61 3.14 3.15 3.23 3.22 2.44 2.70 3.10 3.40 3.54 1.67 0.96 4.11 4.21 3.56 3.18 3.11 2.81 3.25 3.33 2.33 3.24 2.62 2.79 3.09 1.88 3.44 3.07 3.54 2.80 2.58 3.90 3.40 3.21 2.42 2.85 3.59 3.21 2.77 2.38 2.86 2.47 3.21 3.24 3.44 2.12 2.76 2.88 2.45 3.45 3.17 2.51 2.78 2.33 4.12 3.43 4.24 2.54 2.32 2.22 3.44 3.66 2.11 2.09 5.31 2.65 3.51 3.80 3.40 2.60 1.90 2.57 3.12 3.33 2.76 2.58 2.65 1.57 4.44 3.89 3.76 4.21 5.72 3.89 3.90 3.56 3.11 3.28 1.80 3.54 3.21 3.51 2.02 4.09 3.55 4.80 2.67 4.21 3.67 4.30 5.90 5.69 2.76 2.84 2.38 3.78 3.65 3.90 4.85 5.12 5.09 3.44 3.12 3.32 3.99 4.78 4.32 4.12 4.44 4.00 5.12 5.35 3.66 3.19 3.76 3.66 3.34 4.09 5.80 3.61 3.06 3.44
要求:
(1)利用SPSS统计软件,在95%概率保证下,估计该地区全部居民人均收入置信区间。 步骤:1准备工作。 2,分析---描述统计--探索。
3,打开探索对话框,将收入放入因变量对话框中。 5. 选择统计量,把置信区间设置为95
6. 选择绘制,在绘制对话框中选择箱图和直方图。 选择确定,得出结果。 案例处理摘要 收入 N 500 有效 百分比 100.0% N 案例 缺失 百分比 0 .0% N 500 合计 百分比 100.0% 描述
收入
均值
均值的 95% 置信区间
统计量 2.8115 标准误 .04428 下限 上限
2.7245 2.8985 2.7862 2.7950 .980 .99011 .60 6.22 5.62 1.27 .374 .651
.109 .218 5% 修整均值 中值 方差 标准差 极小值 极大值 范围 四分位距 偏度 峰度
分析:从表中可以看出,居民人均收入为2.8115,所在的置信区间为2.7245--2.8985,所对应的方差为0.98.,居民人均收入差异大。
(2)如果估计的误差不超过1.2万元,在同样的置信度下应该抽取多少人进行调查。
P=0.95 1-p=0.05 n=1.96*1.96*0.95*0.05/(0.05*0.05)=
2.背景资料:近期有多家超市接到顾客投诉,反映国内某品牌直饮净水器的使用寿命太短。国家规定该规格直饮净水器的平均使用寿命不低于1200升。为了检验该产品的质量,超市随机抽取100件该品牌直饮净水器进行使用寿命的测试,测得结果如表6-2所示。 表6-2 样本数据 单位:升
1112 1187 1210 803 1196 1197 1131 1191 1170 990
要求:
1131 1275 1240 1270 1220 1229 1094 1195 1172 1106 1132 1250 1245 1300 1240 1249 1139 1198 1253 1116 1220 1210 1230 1319 1183 1297 1078 1195 1181 1230 1086 1249 1265 1256 1202 1260 1156 1199 1192 1225 1141 1244 1217 1215 1182 1170 1199 1140 1231 1160 1266 1244 1269 1156 1170 1182 1160 1147 1190 1193 1259 1236 1210 1201 1284 1189 1109 1210 1198 1200 1220 1210 1280 1250 1249 1180 1137 1220 1204 1209 1220 1209 1204 1237 1206 1216 1219 1209 1201 1194
(1)利用SPSS统计软件,对该直饮净水器的平均使用寿命(出水量)进行区间估计,要求推断的把握程度为95%。
(2)结合直方图或正态分布图及箱线图对顾客提出的意见加以分析说明。 步骤:1.准备工作打开文件6-2,通过文件--打开将文件放入文件窗口。 2. 选择分析-描述统计-探索。
2. 打开探索对话框,将使用,寿命放入因变量框中。
3. 择统计量,在描述性选项下将置信区间设置为95. 4.选择绘制,在绘制对话框中选择箱图和直方图。 5.选择确定,得出结果。
3. 某高校有100老师,随机抽取20名进行教学情况调查,试用SPSS随机化过程实现抽样。取样规定:取随机数字较大的20名老师。
步骤:1准备工作。
3. 选择转换--随机数字生成器。
4. 在随机数字生成器中选择设置活动生成器--设置起点--将固定值设置为今天日期。 5. 选择转换--计算变量
6. 在计算变量对话框中,打入随机数,在数字表达式中选择URRNIFORM(0,1).选择确定,产生随机数。
7. 将随机数进行个案排秩,将随机数放入变量框中。 8. 选择确定,产生R随机数
9. 对R随机数进行排序个案--做降序处理。
实验七 相关与回归分析
1.一家汽车销售商的经理认为,汽车的销量与投入的广告费用有着密切的关系。为研究他们之间的关系,这位经理搜集了过去10年的数据,见表7-1。 表7-1 2001~2010年汽车销量与广告费用资料
年份 序号 汽车销售量(辆) 广告费用(万元) 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
要求:
1 2 3 4 5 6 7 8 9 10 1100 1250 1280 1360 1480 1500 1720 1800 1890 2100 385 420 406 490 525 602 651 735 721 840 (1)你认为汽车销量与广告费相关吗? 步骤:1准备工作。
2. 选择图形---图表创建程序
3. 选择散点图,将散点图放入作图框中,将汽车销量放在Y轴,将广告费用放在X轴。 4. 选
择
确
定
,
得
出
结
果
。
分析:从图所知,汽车销量和广告费用呈现一定的正相关关系,广告费用投入越多,汽
车销量越好。
(2)根据散点图判断,你认为汽车销量与广告费是数目关系? 步骤:1选择分析---相关--双变量
2打开双变量对话框后,将汽车销售量和广告费放入变量对话框中。 4. 选择选项,勾选均值和标准差。 5. 选择确定,得出结果。
描述性统计量
汽车销售量(辆) 广告费用(万元)
均值 1548.00 577.50 标准差 319.437 157.054 N
10 10
相关性
汽车销售量(辆)
Pearson 相关性 显著性(双侧) N
汽车销售量(辆) 广告费用(万元) 1 .984** .000 10 .984** .000 10 10 1
广告费用(万元) Pearson 相关性 显著性(双侧) N
10 **. 在 .01 水平(双侧)上显著相关。
分析:描述性输出。所选样本变量为10个,汽车平均销售量为1548,标准差为319.437,广告费用的投入平均值为577.5,想对应的标准差为157.054。
相关性输出。汽车销量和广告费用之间的相关系数为0.984,>0.01,所以汽车销量和广告费用之间存在高度正相关关系。
(3)若2011年和2012年广告费用投入1000万元和1250万元,汽车销量可能为多少辆?
步骤:1选择分析---回归--线性。
2. 在打开线性分析对话框中,将广告费用放入自变量对话框中,将汽车销量放入因变量对话框中。
3. 选择统计量按钮,勾选估计和模型拟合度。 4. 选择确定得出结果。
输入/移去的变量b 模型 1 输入的变量 广告费用(万元)a 移去的变量 方法 . 输入 a. 已输入所有请求的变量。 b. 因变量: 汽车销售量(辆) 模型汇总 模型 1 R .984a R 方 .968 调整 R 方 标准 估计的误差 .964 60.392 a. 预测变量: (常量), 广告费用(万元)。 Anovab 模型 1 回归 残差 总计 平方和 889182.408 29177.592 918360.000 df 1 8 9 均方 889182.408 3647.199 F 243.799 Sig. .000a a. 预测变量: (常量), 广告费用(万元)。 b. 因变量: 汽车销售量(辆) 系数a 非标准化系数 模型 1 (常量) 广告费用(万元) a. 因变量: 汽车销售量(辆) B 392.217 2.001 标准 误差 76.446 .128 标准系数 试用版 t 5.131 .984 15.614 Sig. .001 .000
分析:得出Y=392.217+2.001x
当x=1000时 Y=392.217+2001=2393.217 当x=1250时,y=392.217+2.001*1250=
2. 表7-2给出我国1998-2007年的通货膨胀率和城镇登记失业率。试用简单回归分析方法描述二者的关系,并解释其意义。
步骤:1准备工作。 2. 3. 4.
选择图形---图表构建程序,选择散点图。
将散点图拉入作图框中,将通货膨胀率放入X轴,将城镇失业率放入Y轴。 选择确定,得出结果。
5分析:通货膨胀率和失业率之间存在一定的相关关系。 5. 选择分析---回归---线性。
6. 在线性对话框中,将通货膨胀率放入因变量对话框中,将失业率放入自变量对话框中。 选择确定,得出结果。
分析:设失业率为Y,通货膨胀率为x,则有Y=3.601+0.157x,失业率随着通货膨胀率的增加而增加。
实验八 动态数列分析
1. 数据8-1.sav给出了1978-1998年我国钢铁产量的数据,试用SPSS制作趋势图并建立直线趋势方程。
步骤:1准备工作。 2. 选择数据--定义日期。
3. 在定义日期对话框中,在个案对话框中选择年份,将开始年份设置为1978. 4. 选择分析--预测---序列图。
5. 在序列图对话框中,将钢产量放入变量框中,将年份放入时间轴标签中。 6. 选择确定,得出结果。
7. 定义序列,在变量视图中添加时间序列。
8. 选择分析--回归--曲线估计。
9. 将刚产量放入因变量对话框中,将时间序列放入变量框中。 10. 选择确定,得出结果。
分析:随着时间的推移,钢产量呈现增长趋势。
实验九 统计指数分析
1. 某工业企业甲、乙、丙三种产品产量及价格资料如下表: 产品 名称 甲 乙 丙 合计 计量 单位 套 吨 台 — 基期 300 460 60 — 产量 报告期 320 540 60 — 价格(元) 基期 360 120 680 — 报告期 340 120 620 — 步骤:1准备工作。 2. 转换--计算变量---在目标变量对话框中输入P0q1,在数字表达式中写入p0*q1,得出结果。
11. 分析:
1.分析--描述统计--频率
2.在频率对话框中,将()放入变量对话框中。 3.选择统计量,将
4,选择图表,将图表类型设置为 5.选择确定。
因篇幅问题不能全部显示,请点此查看更多更全内容