中国大学统计学(应用经济)答案(慕课2023课后作业答案)

中国大学统计学(应用经济)答案(慕课2023课后作业答案)

导论:课程基本情况

第一次小测

1、中国下面不属于描述统计问题的大学是(??)。
A、统计1. 根据样本信息对总体进行的用经业答推断
B、2. 了解数据分布的济答特征顺序数据
C、3. 分析感兴趣的案慕案总体特征
D、4. 利用图、课课表或其他数据汇总工具分析数据

2、后作一项民意调查的中国目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的大学年 轻人愿意与其父母讨论家庭财务状况,38%的统计年轻人愿意与其父母讨论有关教育的话题, 15%的用经业答年轻人愿意与其父母讨论爱情问题。该调查所收集的济答数据是(??)。
A、案慕案数值数据
B、课课分类数据
C、顺序数据
D、二值类别数据

3、数据分析的真正目的是(??)。
A、心目中有了某种结论性的东西,然后去找一些统计来支持已有的结论
B、是为统计服务的,使统计变得完美无缺
C、从数据中找出规律,从数据中寻找启发
D、是研究如何利用样本数据来推断总体特征,为决策者提供一个科学的依据

4、统计年鉴中 2016 年全国各大城市的人均家庭收入数据属于(??)。
A、定性数据
B、顺序数据
C、时间序列数据
D、截面数据

5、在抽样推断中,总体参数是一个(??)。
A、随机变量
B、已知的量
C、抽样数量
D、确定的量

6、根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是(??)。
A、名义尺度
B、时间尺度
C、差距尺度
D、比例尺度

7、在考查课程成绩评定时,其评分等级分别是优秀、良好、普通、及格与不及格,则此“等级”是(??)。
A、品质指标
B、数量指标
C、指标数值
D、名义指标

8、按照L.J.Savage学者的说法,统计学基本上就是寄生的数学方法与技术。

9、STATA, R, SAS, SPSS, EViews, OFFICE都是统计计量或数据分析的常见软件。

10、重复抽样与不重复抽样是完全互斥的样本空间。

第1章 两总体均值和比例的统计推断

第一章单元测试题

1、当原假设为时,备择假设应为( )
A、
B、
C、
D、

2、下列几个数值中,检验的P值为哪个值时,拒绝原假设的理由最充分?
A、95%
B、60%
C、10%
D、1%

3、当总体服从正态分布,但方差未知的情况下,设定假设检验条件为,则假设检验的拒绝域是( )
A、
B、
C、
D、

4、某地方煤矿原先每月发生事故的平均次数为次,企业制订了一项新的旨在减少事故的安全生产计划,新计划实施后每月事故的平均次数为,用来检验这一计划有效性的假设检验条件为:
A、
B、
C、
D、

5、对两个总体比例之差进行统计推断,当满足一定条件时,样本均值的抽样分布可近似为正态分布,描述该条件的下列说法中,错误的是( )
A、
B、
C、
D、大样本容量

6、两个总体比例之差的抽样分布,其标准差为()
A、
B、
C、
D、

7、使用R软件对两个总体均值之差进行假设检验,已知两个总体的方差不相等,我们先将两个总体的样本数据各自赋值给x和y,后续操作正确的是:
A、t.test(x, y,paired = TRUE)
B、t.test(x, y, var.equal=FALSE)
C、t.test(x, y, var.equal=TRUE)
D、prop.test(x, y, var.equal=FALSE)

8、某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,据此我们判断该彩电无故障时间没有显著增加(a=0.01)。

9、相比较于独立样本,配对样本更能排除无关因素对研究主题的干扰,使两个总体(实验组与对照组)具有更高的可比性。

10、本章“故事背后的统计”所讲述的《城市道路利用率的双城记》,给出了按照时间和出行距离交叉分组的假设检验结果图,分析该图发现,针对5-15千米的中、长途出行方式,纽约的绕路比显著高于北京,该特征在白天尤为明显。

补充1参数估计环节测试题

1、估计值的含义是指
A、用来估计总体参数的统计量的名称
B、用来估计总体参数的统计量的具体数据
C、总体参数的名称
D、总体参数的具体数据

2、广告 看过广告的人数 回想起主要内容的人数 A 150 63 B 200 60 在对两个广告效果的电视评比中,每个广告在一周的时间内播放6次,然后要求看过广告的人陈述广告的内容。记录的资料如上表:请问两个总体回想比例之差的95%置信区间为何?
A、【0.01, 0,22】
B、【0.02, 0.22】
C、【0.02, 0.32】
D、【0.04, 0.42】

3、某城市为统计A,B两个区家庭年平均收入之差,在两个区抽取两个独立的随机样本(正态总体),样本信息如下表。请问两个家庭年平均收入之差的95%置信区间为何? A区 B区 n1=8 n2=12 X1bar=15,700元 X2bar=14,500元 s1=700元 s2=850元
A、1200+/-562
B、1200+/-662
C、1200+/-762
D、1200+/-862

4、某大型企业提出一项改革措施,为估计职工中赞成该项改革人数的比例,要求误差不超过0.03,置信水平为90%,则应抽取最少几多样本量呢?
A、557
B、657
C、757
D、857

5、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%置信区间,希望的边际误差为25元,应抽取的样本量为()。
A、20
B、30
C、40
D、50

6、Z = (Xbar-μ)÷(s/√n) 使用以上统计量估计总体均值的条件是:
A、总体正态的小样本方差已知
B、总体正态的小样本方差未知
C、大样本且方差未知
D、大样本且方差已知

7、指出下面的哪一个说法是正确的?
A、在置信水平一定的条件下,要提高估计的可靠性,就应该缩小样本量
B、在置信水平一定的条件下,要提高估计的可靠性,就应该增大样本量
C、在样本量一定的条件下,要提高估计的可靠性,就应降低置信水平
D、在样本量一定的条件下,要提高估计的准确性,就应提高置信水平

8、若欲估计总体正态分布的两个独立小样本的均值差,其标准差皆未知,应使用的分布是
A、Z分布
B、t分布
C、卡方分布
D、F分布

9、在其他条件不变的情形下,总体数据的标准差愈大,则估计时所需的样本就( ).
A、愈大
B、愈小
C、未定
D、不变

10、从均值分别为C1和C2的总体中抽出两个独立随机样本,当X1bar=150,s1^2-36; X2bar=140,s2^2=24; n1=n2=35时,两个样本均值差的抽样标准差σx1bar-x2bar为何?
A、1.21
B、1.31
C、1.41
D、1.51

用图表展示数据1

1、请大家依据老师给的两组数据分别画出箱型图与k线图,并且试着回答老师下课前针对图形和数据的提问。

第2章 方差的统计推断

第二章单元测试题

1、1.设总体,其中参数未知,是取自总体的简单随机样本,对于给定的显著性水平,假设检验的条件为,时,选取的检验统计量服从( )
A、
B、
C、
D、

2、对一个总体的方差进行假设检验:. 关于拒绝域和显著性水平的图示,下列阐述正确的有:
A、
B、
C、
D、上述图形都不对

3、在R软件中,两个总体方差比的假设检验和区间估计,常用的函数为:
A、qf( )
B、chisq.var.test( )
C、pchisq( )
D、var.test( )

4、机床厂某日从两台机器所加工的同一种零件中,分别抽取两个样本,检验两台机床的加工精度是否相同,则提出假设:
A、
B、
C、
D、

5、设总体,为未知参数,样本的样本方差为, 对假设检验水平为的拒绝域是
A、
B、
C、
D、

6、对正态总体的标准差进行假设检验,如果在显著性水平0.05下无法拒绝那么在显著性水平0.01下,下列结论中正确的是:
A、必接受
B、可能接受,也可能拒绝
C、必拒绝
D、不接受,也不拒绝

7、设总体未知,为来自总体的样本观测值,记为样本均值,为样本方差,对假设检验应取检验统计量为:
A、
B、
C、
D、

8、对正态总体的标准差进行假设检验,如果在显著性水平0.05下拒绝,那么在显著性水平0.1下,下列结论中正确的是:
A、必接受
B、可能接受,也可能拒绝
C、必拒绝
D、不接受,也不拒绝

9、在其他条件不变时,置信度越大,则区间估计的
A、误差范围越大
B、精确度越高
C、置信区间越小
D、可靠程度越低

10、n个相互独立、服从标准正态分布的随机变量之和,服从自由度为n的卡方分布

11、根据如下F分布表,当分子自由度(纵向)为15,分母自由度(横向)为8时,我们可以查得临界值 = 2.46

12、某厂生产的某种产品,由以往经验知其重量的标准差为7.5kg且服从正态分布,改用新原料后,从新产品中抽取25件作测重试验,算得样本标准差s=9.5kg,可以在10%显著水平下认为新产品的重量标准差有显著变化

13、首次公开发行(IPO)的股票,首日收盘价普遍高于发行价,这一有趣的现象被称为“IPO折价之谜”。IPO折价率的方差,反映了IPO股票的发行价与收盘价之间偏差幅度的平均规模。

第3章 拟合优度和独立性检验

第三章单元测试题

1、在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的( )倍。
A、2
B、4
C、不变
D、不确定

2、下列说法正确的是( )。
A、事件A与B关系越密切,统计量值就越小
B、事件A和事件B相互独立,意味着事件A的概率不会因为事件B的发生而有所改变,反之亦然
C、统计量值的大小是判断事件A与B是否相关的惟一数据
D、若判定两事件A与B有关,则A发生B一定发生

3、对多个总体比例进行假设检验:,我们常用的卡方检验是一种( )。
A、左侧检验
B、右侧检验
C、双侧检验
D、上述情况都有可能

4、通过计算高中生的性别与喜欢唱歌的列联表数据,得到,并且已知那么可以得到的结论是:有 以上的把握认为“性别与喜欢唱歌之间有关系”。
A、4.98%
B、5%
C、95%
D、上述情况都不可能

5、为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示: 男 女 正常 442 514 色盲 38 6 经计算,统计量为27.14,自由度为2的分布上侧分位数,根据上述数据,试问色盲与性别关系是( )。
A、相互独立
B、有99.9%的把握认为色盲与性别无关
C、只有0.1%的把握认为色盲与性别有关
D、不相互独立

6、某公司对71名员工是否支持工资改革方案做了调查,结果如下表所示: 支持新工资方案 支持原有工资方案 合计 工龄在15年以上的员工 12 25 37 工龄在15年以下的员工 10 24 34 合计 22 49 71 经计算,统计量为0.08,自由度为1的分布上侧分位数,根据上述数据,在10%的显著性水平下,下列表述正确的是( )。
A、工龄与对新工资改革方案的态度,两者之间是有关的
B、工龄与对新工资改革方案的态度,两者之间的关系不确定
C、工龄与对新工资改革方案的态度,两者之间是无关的
D、上述表述都不对

7、在R软件中,使用列联表对两个定性变量之间的独立性进行假设检验,常用的函数为:
A、var.test( )
B、chisq.var.test( )
C、pchisq( )
D、chisq.test( )

8、正态Q-Q图如下,如果认为各分位点(即图中的散点)分布在对角线附近,关于总体分布的判断,我们可以得到的正确结论是( )。
A、泊松分布
B、卡方分布
C、正态分布
D、二项分布

9、下面是一个2×2列联表 总计 a 42 68 18 12 30 总计 b 54 则表中a、b处的值分别为 ,
A、26,34
B、34,26
C、26,44
D、44,26

10、列联表(Contingency Tables)是观测数据按两个或更多属性分类时所列出的频数表。

11、使用列联表分析两个变量之间的独立性,当其他条件不变时,期望频数与实际频数之间的差异越小,说明变量之间相互独立的可能性越小。

12、拟合优度检验,是用来判断总体分布特征的唯一方法。

13、正态QQ图的基本思想,是比较实际观测分布与正态分布对应的分位数的接近程度。

14、正态拟合优度检验的原假设,是假定总体不服从正态分布。

15、针对正态拟合优度检验,我们设定分组区间时,常定义每组期望频数不低于5。

统计检验小复习

1、一般来说,我们要检验三个以上类别(定性)变量之间的相关性,最好采用的是什么分布的检验?
A、Z分布检验
B、t分布检验
C、卡方检验
D、F分布检验

2、一家电视台为了了解观众对与某档电视节目的喜欢程度,对不同年龄段的男女观众进行了调查,得到喜欢该档电视节目的观众比例(%)如下。 请问卡方检验统计值的右尾p值是多少,证明了不显著。 年龄段 男性 女性 20岁以下 6 8 20-30岁 25 32 30-40岁 16 15 40-50岁 12 12 50岁以上 5 6
A、0.05
B、0.5
C、0.95
D、0.095

3、为分析消费者的所在地区与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果。 请计算两个变数之间的φ系数 汽车价格 东部地区 中部地区 西部地区 10万元以下 20 40 40 10万元-20万元 50 60 50 20万元-30万元 30 20 20 30万元以上 40 20 10
A、0.2738
B、0.074975
C、0.1936
D、0.2641

4、为分析消费者的所在地区与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果。 请计算两个变数之间的Cramer's系数 汽车价格 东部地区 中部地区 西部地区 10万元以下 20 40 40 10万元-20万元 50 60 50 20万元-30万元 30 20 20 30万元以上 40 20 10
A、0.2738
B、0.0374875
C、0.1936
D、0.2641

5、为分析消费者的所在地区与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果。 请计算两个变数之间的列联系数 汽车价格 东部地区 中部地区 西部地区 10万元以下 20 40 40 10万元-20万元 50 60 50 20万元-30万元 30 20 20 30万元以上 40 20 10
A、0.2738
B、0.069745808
C、0.1936
D、0.2641

6、一项包括了200家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每个家庭每天看电视的平均时间是6.70小时。取显著性水平α=0.01,这个调查意图证明是否“如今每个家庭每天看电视的平均时间增加”。 请问检验统计量的双尾P值是多少?
A、0.000933
B、0.001866
C、0.005
D、0.01

7、安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板进行测量,得到的重量数据如下(单位:公斤)。 22.6 26.6 23.1 23.5 27 25.3 28.6 24.5 26.2 30.4 27.4 24.9 25.8 23.2 26.9 26.1 22.2 28.1 24.2 23.6 请问t检验的统计量是多少?
A、2.19
B、4.47
C、1.04
D、0.51

8、对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例不是这样。为验证这一说法,生产商随机抽取550人,其中115人早餐饮用牛奶。 样本看来相当显著,唯有以下什么情形时会略不显著呢?
A、α=0.05双尾检验
B、α=0.01双尾检验
C、α=0.1双尾检验
D、α=0.01单尾检验

9、某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0-10分,分值越高表示潜在购买力越高。 个体 购买力得分 观看之后 观看之前 1 6 5 2 6 4 3 7 7 4 4 3 5 3 5 6 9 8 7 7 5 8 8 6 求t检验单尾p值。
A、0.055784
B、0.065784
C、0.054784
D、0.056784

10、某杂志上刊载了关于两部机器生产的袋茶重量(单位:公克),数据如下。检验这两部机器生产的袋茶重量是否有显著差异。其t检验的统计值是多少?(记得先做F检验) 机器1 2.95 3.45 3.5 3.75 3.48 3.26 3.33 3.2 3.16 3.2 3.22 3.38 3.9 3.36 3.25 3.28 3.2 3.22 2.98 3.45 3.7 3.34 3.18 3.35 3.12 机器2 3.22 3.3 3.34 3.28 3.29 3.25 3.3 3.27 3.38 3.34 3.35 3.19 3.35 3.05 3.36 3.28 3.3 3.28 3.3 3.2 3.16 3.33
A、4.0459
B、3.0459
C、2.0459
D、1.0459