超星数据分析技术_1课后答案(学习通2023课后作业答案)

会计类习题2024-05-19 11:01:5718158抢沙发
超星数据分析技术_1课后答案(学习通2023课后作业答案)摘要: 1.概述1.1 数据与数据分析随堂测验1、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的 ...

超星数据分析技术_1课后答案(学习通2023课后作业答案)

1.概述

1.1 数据与数据分析随堂测验

1、超星在某行业中随机抽取10家企业,数据第一季度的分析利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的技术中位数为( )
A、20
B、课后30
C、答案27.95
D、学习39.19

2、通课在某行业中随机抽取10家企业,后作第一季度的业答利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,29,20。该组数据的超星众数为( )
A、20
B、数据30
C、分析29
D、技术23.9

3、课后在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的平均值为( )
A、20
B、27.95
C、30
D、39.19

4、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的标准差为( )
A、381.9
B、19.54
C、72
D、20

5、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的方差为( )
A、381.9
B、19.54
C、72
D、20

6、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的最小值为( )
A、381.9
B、19.54
C、72
D、20

7、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的最大值为( )
A、381.9
B、19.54
C、72
D、20

1.2 SPSS软件简介随堂测验

1、下面哪个是spss的数据文件类型?
A、*.sps
B、*.sav
C、*.spv
D、*.dat

2、在SPSS中的视图窗口中包括下面哪些内容?
A、数据视图
B、输出视图
C、变量视图
D、选项视图

1.3 数据文件的建立随堂测验

1、SPSS中变量参与分析的唯一标志是( )
A、变量名
B、变量类型
C、变量名标签
D、变量值标签

2、SPSS变量名中不可以有的字符是( )
A、数字
B、!
C、?
D、*

3、*.sav、*.spv和*.sps都是SPSS的内部文件

1.4 数据的预处理-1随堂测验

1、在合并两个 SPSS 文件时,正确的说法是:
A、如果是添加变量,SPSS 可以显示变量是来源于哪个数据文件。
B、如果是添加个案,SPSS 可以显示变量是来源于哪个数据文件。
C、合并两个 SPSS 文件后,将无法辨别个案来自于哪一个文件
D、以上都不正确

2、下面哪些是横向合并中“按照排序文件中的关键变量匹配个案”复选框的选项?
A、两个文件都提供个案
B、非活动数据集为基于关键字的表
C、活动数据集为基于关键字的表
D、两个文件都不提供个案

3、在进行SPSS数据个案拆分时,有哪几种指定的拆分方式?
A、分析部分个案
B、分析所有个案,不创建组
C、比较组
D、按组组织输出

4、在合并数据文件之前,所有需要合并的数据文件必须预先按照[[ ]]进行升序排列。 否则,合并文件程序将失败。

第1单元测验

1、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的中位数为( )
A、20
B、30
C、27.95
D、39.19

2、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,29,25,23.9,23,20。该组数据的众数为( )
A、20
B、30
C、29
D、39.19

3、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的平均值为( )
A、20
B、30
C、27.95
D、39.19

4、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的标准差为( )
A、381.9
B、19.54
C、72
D、20

5、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的方差为( )
A、381.9
B、19.54
C、72
D、20

6、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的最小值为( )
A、381.9
B、19.54
C、72
D、20

7、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的最大值为( )
A、381.9
B、19.54
C、72
D、20

8、下面哪个是spss的数据文件类型?
A、*.sps
B、*.sav
C、*.spv
D、*.dat

9、SPSS中变量参与分析的唯一标志是()
A、变量名
B、变量类型
C、变量名标签
D、变量值标签

10、一组数据排序后处于中间位置上的变量值称为()
A、众数
B、中位数
C、四分位数
D、平均数

11、在SPSS中的视图窗口中包括下面哪些内容?
A、数据视图
B、输出视图
C、变量视图
D、选项视图

12、SPSS变量名中不可以有的字符是()
A、数字
B、!
C、?
D、*

13、下面哪些是横向合并中“按照排序文件中的关键变量匹配个案”复选框的选项?
A、两个文件都提供个案
B、非活动数据集为基于关键字的表
C、活动数据集为基于关键字的表
D、两个文件都不提供个案

14、在进行SPSS数据个案拆分时,有哪几种指定的拆分方式?
A、分析部分个案
B、分析所有个案,不创建组
C、比较组
D、按组组织输出

15、下列属于描述统计问题的是( )
A、根据样本信息对总体进行的推断
B、了解数据分布的特征
C、分析感兴趣的总体特征
D、利用图表或其他数据工具分析数据

16、*.sav、*.spv和*.sps都是SPSS的内部文件

17、平均数和中位数相等

18、*.spv是spss输出文件的扩展名

19、SPSS 认为 Name、name、nAme 这三个变量名没有区别

20、在合并数据文件之前,所有需要合并的数据文件必须预先按照[ ]进行升序排列。 否则,合并文件程序将失败。

SPSS数据库构建

1、附件中表格的是一个胆固醇调查表,请构建如表结构的SPSS数据库,并且录入表中的数据,数据文件保存为“胆固醇调查表.sav”;截图上传答案,库结构和数据界面要分别截图。

02 基本数据分析方法

2.1 描述性分析-利用SPSS进行频率分析随堂测验

1、SPSS频率分布分析中可以绘制的图是?
A、茎叶图
B、直方图
C、箱图
D、散点图

2、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的方差是?
A、9.3
B、8.37
C、92.13
D、93.93

3、以下统计量中哪一个是分布趋势统计量?
A、均值
B、偏度
C、标准差
D、最大值

4、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的标准差是?
A、3.05
B、8.37
C、9.69
D、4.56

5、SPSS频率分布分析中不可以绘制的图是?
A、饼图
B、直方图
C、箱图
D、散点图

6、以下统计量中哪几个是离散趋势统计量?
A、标准差
B、最大值
C、最小值
D、方差

2.1 描述性分析-利用Excel进行频率分析随堂测验

1、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的方差是?
A、9.3
B、8.37
C、92.13
D、93.93

2、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的标准差是?
A、3.05
B、8.37
C、9.69
D、4.56

3、以下统计量中哪一个是集中趋势统计量?
A、均值
B、偏度
C、标准差
D、最大值

4、以下统计量中哪几个不是集中趋势统计量?
A、合计
B、中位数
C、最大值
D、峰度

5、下面这组数据50,44,35,80,26,28,41,21,61中的“50”的标准化得分是[ ]。

2.1 描述性分析-利用SPSS进行描述分析随堂测验

1、以下统计量中哪一个是离散趋势统计量?
A、均值
B、偏度
C、标准差
D、峰度

2、以下统计量中哪一个不是离散趋势统计量?
A、最大值
B、偏度
C、标准差
D、最小值

3、以下统计量中哪几个是分布趋势统计量?
A、均值
B、偏度
C、标准差
D、峰度

4、描述性分析中可以直接绘制条形图。

5、下面这组数据32,37,36,32, 51,53,33,61,35中的“51”的标准化得分是[ ]。

2.1 描述性分析-利用Excel进行描述分析随堂测验

1、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的均值是?
A、170
B、172.42
C、174.24
D、165.1

2、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的均值是?
A、56.5
B、55.9
C、57.25
D、58.5

3、频率分析与描述性分析的主要作用是基本一样的。

2.2 交叉分析-利用SPSS实现交叉分析随堂测验

1、在交叉表分析中的哪个对话框,主要用于设置单元格显示选项。
A、单元显示
B、统计量
C、精确检验
D、单元

2、在交叉表分析中,哪种精确检验方式是系统默认的?
A、仅渐进法
B、Monte Carlo
C、精确
D、Kappa

3、在交叉表分析主对话框中,启用哪个复选框,就会在结果中输出每个变量不同取值情况下的复式条形图?
A、条形图
B、取消表格
C、观察值
D、复式条形图

4、在交叉表分析主对话框中,启用哪个复选框,在结果中将不输出交叉列联表的表格?
A、条形图
B、取消表格
C、观察值
D、复式条形图

5、在交叉表分析中,有哪几种精确检验方式?
A、仅渐进法
B、Monte Carlo
C、精确
D、Kappa

2.2 交叉分析-利用Excel实现交叉分析随堂测验

1、在Excel中可以用哪个功能很好的实现交叉分析?
A、数据排序
B、删除重复项
C、数据分析
D、数据透视表

2、数据透视表是一种什么样的报表。
A、交互的
B、Excel
C、独立的
D、排斥的

3、绘制交叉图表的时候最好选择哪种图形
A、散点图
B、百分比堆积柱形图
C、三维百分比堆积柱形图
D、折线图

4、[ ]分析是同时将两个以上具有一定联系的变量及变量值,按照一定的顺序交叉排列在同一张统计表中,进而便于分析变量之间的相互性。

2.3 缺失值分析随堂测验

1、下列对于缺失值的处理方式中,不正确的是?
A、删除缺失值
B、忽略缺失值
C、利用回归模型填充
D、利用EM模型填充

2、缺失值分析中,选择缺失值估计的处理方法中没有哪种?
A、相关法
B、成对法
C、EM法
D、回归法

3、按数据缺失形式分,缺失值分析的类别有:
A、完全随机缺失
B、单元缺失
C、随机缺失
D、非随机缺失

4、缺失值的处理方式有哪几种?
A、忽略缺失值
B、删除缺失值
C、缺失值替代
D、缺失值分析

5、在SPSS缺失值分析主对话框中,如果单击“使用所有变量”按钮,字符型等变量将全部进入哪个列表框?
A、个案标签
B、定量变量
C、分类变量
D、所有变量

6、在SPSS缺失值分析主对话框中,如果单击“使用所有变量”按钮,数值型变量将全部进入哪个列表框?
A、个案标签
B、定量变量
C、分类变量
D、所有变量

7、按缺失机制与方式分,缺失值分析的类别有:
A、随机缺失
B、项目缺失
C、非随机缺失
D、完全随机缺失

8、EM模型的缺失值填充效果比回归模型的填充效果要好。此种说法对还是不对?

2.4 假设检验概述随堂测验

1、检验目的是为了决定一个关于总体特征的定量的断言是否真实的方法是 ?
A、描述统计
B、探索分析
C、回归分析
D、假设检验

2、在假设检验中,如果没有特殊要求,显著性水平α最常使用哪个值?
A、0
B、0.05
C、0.001
D、1

3、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间?
A、无关
B、有显著差异
C、无显著差异
D、不知道

4、在假设检验中,如果p值小于显著性水平α,就认为总体均值与检验值之间?
A、无关
B、有显著差异
C、无显著差异
D、不知道

5、均值过程中用户只可以指定一个变量作为分组变量。

6、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间有显著差异。

7、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间无显著差异。

基本数据分析方法单元测验

1、下列对于缺失值的处理方式中,不正确的是?
A、删除缺失值
B、忽略缺失值
C、利用回归模型填充
D、利用EM模型填充

2、缺失值分析中,选择缺失值估计的处理方法中没有哪种?
A、相关法
B、成对法
C、EM法
D、回归法

3、按数据缺失形式分,缺失值分析的类别有:
A、完全随机缺失
B、单元缺失
C、随机缺失
D、非随机缺失

4、在SPSS缺失值分析主对话框中,如果单击“使用所有变量”按钮,数值型变量将全部进入哪个列表框?
A、个案标签
B、定量变量
C、分类变量
D、所有变量

5、在SPSS缺失值分析主对话框中,如果单击“使用所有变量”按钮,字符型等变量将全部进入哪个列表框?
A、个案标签
B、定量变量
C、分类变量
D、所有变量

6、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的标准差是?
A、3.05
B、8.37
C、9.69
D、4.56

7、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的方差是?
A、9.3
B、8.37
C、92.13
D、93.93

8、收集了五名中学生的身高(cm)数据,分别是:166,189,170,165.1,172,请问数据的均值是?
A、170
B、172.42
C、174.24
D、165.1

9、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的均值是?
A、56.5
B、55.9
C、57.25
D、58.5

10、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的标准差是?
A、3.05
B、8.37
C、9.69
D、4.56

11、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的方差是?
A、9.3
B、8.37
C、92.13
D、93.93

12、SPSS频率分布分析中可以直接绘制的图是?
A、茎叶图
B、直方图
C、箱图
D、散点图

13、在Excel中可以用哪个功能很好的实现交叉分析?
A、数据排序
B、删除重复项
C、数据分析
D、数据透视表

14、在交叉表分析中,哪种精确检验方式是系统默认的?
A、Monte Carlo
B、仅渐进法
C、精确
D、Kappa

15、在交叉表分析主对话框中,启用哪个复选框,就会在结果中输出每个变量不同取值情况下的复式条形图?
A、条形图
B、取消表格
C、观察值
D、复式条形图

16、在交叉表分析主对话框中,启用哪个复选框,在结果中将不输出交叉列联表的表格?
A、条形图
B、取消表格
C、观察值
D、复式条形图

17、以下统计量中哪一个是分布趋势统计量?
A、均值
B、偏度
C、标准差
D、最大值

18、以下统计量中哪一个是离散趋势统计量?
A、均值
B、偏度
C、标准差
D、峰度

19、以下统计量中哪一个是集中趋势统计量?
A、均值
B、偏度
C、标准差
D、最大值

20、SPSS频率分布分析中不可以绘制的图是?
A、饼图
B、直方图
C、箱图
D、散点图

21、以下统计量中哪几个不是集中趋势统计量?
A、合计
B、中位数
C、最大值
D、峰度

22、以下统计量中哪几个是离散趋势统计量?
A、标准差
B、最大值
C、最小值
D、方差

23、在SPSS的交叉表分析中,有哪几种精确检验方式?
A、仅渐进法
B、Monte Carlo
C、精确
D、Kappa

24、绘制交叉图表的时候最好选择哪种图形?
A、散点图
B、百分比堆积柱形图
C、三维百分比堆积柱形图
D、折线图

25、数据透视表是一种什么样的报表。
A、交互的
B、Excel
C、独立的
D、排斥的

26、在交叉表分析主对话框中,适用于二维列联表分析的是哪个列表框?
A、“行”列表框
B、“列”列表框
C、“层”列表框
D、“源”列表框

27、按缺失机制与方式分,缺失值分析的类别有:
A、随机缺失
B、项目缺失
C、非随机缺失
D、完全随机缺失

28、缺失值的处理方式有哪几种?
A、忽略缺失值
B、删除缺失值
C、缺失值替代
D、缺失值分析

29、EM模型的缺失值填充效果比回归模型的填充效果要好。此种说法对还是不对?

30、频率分析与描述性分析的主要作用是基本一样的。

31、SPSS频率分布分析中可以直接绘制条形图。

32、SPSS描述性分析中可以直接绘制条形图。

33、[ ]分析是同时将两个以上具有一定联系的变量及变量值,按照一定的顺序交叉排列在同一张统计表中,进而便于分析变量之间的相互性。

34、下面这组数据32,37,36,32, 51,53,33,61,35中的“51”的标准化得分是[ ]。

数据分析

1、利用“关于外商投资企业雇员的调查问卷”进行了调查,共收回有效问卷1092份,数据文件为“外商投资企业雇员调查数据.sav”。要求对不同性别的员工去外企工作的途径进行交叉表分析,并研究有无明显的差别? 数据文件可以去百度云盘下载 链接:https://pan.baidu.com/s/1DmsSqgoatHiSei8Q3xCAsA 提取码:0sjl

03 高级数据分析方法

3.1 T检验随堂测验

1、单样本T检验中的“置信区间百分比”的水平通常定为?
A、95%
B、96%
C、97%
D、98%

2、独立样本T检验中的“缺失值”栏中,系统默认的用于选择处理缺失值的方式?
A、无
B、按列表排除个案
C、按顺序排除个案
D、按分析顺序排除个案

3、单样本T检验的前提?
A、样本独立
B、正态分布
C、样本配对
D、方差齐性

4、T检验中最简单的一种分析过程是?
A、均值过程
B、协方差分析
C、单样本T检验
D、独立样本T检验

5、某部门对当前市场的鸡蛋价格情况进行调查,抽查了全省20个集市上的售价,得到均值是3.399(单位:元/500克)。已知往年的平均售价一直稳定在3.25元/500克左右,对抽查的数据进行单样本T检验后,得到双侧的Sig值是0.023,能否认为全省当前的鸡蛋售价明显高于往年?(显著性水平取0.05)
A、鸡蛋售价明显低于去年
B、鸡蛋售价明显高于去年
C、鸡蛋售价明显等于去年
D、不一定

6、某部门对当前市场的鸡蛋价格情况进行调查,抽查了全省20个集市上的售价,得到均值是3.399元/500克。已知往年的平均售价一直稳定在3.25元/500克左右,如果想要对抽查的数据进行单样本T检验(显著性水平取0.05),看看当前的鸡蛋售价是否明显高于往年检验值应该取哪个数?
A、500
B、3.399
C、0.05
D、3.25

7、对某银行的所有雇员进行了调查,发现男性平均年薪是41万多,女性平均年薪是26万多,进一步对调查的数据进行独立样本T检验后得到双侧Sig值是0,那么是否可以断定这家银行的平均年薪男性与女性有明显差异?
A、这家银行的平均年薪男性与女性没有明显差异
B、这家银行的平均年薪男性与女性有明显差异
C、这家银行的平均年薪男性与女性看不出明显差异
D、这家银行的平均年薪男性与女性不一定有明显差异

8、独立样本T检验的前提是?
A、样本独立
B、正态分布
C、样本配对
D、方差齐性

9、配对样本T检验的前提是?
A、样本独立
B、正态分布
C、样本配对
D、方差齐性

3.2 方差分析随堂测验

1、SPSS单因素方差分析中需要把被分析的变量放入到下面哪个框中?
A、“自变量列表”框
B、“因变量列表”框
C、“因子”列表框
D、源列表框

2、在针对连续变量的统计推断方法中,最常用的有T检验和?
A、方差分析
B、频率分析
C、探索分析
D、相关分析

3、在假设检验中,什么情况下就认为总体均值与检验值之间无显著差异?
A、如果p值小于显著性水平α
B、如果p值大于显著性水平α
C、如果p值等于显著性水平α
D、不知道

4、在假设检验中,原假设和备选假设
A、都有可能成立
B、都有可能不成立
C、只有一个成立而且必有一个成立
D、原假设一定成立,备择假设不一定成立

5、方差分析的应用条件是?
A、数据独立
B、正态分布
C、样本配对
D、方差齐性

6、协方差分析中需要把对因变量可能有影响,需要在分析时对其作用加以控制的连续性变量放入到下面哪个框中?
A、“协变量”列表框
B、“因变量”列表框
C、“固定因子”列表框
D、“随机因子”列表框

7、协方差分析中的“模型”对话框中含有哪两种指定类型?
A、因子
B、全因子
C、设定
D、对比

8、在单因素方差分析的结果中,如果P值为0.36,在显著性水平为0.05的情况下,可以认为检验变量间没有显著差异。

9、为研究A、B两种降压药对高血压病人的降压效果,将受试对象随机分为两组,分别接受A、B降压药治疗2个月后,测量患者收缩压;对数据进行协方差分析后结果显示治疗前血压因素的F=6.463,P=0.017,这说明治疗前血压对治疗后的血压没有影响。

10、针对连续变量的统计推断方法中,最常用的有T检验和 [ ]

3.3 相关与回归分析随堂测验

1、反映变量间关联程度的参数,r为-1~1,r>0时表示变量间:
A、正相关
B、负相关
C、零相关
D、不确定

2、反映变量间关联程度的参数,r为-1~1,r<0时表示变量间:
A、正相关
B、负相关
C、零相关
D、不确定

3、具有相关关系的两个变量的特点是:
A、一个变量的取值不能由另一个变量唯一确定
B、一个变量的取值由另一个变量唯一确定
C、一个变量的取值增大时,另一个变量的取值也一定增大
D、一个变量的取值增大时,另一个变量的取值肯定变小

4、根据你的判断,下面的相关系数取值哪一个是错误的:
A、-0.86
B、0.78
C、1.25
D、0

5、下面哪一个不是回归分析要解决的问题:
A、从一组样本数据出发,确定变量之间的数学关系式
B、对数学关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的
C、利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值
D、度量两个变量之间的关系强度

6、在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称为:
A、自变量
B、因变量
C、随机变量
D、非随机变量

7、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中正确的是:
A、较高的男子趋于较重
B、身高与体重存在低度正相关
C、体重较重的男子趋于较矮
D、45%的较高的男子趋于较重

8、若需要进行相关分析的两个变量其取值均受到其他变量的影响,可以通过( )分析对其他变量进行控制,给出在控制其他变量影响后两个变量的相关系数。
A、方差
B、偏相关
C、双变量相关
D、协方差

9、偏相关分析是在排除了其他因素的影响后,考察两个因素间的关联程度。

3.4 聚类分析随堂测验

1、聚类分析的目的是
A、抽样
B、降维
C、描述
D、检验

2、当对样本分类还不清楚的时候,要先使用哪种分析进行分类
A、判别分析
B、因子分析
C、聚类分析
D、主成分分析

3、既可以对样品聚类也可以对变量聚类的方法是
A、系统聚类
B、K-中心聚类
C、K-均值聚类
D、条件聚类

4、实际工作中使用的最多的一种聚类方法是
A、系统聚类
B、K-中心聚类
C、K-均值聚类
D、条件聚类

5、根据聚类的对象不同,聚类可以分为
A、样品聚类
B、Q-型聚类
C、变量聚类
D、R-型聚类

6、适合对大样本数据进行聚类分析的方法是
A、系统聚类
B、K-中心聚类
C、K-均值聚类
D、条件聚类

3.5 主成分与因子分析随堂测验

1、在SPSS中实现主成分分析的命令是在分析菜单中的哪个子菜单下?
A、“分析”-“降维”-“因子分析”
B、“分析”-“降维”-“对应分析”
C、“分析”-“降维”-“主成分分析”
D、“分析”-“分类”-“主成分分析”

2、在分析过程中,需要进行旋转的分析是()
A、因子分析
B、主成分分析
C、频率分析
D、交叉表分析

3、因子分析可以分为:
A、描述性因子分析
B、探索性因子分析
C、确定性因子分析
D、研究性因子分析

4、主成分分析的主要用途有哪些?
A、主成分回归
B、主成分归类
C、主成分评价
D、成分相关

5、主成分分析实质上是线性变换,无假设检验

6、因子分析是统计模型,无假设检验

高级数据分析方法单元测验

1、在假设检验中,如果没有特殊要求,显著性水平α最常使用哪个值
A、0
B、1
C、0.001
D、0.05

2、反映变量间关联程度的参数,r为-1~1,r>0时表示变量间?
A、负相关
B、零相关
C、正相关
D、不确定

3、反映变量间关联程度的参数,r为-1~1,r<0时表示变量间?
A、正相关
B、负相关
C、零相关
D、不确定

4、聚类分析的目的是()
A、抽样
B、降维
C、描述
D、检验

5、当对样本分类还不清楚的时候,要先使用哪种分析进行分类?
A、判别分析
B、因子分析
C、聚类分析
D、主成分分析

6、根据聚类方法的不同,聚类可以分为哪几种?
A、系统聚类法
B、删除法
C、分类法
D、分开法

7、在针对连续变量的统计推断方法中,最常用的有T检验和 ()
A、方差分析
B、频率分析
C、探索分析
D、相关分析

8、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间?
A、无关
B、有显著差异
C、无显著差异
D、不知道

9、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中正确的是()
A、较高的男子趋于较重
B、身高与体重存在低度正相关
C、体重较重的男子趋于较矮
D、45%的较高的男子趋于较重

10、下面哪一个不是回归分析要解决的问题()。
A、从一组样本数据出发,确定变量之间的数学关系式
B、对数学关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的
C、利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值
D、度量两个变量之间的关系强度

11、在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称为()。
A、自变量
B、因变量
C、随机变量
D、非随机变量

12、适合对大样本数据进行聚类分析的方法是
A、系统聚类
B、K-中心聚类
C、K-均值聚类
D、条件聚类

13、根据聚类的对象不同,聚类可以分为()和()
A、样品聚类
B、Q-型聚类
C、变量聚类
D、R-型聚类

14、方差分析的应用条件是?
A、数据独立
B、正态分布
C、样本配对
D、方差齐性

15、在针对连续变量的统计推断方法中,最常用的方法有哪些?
A、方差分析
B、频率分析
C、相关分析
D、T检验

16、下面的陈述哪个是正确的?
A、相关系数是度量两个变量之间线性关系强度的统计量
B、相关系数是一个随机变量
C、相关系数的绝对值不会大于1
D、相关系数不会取负值

17、两个随机变量X、Y之间呈线性趋势的关系,即指()
A、两变量无关
B、两变量共同减小
C、两变量共同增大
D、一增一减

18、常用的聚类统计量有?
A、欧氏距离
B、绝对值距离
C、Pearson相关系数
D、Pearson列联系数

19、因子分析可以分为()
A、描述性因子分析
B、探索性因子分析
C、确定性因子分析
D、研究性因子分析

20、主成分分析的主要任务有()
A、确定主成分个数
B、计算平均值
C、计算主成分
D、计算因子个数

21、下面关于相关系数的陈述中哪个是不正确的?
A、相关系数不会取负值
B、仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系
C、只是两个变量之间线性关系的一个度量,不一定意味着有两个变量之间一定有因果关系
D、绝对值会大于1

22、协方差分析中的“模型”对话框中含有哪两种指定类型?
A、因子
B、全因子
C、对比
D、设定

23、配对样本T检验的前提是?
A、样本独立
B、正态分布
C、样本配对
D、方差齐性

24、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间有显著差异。

25、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间无显著差异。

26、主成分分析实质上是线性变换,无假设检验

27、因子分析是统计模型,无假设检验

28、相关系数不会取负值

29、相关系数是度量两个变量之间线性关系强度的统计量。

30、为研究A、B两种降压药对高血压病人的降压效果,将受试对象随机分为两组,分别接受A、B降压药治疗2个月后,测量患者收缩压;对数据进行协方差分析后结果显示治疗前血压因素的F=6.463,P=0.017,这说明治疗前血压对治疗后的血压没有影响。

31、偏相关分析是在排除了其他因素的影响后,考察两个因素间的关联程度。 (判断题)

32、针对连续变量的统计推断方法中,最常用的有T检验和 ()。

33、T检验中最简单的一种分析过程是( )。

高级数据分析

1、1. 数据文件为“护士工作满意度调查”。 为了了解护士们对工作的满意程度,做了一个调查。数据文件中包含了100名护士对工作、工资和升职机会的满意程度。这三个方面的评分都是从0到l00,分值越大表明满意程度越高。另外,调查数据还根据该护士所在的医院类型,分为3类:私人医院、公立医院和学院医院。要检验不同类型的医院(私人医院、公立医院和学院医院)在工资满意程度上是否存在显著差异(显著性水平:0.05)。 解答过程 1) 写出零假设和备选假设 2)将 分析结果截图 3)根据分析结果填写下表 医院 人数 均值 方差齐性检验的p值 F值 检验P值 私人医院 公立医院 学院医院 4)写出分析结论 备注:在附件中提供了两种类型的数据文件供大家选择,数据是一样的,大家根据自己的需要进行选择。

2、为了确定广告费与销售额的关系,其数据如图所示。 (1) 请根据数据求广告费对销售额的回归方程; (2) 当广告费为35万元时,销售额大约会是多少?

04 数据展现和综合案例

4.1 统计图制作随堂测验

1、对于大批量的数据,最适合描述其分布的图形是
A、条形图
B、茎叶图
C、直方图
D、饼图

2、为描述身高与体重之间是否有某种关系,适合采用的图形是
A、条形图
B、对比条形图
C、散点图
D、箱线图

3、下面的图形中最适合描述一组数据分布的图形是
A、条形图
B、箱线图
C、直方图
D、饼图

4.2 报告的撰写随堂测验

1、根据报告的主要目的和读者对象,可以将报告分为什么类型
A、综合性报告和专题性报告
B、应用性报告和学术性报告
C、应用性报告和综合性报告
D、描述性报告和解释性报告

2、读者对象主要是专业研究人员的报告是
A、综合性报告
B、专题性报告
C、应用性报告
D、解释性报告

3、以下哪个不是报告的主要组成部分
A、导言
B、主题
C、结尾
D、问卷

4、从功能上看,专题性报告更多地属于
A、描述性
B、专业性
C、学术性
D、解释性

5、以下哪些是报告中常用的标题的形式?
A、陈述式标题
B、结论式标题
C、问题式标题
D、双标题式标题

6、以下哪些是报告中常用的导言的形式?
A、双标题式
B、提问设悬式
C、给出结论式
D、陈述式

7、专题性报告是指围绕某一特定问题或某一现象的某些侧面而撰写的报告。

8、发表在非专业报刊上的报告经常采用的标题形式是[ ]

第4单元测验

1、对于大批量的数据,最适合描述其分布的图形是:
A、条形图
B、茎叶图
C、直方图
D、饼图

2、下面的图形中最适合描述一组数据分布的图形是:
A、条形图
B、箱线图
C、直方图
D、饼图

3、为描述身高与体重之间是否有某种关系,适合采用的图形是:
A、条形图
B、对比条形图
C、散点图
D、箱线图

4、根据报告的主要目的和读者对象,可以将报告分为什么类型?
A、综合性报告和专题性报告
B、应用性报告和学术性报告
C、应用性报告和综合性报告
D、描述性报告和解释性报告

5、根据报告的主要功能,可以将报告分为什么类型?
A、综合性报告和专题性报告
B、应用性报告和学术性报告
C、应用性报告和综合性报告
D、描述性报告和解释性报告

6、根据报告的主题范围,可以将报告分为什么类型?
A、综合性报告和专题性报告
B、应用性报告和学术性报告
C、应用性报告和综合性报告
D、描述性报告和解释性报告

7、以下哪个不是报告的主要组成部分:
A、导言
B、主题
C、结尾
D、问卷

8、发表在非专业报刊上的报告经常采用的标题形式是下面哪种?
A、陈述式标题
B、结论式标题
C、问题式标题
D、提问式标题

9、从功能上看,专题性报告更多地属于:
A、描述性
B、专业性
C、学术性
D、解释性

10、读者对象主要是专业研究人员的报告是:
A、综合性报告
B、专题性报告
C、应用性报告
D、解释性报告

11、对于时间序列数据,用于描述其变化趋势的图形通常是:
A、条形图
B、直方图
C、箱线图
D、线图

12、利用相关和回归的方法对投资组合SL收益率序列和市场收益率RM序列进行分析后,得到Sig值是0,那么可以说明SL和RM是:
A、不确定
B、非常相关的
C、不相关的
D、相反的

13、利用因子分析方法对男子十项全能的数据进行分析,在分析结果中发现前4个成份解释了所有变量的79.76%,且特征值均大于1,表示在本实例中只需要提取几个公共因子?
A、10
B、1
C、3
D、4

14、撰写报告的基本要求有哪些?
A、观点与材料统一
B、内容与形式统一
C、结构与数据统一
D、整体结构完整性与内容陈述条理性统一

15、以下哪些是报告中常用的标题的形式?
A、陈述式标题
B、结论式标题
C、问题式标题
D、双标题式标题

16、以下哪些是报告中常用的主体结构形式?
A、陈述式
B、纵向结构式
C、纵横结构式
D、横向结构式

17、以下哪些是报告中常用的导言的形式?
A、双标题式
B、提问设悬式
C、给出结论式
D、陈述式

18、以下哪个是报告的主要组成部分:
A、导言
B、主题
C、结尾
D、问卷

19、为描述身高与体重之间是否有某种关系,不适合采用的图形是
A、散点图
B、箱线图
C、条形图
D、对比条形图

20、下面哪个图形适合描述分类数据
A、条形图
B、饼图
C、帕累托图
D、茎叶图

21、在体育运动中的应用这个案例中,从探索性到深入性分析了男子十项全能的比赛成绩,分析男子十项全能运动员各运动能力上的相关性和优越性。请问都用到了下面哪个数据分析方法?
A、描述统计分析
B、相关分析
C、聚类分析
D、因子分析

22、根据报告的主要目的和读者对象,可以将报告分为什么类型?
A、应用性报告
B、综合性报告
C、学术性报告
D、专题性报告

23、根据报告的主要功能,可以将报告分为什么类型?
A、应用性报告
B、描述性报告
C、解释性报告
D、学术性报告

24、根据报告的主题范围,可以将报告分为什么类型?
A、综合性报告
B、应用性报告
C、学术性报告
D、专题性报告

25、专题性报告是指围绕某一特定问题或某一现象的某些侧面而撰写的报告。

26、我国农业注定要继续快速发展,所以农业统计分析这一领域注定要引起人们更多的思考和关注。这种背景下,对农业统计的相关问题进行定性研究分析有着不同寻常的意义。

27、利用相关和回归的方法对投资组合SL收益率序列和市场收益率RM序列进行分析后,得到Sig值是0,那么可以说明SL和RM是非常相关的。

28、利用因子分析方法对男子十项全能的数据进行分析,在分析结果中发现前4个成份解释了所有变量的79.76%,且特征值均大于1,表示在本实例中只需要提取前4个公共因子即可。

29、利用相关和回归的方法对投资组合SL收益率序列和市场收益率RM序列进行分析后,得到Sig值是0,那么可以说明SL和RM是不相关的。

30、概况性报告又称为[ ]

31、发表在非专业报刊上的报告经常采用的标题形式是[ ]

期末测验

期末测验

1、一组数据中出现频数最多的变量值称为()
A、众数
B、中位数
C、四分位数
D、平均数

2、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的中位数为( )
A、28.46
B、30.20
C、27.95
D、28.12

3、下面哪个是SPSS的数据文件类型?
A、.xls
B、.sav
C、.spv
D、.sps

4、在分析过程中,需要进行旋转的分析是()
A、因子分析
B、主成分分析
C、频率分析
D、交叉表分析

5、在假设检验中,如果没有特殊要求,显著性水平α最常使用哪个值?
A、1
B、0
C、0.05
D、0.001

6、某部门对当前市场的鸡蛋价格情况进行调查,抽查了全省20个集市上的售价,得到均值是3.399元/500克。已知往年的平均售价一直稳定在3.25元/500克左右,如果想要对抽查的数据进行单样本T检验(显著性水平取0.05),看看当前的鸡蛋售价是否明显高于往年,那么检验值应该取哪个数?
A、500
B、3.399
C、3.25
D、0.05

7、某汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到相应的排放数据,发现抽查样本的均值为21.13。对抽查的数据进行单样本T检验(检验值是20)后,得到双侧的Sig值是0.249。究竞能否由此认为该指标均值超过20?
A、抽查结果表明该指标均值没有超过20个单位
B、抽查结果表明该指标均值有超过20个单位
C、抽查结果表明该指标均值有超过21个单位
D、不一定

8、对某银行的所有雇员进行了调查,发现男性平均年薪是41万多,女性平均年薪是26万多,进一步对调查的数据进行独立样本T检验后得到双侧Sig值是0,那么是否可以断定这家银行的平均年薪男性与女性有明显差异?
A、这家银行的平均年薪男性与女性没有明显差异
B、这家银行的平均年薪男性与女性有明显差异
C、这家银行的平均年薪男性与女性看不出明显差异
D、这家银行的平均年薪男性与女性不一定有明显差异

9、在假设检验中,原假设和备择假设?
A、都有可能成立
B、都有可能不成立
C、只有一个成立而且必有一个成立
D、原假设一定成立,备择假设不一定成立

10、利用因子分析方法对男子十项全能的数据进行分析,在分析结果中发现前4个成份解释了所有变量的79.76%,且特征值均大于1,表示在本实例中只需要提取几个公共因子?
A、10
B、1
C、4
D、3

11、对于大批量的数据,最适合描述其分布的图形是?
A、条形图
B、茎叶图
C、直方图
D、饼图

12、为描述身高与体重之间是否有某种关系,适合采用的图形是?
A、条形图
B、对比条形图
C、散点图
D、箱线图

13、一种零件的标准长度5cm,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设应为( )
A、原假设:μ=5, 备选假设:μ≠5;
B、原假设:μ≠5, 备选假设:μ=5
C、原假设:μ≤5, 备选假设:μ>5
D、原假设:μ≥5, 备选假设:μ<5

14、具有相关关系的两个变量的特点是()。
A、一个变量的取值不能由另一个变量唯一确定;
B、一个变量的取值由另一个变量唯一确定;
C、一个变量的取值增大时,另一个变量的取值也一定增大;
D、一个变量的取值增大时,另一个变量的取值肯定变小

15、下面的各问题中,哪个不是相关分析要解决的问题?
A、判断变量之间是否存在关系
B、判断一个变量数值的变化对另一个变量的影响
C、描述变量之间的强度
D、判断样本所反映的变量之间的关系能否代表总体变量之间的关系

16、根据你的判断,下面的相关系数取值哪一个是错误的?
A、-0.86
B、0.78
C、1.25
D、0

17、在Excel中可以用哪个功能很好的实现交叉分析?
A、数据排序
B、删除重复项
C、数据分析
D、数据透视表

18、下列对于缺失值的处理方式中,不正确的是?
A、删除缺失值
B、忽略缺失值
C、利用回归模型填充
D、利用EM模型填充

19、按数据缺失形式分,缺失值分析的类别有()
A、完全随机缺失
B、单元缺失
C、随机缺失
D、非随机缺失

20、收集了五名中学生的体重(kg)数据,分别是:57,58.5,51,58,55请问数据的标准差是?
A、3.05
B、8.37
C、9.69
D、4.56

21、在交叉表分析主对话框中,启用哪个复选框,就会在结果中输出每个变量不同取值情况下的复式条形图?
A、条形图
B、取消表格
C、观察值
D、复式条形图

22、在交叉表分析主对话框中,启用哪个复选框,在结果中将不输出交叉列联表的表格?
A、条形图
B、取消表格
C、观察值
D、复式条形图

23、在进行SPSS数据个案拆分时,有哪几种指定的拆分方式?
A、分析部分个案
B、分析所有个案,不创建组
C、比较组
D、按组组织输出

24、SPSS创建的文件类型主要包括哪几种类型?
A、数据文件
B、语法文件
C、输出文件
D、脚本文件

25、缺失值的处理方式有哪几种?
A、忽略缺失值
B、删除缺失值
C、缺失值替代
D、缺失值分析

26、聚类分析的实质是将性质相近的( )聚在一起。
A、实物
B、样品
C、变量
D、系统

27、适合对大样本数据进行聚类分析的方法是?
A、系统聚类
B、K-中心聚类
C、K-均值聚类
D、条件聚类

28、主成分分析的主要任务有哪些?
A、确定主成分个数
B、计算平均值
C、计算主成分
D、计算因子个数

29、方差分析的应用条件是?
A、数据独立
B、正态分布
C、样本配对
D、方差齐性

30、以下哪些是报告中常用的标题的形式?
A、陈述式标题
B、结论式标题
C、问题式标题
D、双标题式标题

31、以下统计量中哪几个是离散趋势统计量?
A、标准差
B、最大值
C、最小值
D、方差

32、在下面的假定中,哪一个是属于方差分析中的假定?
A、每个总体都服从正态分布;
B、各总体的方差相等;
C、观测值是独立的;
D、各总体的方差等于0

33、以下哪个是报告的主要组成部分:
A、导言
B、主题
C、结尾
D、问卷

34、为描述身高与体重之间是否有某种关系,不适合采用的图形是?
A、散点图
B、条形图
C、对比条形图
D、直方图

35、数据透视表是一种什么样的报表。
A、交互的
B、Excel
C、独立的
D、排斥的

36、绘制交叉图表的时候最好选择哪种图形?
A、散点图
B、百分比堆积柱形图
C、三维百分比堆积柱形图
D、折线图

37、请判断这个说法是否正确:在交叉表分析结果中的“卡方检验”表中,如果渐进Sig值为0,那么表示两变量之间存在显著性相关。

38、在假设检验中,如果p值大于显著性水平α,就认为总体均值与检验值之间无显著差异。

39、我国农业注定要继续快速发展,所以农业统计分析这一领域注定要引起人们更多的思考和关注。这种背景下,对农业统计的相关问题进行定性研究分析有着不同寻常的意义。

40、相关系数数值越大说明两个变量之间的关系就越强。

41、相关系数只是两个变量之间线性关系的一个度量,不一定意味着有两个变量之间一定有因果关系。

42、相关系数不会取负值。

43、频率分析与描述性分析的主要作用是基本一样的。

44、EM模型的缺失值填充效果比回归模型的填充效果要好。此种说法对还是不对?

45、SPSS描述性分析中可以直接绘制条形图。

46、在合并数据文件之前,所有需要合并的数据文件必须预先按照[ ]进行升序排列。 否则,合并文件程序将失败。

47、针对连续变量的统计推断方法中,最常用的有T检验和[ ]

48、[ ]是同时将两个以上具有一定联系的变量及变量值,按照一定的顺序交叉排列在同一张统计表中,进而便于分析变量之间的相互性。

49、SPSS 的数据文件的扩展名是[ ]

50、SPSS视图窗口包括数据视图和[ ]。

51、SPSS界面提供了五个窗口,分别是[ ]、结果管理窗口、语法编辑窗口、脚本窗口和结果编辑窗口。

学习通数据分析技术_1

数据分析技术是当今社会中极为重要的技术之一,它可以帮助我们从大量数据中找出有用的信息,更好地服务于我们的生活和工作。

学习通数据分析技术课程介绍

学习通数据分析技术课程是由华中科技大学引智基地提供的一门课程,主要介绍了数据分析的基本概念、常用技术和工具等内容,是入门数据分析的不二选择。

课程内容

1、数据分析的概述
2、R语言环境的安装
3、R语言基本语法
4、R语言中的统计分析
5、数据可视化
6、机器学习基础

学习体验

学习通数据分析技术课程采用了线上课堂和线下实践相结合的授课方式,学生们可以通过学习平台上的视频、幻灯片和案例来深入学习数据分析相关知识,同时还有老师的在线答疑和班主任的学习跟进,保证学生掌握数据分析技术的实战能力。

课程收获

1、学习了数据分析的基本概念和工具;
2、掌握了R语言的基本语法和常见数据分析方法;
3、学会了数据可视化的方法和工具,可以更好地展现数据;
4、了解了机器学习的基础知识和应用场景,为以后的深入学习做好铺垫。

结语

学习通数据分析技术课程为我们打开了数据分析技术的大门,让我们能够更好地理解数据、分析数据、应用数据,为生活和工作带来更多的便利。学习通数据分析技术课程是一门基础入门课程,为我们后续深入学习提供了坚实的基础。

学习通数据分析技术_1

数据分析技术是当今社会中极为重要的技术之一,它可以帮助我们从大量数据中找出有用的信息,更好地服务于我们的生活和工作。

学习通数据分析技术课程介绍

学习通数据分析技术课程是由华中科技大学引智基地提供的一门课程,主要介绍了数据分析的基本概念、常用技术和工具等内容,是入门数据分析的不二选择。

课程内容

1、数据分析的概述
2、R语言环境的安装
3、R语言基本语法
4、R语言中的统计分析
5、数据可视化
6、机器学习基础

学习体验

学习通数据分析技术课程采用了线上课堂和线下实践相结合的授课方式,学生们可以通过学习平台上的视频、幻灯片和案例来深入学习数据分析相关知识,同时还有老师的在线答疑和班主任的学习跟进,保证学生掌握数据分析技术的实战能力。

课程收获

1、学习了数据分析的基本概念和工具;
2、掌握了R语言的基本语法和常见数据分析方法;
3、学会了数据可视化的方法和工具,可以更好地展现数据;
4、了解了机器学习的基础知识和应用场景,为以后的深入学习做好铺垫。

结语

学习通数据分析技术课程为我们打开了数据分析技术的大门,让我们能够更好地理解数据、分析数据、应用数据,为生活和工作带来更多的便利。学习通数据分析技术课程是一门基础入门课程,为我们后续深入学习提供了坚实的基础。

文章版权及转载声明

本文地址:http://www.zzxhsh.org/92d799377.html发布于 2024-05-19 11:01:57
文章转载或复制请以超链接形式并注明出处五煦查题

评论列表 (暂无评论,44人围观)参与讨论