尔雅大数据导论_1期末答案(学习通2023题目答案)

中考答案2024-05-19 05:49:2732811抢沙发
尔雅大数据导论_1期末答案(学习通2023题目答案)摘要: 第一章 绪论第一章单元测试1、以下哪种技术对大数据技术的发展起了基础支撑作用?A、数据库技术B、云计算技术C、物联网技术D、信息安全技术2、大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4 ...

尔雅大数据导论_1期末答案(学习通2023题目答案)

第一章 绪论

第一章单元测试

1、尔雅以下哪种技术对大数据技术的大数答案发展起了基础支撑作用?
A、数据库技术
B、据导云计算技术
C、论期物联网技术
D、末答信息安全技术

2、案学大数据的习通特征可以用被总结为4V特征,以下哪个不属于大数据的题目4V特征
A、体量大(Volume)
B、尔雅速度快(Velocity)
C、大数答案种类多(Variety)
D、据导Venture(风险大)

3、论期微软研究院所提出的末答科学研究的第四种范式是指:
A、实验
B、案学理论分析
C、习通计算
D、数据密集型科学发现(Data Intensive Science Discovery)

4、在大数据时代,我们将有三个重大思维的转变,要相关,________;要全体,不要抽样;要效率,允许不精确。

5、2015年9月,国务院印发《_____________________________》系统部署大数据发展工作,指出了其必要性。

6、以下是关于大数据价值的描述,请填空: 大数据可以帮助发现规律,大数据可以帮助________现象,大数据可以帮助预测未来。

作业1

1、请举一个具体的身边的事例,从大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)出发,说明其大数据的应用场景,并且分析该方面的大数据应用能给我们带来什么。

第二章 大数据相关技术基础

测验

1、我们通常听某同学讲:“我在阿里云上租了一个服务器”,那么这个服务器是属于云计算的那种应用场景()
A、IAAS
B、SAAS
C、PAAS
D、以上都不是

2、在野外部署有许多传感器,用于实时采集空气质量数据,当数据传回数据中心后,在存储之前需要进行数据的预处理操作,那么如下哪些操作部署于数据预处理所采用的方法()。
A、数据变换
B、数据不一致性检测
C、缺失数据填充
D、以上都是

3、数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的()
A、经常修改数据项的值
B、数据大都反应历史
C、面向特定主题
D、数据来源多样

4、为了描述数据的统计学特征,我们常用的统计学指标有()
A、均值
B、方差
C、中位数
D、分位数

5、大数据的发展需要大规模物理资源、计算资源的支持,以及高效的调度管理,所以从某种程度上讲,云计算的发展促进了大数据的发展和应用。

作业2

1、请分析相对于传统统计学而言,大数据时代在思维方式上的主要变化

作业3

1、大数据技术可以分为哪几种类型?

第三章 数据采集与预处理

测试

1、对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()
A、1
B、2
C、4
D、1.8

2、半结构化数据包括()
A、HTML文档
B、Excel表格
C、检查身体后得到的体检报告
D、银行账户上的消费记录

3、大数据的来源途径有许多,如下哪些属于大数据来源()
A、传感器设备采集的数据
B、人在微博上发表的记录
C、计算机网络运行产生的日志
D、网络爬虫得到的数据

4、所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1

5、数据的平滑操作,其目的在于消除数据波动产生的噪声。

作业

1、Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。 假设两个班级考试,所采用的试卷不同:A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。那么利用Z-Score计算它们的标准分数,看看谁更优秀。

第四章 Hadoop架构和大数据存储简介

单元测验:hadoop简介

1、那些不是大数据的特点
A、数据量在MB,GB级别
B、可以处理结构化、半结构化数据
C、采用的数据模型为平面模型
D、数据的内部关系相对松散

2、大数据的容量不断增长,也就要求有更加复杂的数据管理方法,为此,如下哪项不是大数据存储面临的挑战()
A、低成本
B、易扩展
C、易于使用
D、简单的数据模型

3、假设有一个公司,分别在北京和上海都设置了一个存储中心,这两个中心分别主要服务于北方和南方的存储需求,那么这两个存储中心的布局是属于()分布式存储模式。
A、集群存储
B、P2P存储
C、云存储
D、以上都是错误的

4、如下不是分布式文件系统的是()
A、FAT
B、NFS
C、GFS
D、HDFS

5、有关大数据的处理可以分为多种模式,若我们想要对传感器网络实时采集的数据存储前做一定的预处理,那么选择哪种方法更合适()
A、离线批处理方式
B、实时交互方式
C、流计算
D、批处理

6、Hadoop2.0中最基础的两个组件是()
A、HDFS,YARN
B、YARN,PIG
C、MapReduce,YARN
D、Tez,HDFS

单元测验:HDFS

1、HDFS存储的特点中,错误的是()
A、只能有一个NameNode
B、提供了统一的访问接口
C、实现了数据的冗余存储
D、分块存储增强了数据访问的并行性

2、利用客户端进行HDFS的数据读取时,有关叙述正确的是()
A、客户端需要详细了解HDFS的文件组织结构
B、在访问前需要了解具体文件是存储在哪个DataNode上
C、读取文件数据时,其读取的数据需来自于一个DataNode,以避免数据的不一致性
D、编程接口提供了隔离性,让用户无需深入了解HDFS便可以进行文件数据读写

3、HDFS的nameNode中,存储的有关核心数据包括()
A、文件系统树
B、所有数据备份
C、文件操作日志
D、注册表

第七章 大数据可视化

单元测试1

1、以下说法错误的是( )
A、数据集中每个数据项作为单个图元素表示。
B、数据可视化技术提供多种数据分析和图形化方法。
C、数据可视化可以帮助决策者更直观的观察和分析数据
D、多维数据无法进行数据可视化

2、以下不属于数据可视化图形的是( )
A、约翰斯诺的标点地图
B、南丁格尔的玫瑰图
C、普通的世界地图
D、百度迁徙图

3、力导向图能表是节点之间多对多的关系,是属于( )
A、文本可视化
B、网络数据可视化
C、时空数据可视化
D、高维数据可视化

4、数据可视化映射的视觉标记是指:______映射为点、线或形状;关系映射为连接和包含。

5、标签云(Tag Cloud)是属于_____可视化中的一种。

单元测试2

1、以下不属于高维数据可视化类别的是( )
A、河流图
B、散点图矩阵
C、平行坐标图
D、降维投影图

2、以下哪种可视化工具是来自百度的开源工具?( )
A、Spreadsheets
B、Tableau
C、BPD
D、Echarts

3、数据可视化是通过_____手段,清晰有效地传达与沟通信息。实现对稀疏又复杂的数据集的深入洞察。

4、( )图矩阵SPLOM展示数据集中各个维度的两两之间的关系

5、数据( )表是Excel的交互式报表,可快速合并、计算和排序数据,它还可以设置为动态地改变版面布置。

第八章 大数据的应用

单元测试1

1、( )包含有智慧城市和智能交通等的大数据框架。
A、社会网络大数据
B、城市大数据
C、商业大数据
D、教育大数据

2、基于用户搜索行为、浏览行为、评论历史和个人资料等,进行针对性的产品生产、改进和营销,属于( )
A、股票市场预测
B、用户类型识别
C、市场预测
D、用户行为预测

3、推荐系统是由( )三部分组成。
A、收集、分析和推荐
B、推荐、合成和数据
C、分析、可视化和结论
D、收集、合成和分析

4、新闻网一般采用基于用户的( )算法(UserCF算法),给目标客户推荐其他有相同或相似兴趣爱好的人关注的新闻,推荐结果有一定的新颖性。

5、根据用户的历史行为推荐相似物品比如电影网、音乐网,更注重个性,通常采用基于( )的协同过滤(ItemCF算法)。

单元测试2

1、协同过滤不包含( )。
A、基于用户的协同过滤
B、基于物品的协同过滤
C、基于关联规则的推荐
D、隐语义模型

2、以下不属于城市大数据特点的是( )。
A、结构化数据
B、时空多维性
C、多尺度多粒度
D、多元异构

3、( )系统通过用户与信息产品之间的二元关系,利用相似性关系挖掘信息,进行个性化推荐,其本质就是信息过滤。

4、城市大数据的数据主要包括为( )数据和公共服务数据。

5、城市大数据的特点包括:多尺度多精度、时空( )性、多元异构等。

学习通大数据导论_1

随着互联网的发展,大数据成为了不可忽视的话题。在各行各业中,大数据的应用越来越广泛。因此,学习大数据成为了许多人的追求。而学习通大数据导论_1,则是大数据学习的入门课程之一。

一、课程概述

学习通大数据导论_1共分为7个模块,分别是:

  • 大数据概述
  • 大数据技术体系
  • 大数据应用场景
  • 大数据产业生态
  • 大数据发展趋势
  • 大数据的挑战
  • 大数据学习方法论

二、课程内容

1. 大数据概述

在这个模块中,我们了解到了大数据的概念和特点。大数据的概念是指数据量巨大、类型多样、处理速度快的数据,它主要包括结构化数据、半结构化数据和非结构化数据。大数据的特点有三个,即三V:Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)。

2. 大数据技术体系

大数据技术体系主要包括数据存储技术、数据处理技术和数据分析技术。数据存储技术包括关系型数据库、NoSQL数据库和分布式文件系统等。数据处理技术包括Hadoop和Spark等。数据分析技术包括数据挖掘、机器学习和深度学习等。

3. 大数据应用场景

大数据的应用场景非常广泛,包括电商、物流、金融、医疗和智能制造等。其中,电商行业是大数据应用最为广泛的行业之一。通过大数据技术,可以对用户的购买行为、浏览记录和偏好等进行分析,从而为电商企业提供更好的服务和推荐。

4. 大数据产业生态

大数据产业生态包括硬件、软件、服务和应用等方面。其中,硬件主要包括存储设备和计算设备。软件则是大数据技术体系的核心,包括关系型数据库、NoSQL数据库、Hadoop、Spark等。服务则提供了大数据技术的实施和应用支持。应用则是大数据技术的最终落地。

5. 大数据发展趋势

大数据的发展趋势主要包括三个方面,即智能化、生态化和行业化。智能化是指大数据技术在人工智能领域的应用。生态化是指大数据技术产业链的完善和发展。行业化是指大数据技术在不同行业中的应用和落地。

6. 大数据的挑战

大数据的挑战主要包括数据质量问题、数据安全问题和数据隐私问题。数据质量问题包括数据准确性、完整性和一致性等。数据安全问题包括数据的保密性、完整性和可用性等。数据隐私问题则是指个人隐私数据的保护。

7. 大数据学习方法论

在大数据学习中,方法论非常重要。我们需要掌握一些学习方法和技巧,从而让学习更加高效。比如,我们可以通过制定学习计划、刻意练习和分享学习成果等方式来提高学习效果。

三、课程评价

学习通大数据导论_1是一门非常好的课程。通过这门课程,我们可以全面了解大数据领域的基本概念、技术、产业生态和发展趋势等方面。同时,课程内容简单易懂,适合初学者学习。但是,课程内容相对单一,只覆盖了大数据的基础知识,对于想要深入研究大数据领域的同学来说可能需要选择更加专业的课程。

综上所述,学习通大数据导论_1是一门值得推荐的课程。它为初学者提供了一个系统的学习路径,帮助学习者快速入门大数据领域。

文章版权及转载声明

本文地址:http://www.zzxhsh.org/79d799855.html发布于 2024-05-19 05:49:27
文章转载或复制请以超链接形式并注明出处五煦查题

评论列表 (暂无评论,44人围观)参与讨论