中国大学Hadoop大数据平台搭建与使用期末答案(mooc完整答案)

中国大学Hadoop大数据平台搭建与使用期末答案(mooc完整答案)

2.3【课前摸底】

1、中国整答【单选题】大数据具有的大学大数四个典型特征是
A、大量、据平建使多样、台搭低速和价值
B、用期大量、末答多样、案m案高速和价值
C、中国整答小量、大学大数多样、据平建使高速和价值
D、台搭大量、用期单一、末答高速和价值

2、案m案【单选题】以下数据单位转换正确的中国整答是
A、1TB=1024GB
B、1GB=1024TB
C、1PB=1024GB
D、1GB=1024PB

3、【单选题】以下有关大数据的描述错误的是
A、大数据指的是巨量数据
B、大数据具有价值密度低的特征
C、大数据的战略意义仅在于掌握庞大的数据
D、大数据产业的盈利关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”

4、【单选题】以下哪一项不属于研究大数据的意义
A、如何利用大规模数据,发掘其潜在价值,是赢得核心竞争力的关键
B、研究大数据最重要的意义是预测
C、大数据的潜在价值和增在速度正在改变着人类的工作、生活和思维方式
D、目前各个国家的大数据处理技术已相当成熟

5、【单选题】以下哪一个场景没有用到大数据技术
A、花旗银行利用IBM沃森电脑为财富管理客户推荐产品
B、蛋糕店根据顾客历史消费记录及其他相关因素,生产销售产品
C、通信公司根据用户历史通话行为识别是否为骚扰电话
D、超市导购员给消费者推销商品

3.3【前课测试】

1、【单选题】Hadoop的创始人是
A、Martin Fowler
B、Doug cutting
C、Martin Elliiot Zuckerberg
D、Kent Beck

2、【单选题】目前Apache Hadoop发布的版本有
A、Hadoop 1.x版本
B、Hadoop 2.x版本
C、Hadoop 3.0.0版本
D、以上都是

3、【单选题】Hadoop生态系统中,用于分布式计算中数据存储的是
A、HDFS
B、MapReduce
C、YARN
D、Sqoop

4、【单选题】Hadoop2.x版本与Hadoop1.x版本相比,新增了哪个模块
A、HDFS
B、MapReduce
C、YARN
D、NameNode

5、【单选题】HDFS中具体存放数据的是
A、NameNode
B、Secondary NameNode
C、DataNode
D、JobTracker

4.3【前课测试】

1、【单选题】当输入ifconfig命令后,只显示了lo没有显示eth0,如下图所示,可以输入以下哪个命令启动eth0?
A、ifup eth0
B、upif eth0
C、start eth0
D、eth0 start

2、【单选题】在安装JDK时,将JDK的安装包上传到/aa/bb目录下,然后将其解压缩到/aa/cc目录下,并重命名为DD,请问这里的JDK安装路径是什么?
A、/aa/bb/DD
B、/aa/cc/JDK
C、/aa/bb/JDK
D、/aa/cc/DD

3、【单选题】对文件进行重命名命令是哪一个?
A、cd
B、vi
C、mv
D、rm

4、【单选题】配置JDK环境变量时,需要对哪个文件进行修改?
A、profile
B、hdfs-site.xml
C、hadoop-env.sh
D、core-site.xml

5、【单选题】在Hadoop安装目录下,若使用start-dfs.sh一键启动命令无法将全部进程启动,可以单独启动每个进程,下面选项中哪个是单独启动namenode进程命令?
A、start hadoop-daemon.sh namenode
B、start namenode hadoop-daemon.sh
C、hadoop-daemon.sh namenode start
D、hadoop-daemon.sh start namenode

5.3【前课测试】

1、【单选题】Hadoop集群的以下哪种模式使用的是本地文件系统?
A、独立模式或单机模式
B、伪分布式模式
C、完全分布式模式
D、以上都不是

2、【单选题】以下对Hadoop安装目录描述有误的是
A、bin:存放操作Hadoop相关服务(HDFS、YARN)的脚本
B、etc:Hadoop各个模块编译后的jar包所在的目录
C、lib:该目录包含了Hadoop对外提供的编程动态库和静态库,与include目录中的头文件结合使用
D、sbin:该目录存放了Hadoop管理脚本, 主要包含HDFS和YARN中各类服务的启动/关闭脚本

3、【单选题】以下对Hadoop主要配置文件描述正确的是
A、core-site.xml:Hadoop核心全局配置文件,可在其他配置文件中引用该文件
B、hdfs-site.xml:HDFS配置文件,继承core-site.xml配置文件
C、mapred-site.xml:MapReduce配置文件,继承core-site.xml配置文件
D、以上都正确

4、【单选题】在以下哪个配置文件中可以修改数据块的副本数量
A、hdfs-site.xml
B、slaves
C、core-site.xml
D、hadoop-env.sh

5、【单选题】启动Hadoop集群,其实是要启动内部的哪两个集群框架
A、HDFS集群和YARN集群框架
B、HDFS集群和MapReduce集群框架
C、YARN集群和MapReduce集群框架
D、Hadoop集群和HDFS集群框架

6.3【前课测试】

1、【单选题】将Windows中的文件上传到HDFS目录下,共涉及到几个文件系统
A、1
B、2
C、3
D、4

2、【单选题】下面哪个命令可以用于创建目录/user/test
A、hdfs dfs -mkdir /user/test
B、hdfs dfs -get /user/test
C、hdfs dfs -cat /user/test
D、hdfs dfs -rmdir /user/test

3、【单选题】上传一个大小为216MB的文件a.txt到以Hadoop2.6搭建的集群上,这个文件会占用多少个HDFS文件块。
A、1
B、2
C、3
D、4

4、【单选题】下列哪个命令可以下载HDFS目录/user/root/live.txt
A、hdfs dfs -get /user/root/live.txt
B、hdfs dfs -download /user/root/live.txt
C、hdfs dfs -put /user/root/live.txt
D、hdfs dfs -move /user/root/live.txt

5、【单选题】hdfs dfs -moveFromLocal a.txt /user/test/b.txt 这行命令的作用是
A、将本地文件a.txt移动到HDFS的/user/test/下,并更名为b.txt;执行命令后本地文件将被删除
B、将本地文件a.txt移动到HDFS的/user/test/下,并更名为b.txt;执行命令后本地文件不会被删除
C、将HDFS下的a.txt文件移动到本地文件的/user/test/下,并更名为b.txt;执行命令后HDFS文件将被删除
D、将HDFS下的a.txt文件移动到本地文件的/user/test/下,并更名为b.txt;执行命令后HDFS文件不会被删除

7.3【前课测试】

1、【单选题】Zookeeper启动时会最多监听几个端口()
A、1
B、2
C、3
D、4

2、【单选题】下列哪些操作可以设置一个监听器Watcher()
A、getData
B、getChildren
C、exists
D、setData

3、【单选题】在装有ZooKeeper的机器的终端执行以下哪条命令,可以看当前节点的ZooKeeper是什么角色?
A、zookeeper-server status
B、zookeeper-server start
C、zookeeper-server stop
D、zookeeper-server standby

4、【单选题】ZooKeeper默认只有( )和( )两种角色,没有角色( )。
A、Leader,Observer,Follower
B、Observer,Follower,Leader
C、Observer,Leader,Follower
D、Leader,Follower, Observer

5、【单选题】下列关于zookeeper描述正确的是:()
A、无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的
B、从同一个客户端发起的事务请求,最终将会严格按照其发起顺序被应用到zookeeper中
C、在一个5个节点组成的Zookeeper集群中,如果同时有3台机器宕机,服务不受影响
D、如果客户端连接到Zookeeper集群中的那台机器突然宕机,客户端会自动切换连接到集群其他机器

8.3【前课测试】

1、【单选题】Hive是建立在()之上的一个数据仓库。
A、HDFS
B、MapReduce
C、Hadoop
D、HBase

2、【单选题】Hive查询语言和SQL的一个不同之处在于()操作。
A、Group by
B、Join
C、Partition
D、Union

3、【单选题】Hive最重视的性能是可测量性、延展性、()和对于输入格式的宽松匹配性
A、较低恢复性
B、容错性
C、快速查询
D、可处理大量数据

4、【单选题】以下选项中,哪种类型间的转换是被Hive查询语言所支持的()。
A、Double—Number
B、BigInt—Double
C、Int—BigInt
D、String—Double

5、【单选题】按粒度大小的顺序,Hive数据被分为:数据库、数据表、()、桶。
A、元组
B、栏
C、分区
D、行

9.3【前课测试】

1、【单选题】在${ FLUME_HOME}/bin 下运行 ./flume-ng agent -n a1 -c conf -f ../conf/spooldir.conf -Dflume.root.logger=INFO,console 其中:-n a1是( )
A、指定配置目录
B、指定agent的名字
C、执行agent具体的的配置文件
D、配置文件

2、【单选题】有一采集方案部分配置如下: a1.sources.r1.type = netcat a1.sources.r1.bind = hadoop001 a1.sources.r1.port = 44444 a1.channels.c1.type = memory 请问source监控的数据类型为( )
A、http
B、memory
C、spooldir
D、netcat

3、【单选题】Flume的三个核心组件是( )?
A、NameNode、DataNode、Secondary NameNode
B、Source、Channel、Sink
C、Leader、Flower、Link
D、import、outport、export

4、【单选题】以下Flume的哪个组件用于源数据的采集?
A、Source
B、Leader
C、NameNode
D、import

5、【单选题】在多级Agent传输收集数据时,需要先从哪一级的Flume机器上启动Flume?
A、第一级
B、第二级
C、中间一级
D、最后一级

学习通Hadoop大数据平台搭建与使用

Hadoop是一个Apache基金会下的开源软件项目,是一个分布式系统基础架构。Hadoop可以对大规模数据进行分布式存储和处理,其特点是可扩展性强、容错性高、成本低廉等。学习通Hadoop大数据平台搭建与使用,可以让我们更好地了解和掌握大数据处理的技术。

一、Hadoop大数据平台搭建

在学习Hadoop大数据平台之前,需要先进行Hadoop的安装和配置。具体步骤如下:

1. 环境配置

在进行Hadoop安装之前,需要先安装Java和SSH服务。在安装Java时,需要注意Java的版本和Hadoop的版本的兼容性。SSH服务是为了系统间的通讯和文件传输,也是Hadoop运行的必要条件。

2. Hadoop下载

可以在Hadoop官网上下载适合自己的版本,也可以从镜像站点下载。下载完成之后,在解压缩的目录下找到etc/hadoop目录,其中包含了Hadoop的配置文件。

3. Hadoop配置

在进行Hadoop配置时,需要注意以下几个文件:

  • core-site.xml:配置Hadoop的核心参数
  • hdfs-site.xml:配置Hadoop分布式文件系统(HDFS)的参数
  • mapred-site.xml:配置Hadoop的MapReduce参数
  • yarn-site.xml:配置Hadoop的资源管理器(YARN)参数

4. Hadoop启动

在完成配置之后,可以通过以下命令启动Hadoop服务:

cd $HADOOP_HOME/sbin  ./start-all.sh

启动后,可以通过JPS命令查看Hadoop的各个服务是否已经正常启动。

二、Hadoop大数据平台使用

在进行Hadoop大数据平台使用时,需要掌握以下几个方面:

1. HDFS使用

在使用HDFS时,需要掌握以下几个命令:

  • hadoop fs -ls:列出HDFS中指定目录的文件和子目录信息
  • hadoop fs -mkdir:创建HDFS中的一个新目录
  • hadoop fs -rm:删除HDFS中的一个或多个文件
  • hadoop fs -get:将HDFS中的文件或目录拷贝到本地文件系统中
  • hadoop fs -put:将本地文件系统中的文件或目录拷贝到HDFS中

2. MapReduce使用

MapReduce是Hadoop分布式计算框架的核心部分,主要用于大规模数据的处理。在使用MapReduce时,需要编写Map和Reduce函数,并将其打包成jar包,提交到Hadoop集群上运行。

3. Hadoop集群管理

在使用Hadoop集群时,需要进行集群的监控和管理。Hadoop自带了Web界面,可以通过该界面来监控集群的状态、任务的执行情况等。

同时,也可以通过Hadoop提供的命令行界面来进行集群管理。比如,可以通过hadoop job -list命令来查看当前集群中正在执行的任务。

在使用Hadoop大数据平台时,需要注意以下几点:

  • 需要注意数据安全性和隐私性的保护
  • 需要考虑集群的扩展和容错性问题
  • 需要进行性能优化,以提高处理效率

三、总结

学习通Hadoop大数据平台搭建与使用,可以让我们对大数据处理的技术有更深入的了解和掌握。要想在使用Hadoop大数据平台时取得更好的效果,需要掌握Hadoop的基本知识和操作方法,并充分考虑数据安全性、集群扩展性和性能优化等问题。


产品的概要设计要实现哪些目标()。

A.以下标记符中,用于设置页面标题的是()
B.顺陵石狮是武则天母亲杨氏陵墓前的大型雕塑作品之一
C.生产与营销偏重的是业绩考评
D.变量值表现为不同类别,且各类之间又有程度上的差别,这种变量称为


孟子的学说中:我们诚心修炼的时候要做到()。

A.供应链中选择合作伙伴指标要便于科学量化。()
B.录制微课时将颧肌稍稍往上提,可以使录制的声音更加清晰、明亮。
C.在存在市场势力或外部性这类市场失灵的情况下,市场不能有效地配置资源。
D.影响堆肥的主要因素有()


RAM中的信息停电也不会丢失。( )

A.下列哪些是汽车电气的特点
B.加入电解质可能会产生絮凝而使稳定性增强的是()
C.多相催化反应中,对于同一个反应,操作条件改变,速率控制步骤可能改变。
D.企业看重同类型工作经验的原因在于可以直接节约培训成本,为企业马上创造价值。


曲轴箱通风系统的目的主要是( )。

A.“子曰:不仁者不可以久处约”中的“约”是指( )
B.麦胶蛋白和麦谷蛋白占面粉蛋白质总量的( )以上,与水结合形成面筋。
C.北半球中纬度和高纬度地区气压差的跷跷板现象称为()
D.72ee4abe33ea4e0fafbaac76dfcc6fca.jpg


医院工作人员在医院内获得的感染也属

A.物质导热系数的顺序是:( )。
B.无尘粉笔在使用过程中,较普通粉笔的粉尘少()
C.下列各组软件中,完全属于应用软件的一组是
D.某一点的位置由高程和坐标系共同确定


执行力中的四个到位是指心态到位、姿态到位、行动到位和( )。

A.符合大叶性肺炎炎性特征的是()
B.以下属于市场细分中的“行为细分”标准的是( )。
C.众多的微观质量现象的加总,构成了总体质量现象
D.核磁共振测定样品的纯度9要求大于5%


构成推定全损有各种不同情况,其中()不能算做推定全损的范畴

A.质量比水还轻,能做蚊帐布的是( )。
B.关于道德的说法,正确的是( )
C.以下关于卵泡膜的描述中,哪一项错误
D.找出划线部分读音与所给单词相同的一个。hunt ( )


洋务派的主要代表人物有( )。

A.急性白血病患者出血的原因包括
B.苏轼自称“东坡居士”,此雅号与宋代哪个地方有关 【 】
C.痴呆老年人的用药护理,正确的是
D.下图是通过哪个命令将两个曲面连接的( )


草图约束的约束对象既可以是单个,也可以是多个。( )

A.属于内容分析法的特征有:
B.伊红美蓝(EMB)培养基中,伊红美蓝的作用是促进大肠杆菌的生长。
C.对早期食管癌,简单易行的确诊方法是( )
D.离子晶体中的化学键都是离子键。


新药申请的申报与审批,分为()两次申报与审批。

A.信息的“新颖性”反映的是信息( )维度的特征。
B.以D为角的徵调式音阶中,宫音是:
C./::B/::D.常见的涉外会面礼仪有( )。


当差速器壳转速为零时,如一侧半轴齿轮受外力矩而旋转时,则另一半轴以()

A.《Time to say goodbye》这首单曲被认为是谁的代表歌曲之一。
B.已知资本家购买生产资料用了8000元,工人工资2000元
C.只有完全定义的草图才能进行特征生成。
D.配置磁悬液后PH试纸的值为


追踪数组元素值得目的是:

A.自由基聚合中延长反应时间是为了提高相对分子质量,对吗
B.要使增强型P沟道MOS管工作在放大状态,其UGS应该大于零。( )
C.特·钢宝力道被誉为“鼻音呼麦之帝”。
D.请选出不属于郁达夫创作的作品:()。


理解概念类的三个层面中,不包括下列哪一项()

A.某当事人延迟履行合同后发生不可抗力导致合同无法履行,某当事人( )
B.有丝分裂末期,收缩环的形成和消失通过微管的装配与去装配来完成。
C.可以使用()函数实现参数化视图的功能
D.3至6岁的儿童普遍喜欢的书有()


二十世纪20年代的设计大师玛

A.沥青路面的抗滑摆值指的是潮湿路表温度为20℃时摆值。
B.开展审计工作都应该正确的编制:
C.要讲地道的德语,需要学习德国人的思维方式,努力培养语感。
D.与李白等人相比,王维的诗歌里多了一定的