Advertisement

中国大学MOOC·北京理工大学·大数据基础与应用——第八周单元测试答案

阅读量:

以下答案仅供参考,如有错误欢迎指正~

单选(2分)以下关于日志采集工具Flume的说法不正确的是:

A.Flume适用于大量数据的实时数据采集

B.Flume的数据源和目标都是可定制、可扩展的

C.Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统

D.Flume支持多级级联和多路复制
8-1

单选(2分)以下关于数据分发中间件Kafka的说法不正确的是:

A.每条发布到Kafka集群的消息都属于一个主题(topic)

B.Kafka是一个基于发布/订阅的消息系统

C.Kafka将Topic分成一个或者多个Partition

D.Kafka主要是使用c++、Java语言实现的
8-2

单选(2分)以下关于分布式文件系统HDFS的说法不正确的是:

A.HDFS支持存储TB-PB级别的数据

B.数据块(Block)是HDFS文件系统基本的存储单位

C.HDFS支持多用户写入,任意修改文件

D.HDFS是能够运行在通用硬件上的分布式文件系统
8-3

单选(2分)HDFS集群中管理文件系统的元数据、负责客户端请求响应的节点是:
A.DataNode
B.NameNode
C.ClientNode
D.ActiveNode
8-4

单选(2分)HDFS(Hadoop 1.X版本中)默认的块大小是:

A.32 MB

B.64 KB

C.64 MB

D.32 KB
8-5

单选(2分)以下关于分布式数据库HBase的说法不正确的是:

A.HBase比传统关系数据库系统具有更加丰富的数据类型

B.HBase源于Google BigTable技术

C.HBase是一个基于列式存储的分布式数据库系统

D.HBase不支持复杂的SQL操作,例如表连接
8-6

单选(2分)HBase中分布式存储和负载均衡的最小单元是:

A.Block

B.Region

C.Partition

D.Table
8-7

单选(2分)以下关于数据仓库Hive的说法不正确的是:

A.Hive将用户的查询语句转换为MapReduce作业提交到Hadoop集群上执行

B.Hive的数据最终都保存为HDFS文件

C.Hive能够在大规模数据集上实现低延迟快速的查询

D.Hive主要是为分析数据而设计的数据仓库
8-8

多选(2分) Hive的数据模型主要包括:

A.桶(Buckets)

B.块(Blocks)

C.分区(Partitions)

D.表(Tables)
8-9

多选(2分)NoSQL数据库的主要类型包括:

A.文档数据库

B.列族数据库

C.键值数据库

D.图形数据库
8-10

全部评论 (0)

还没有任何评论哟~