Advertisement

大数据期末考试题库 2021.12.22

阅读量:

Zookeeper是一种基于分布式架构设计的应用程序协调服务, 是基于Chubby框架的一个开源实现. 它充当集群管理者的角色, 监视着集群中各个节点的状态, 并响应节点状态变化做出相应处理, 最终提供一套易于使用且性能卓越的应用程序接口.
主要应用场景包括分布式系统协调与同步, 互斥锁管理以及高可用性保障等.

为了满足要求,在HbaseShell中执行以下操作:
(一) 创建名为T2的新表,并设置其family_name字段值为F4,默认版本数量设置为5;
(二) 向T2中添加一条新记录:
- 该记录的RowKey字段值设为RowKey_abc,
- Family Name字段设为F4,
- Column Name字段设为Col3,
- Value字段设为其对应的Value_abc(timestamp),
- Timestamp字段由系统默认设置;
(三) 从T2中获取 'r_wxk' 行下 F4 下的所有列值

请简述在V3个节点(Master,Slave1,Slave2)的Hadoop分布式集群中安装操作步骤(只描述主要操作步骤)。

  1. 根据以下要求,在Hive Shell中执行相应的命令以完成操作。
    (1)创建名为bigdata_user的外部表,并设置其字段结构如下:
    id字段类型为int,
    uid, item_id, behavior_type, item_category均为string类型,
    visit_date设为date类型,
    province也为string类型。
    存储位置设置为hdfs://localhost:9090/bigdatacase/dataset,
    字段分隔符为\t。
    注:row format delimited; fields terminated by \t; location hdfs://localhost:9090/bigdatacase/dataset;
    (2)使用COUNT(*)函数计算该表共有多少条数据记录;
    (3)通过LIMIT 10查询前10条数据信息。

select count(*) from bigdata_user;

select* from bigdata_user where 1=1 limit 10;

全部评论 (0)

还没有任何评论哟~