【Hive】笔试题 05 (求月销售额和总销售额)_hive分区查询,计算1月的销售总额。
发布时间
阅读量:
阅读量


丰富的网上学习资料充斥着我们面前的学习资源。若所学知识缺乏条理,则在遇到问题时往往停留在表面。那么就难以实现真正的技术进步。
一个人具备快速行走的能力,而当一群人凝聚在一起时,他们的步伐将更加坚定有力!无论你是正在从事IT行业的资深从业者还是对IT行业充满热情的新手,我们都在这里为你提供一个开放包容的成长平台.加入我们的圈子(技术交流群组、丰富的学习资源库以及职场吐槽区等),共同成长与进步!让我们携手并进,在技术交流中提升自我.
+ [3、需求](#3_42)
+ [4、解析](#4_45)
+ - [(1)按照商店名称和月份进行分组统计](#1_46)
- [(2)对tmp\_store1 表里面的数据进行自连接](#2tmp_store1__55)
- [(3)比较统计](#3_65)
+ [5、另一种方式(窗口函数)](#5_71)
1、数据说明
(1)数据格式
a,01,150
a,01,200
b,01,1000
b,01,800
c,01,250
c,01,220
b,01,6000
a,02,2000
a,02,3000
b,02,1000
b,02,1500
c,02,350
c,02,280
a,03,350
a,03,250
(2)字段含义
店铺,月份,金额
2、数据准备
(1)创建数据库表t_store
use class;
create table t_store(
name string,
months int,
money int
)
row format delimited fields terminated by ",";
(2)导入数据
load data local inpath "/home/hadoop/store.txt" into table t_store;
3、需求
生成用于计算各店本月销售金额及该月累计总额的Hive HQL语句
4、解析
(1)按照商店名称和月份进行分组统计
create table tmp_store1 as
select name,months,sum(money) as money from t_store group by name,months;
select \* from tmp_store1;

(2)对tmp_store1 表里面的数据进行自连接
create table tmp_store2 as
select a.name aname,a.months amonths,a.money amoney,b.name bname,b.months bmonths,b.money bmoney from tmp_store1 a
join tmp_store1 b on a.name=b.name order by aname,amonths;
select \* from tmp_store2;



从初学者提供的基础学习材料到资深数据分析师的专业课程全面涵盖核心知识点系统性强的学习体验
因为文件数量较多,在这里仅用于展示目录结构,并包含以下核心资源:大厂面试题库、知识整理文档、技术文档与代码库、实际项目案例以及课程规划路线图。此外,后续将持续补充内容以完善资源体系
想要此份系统化资料的朋友,请点击此处下载
笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**
想要一套系统化的学习资料?点击此处即可获取
想要一套系统化的学习资料?点击此处即可获取
想要一套系统化的学习资料?点击此处即可获取
全部评论 (0)
还没有任何评论哟~
