拉链表(小记)
创始人
2024-05-30 00:49:08
0

拉链表

  • 创建外部表
    • 将编写的orders.txt上传到hdfs
  • 创建一个增减分区表
    • 将orders表的数据传入ods_orders_inc
    • 查看分区
  • 创建历史表
    • 插入数据
  • 操作

创建外部表

create database lalian;
use lalian;create external table orders(orderId int,createDate string,modifiedTime string,status string
)
row format delimited fields terminated by '\t'
location '/tmp/lalian/orders';

将编写的orders.txt上传到hdfs

[root@cp145 ~]# vim ./orders.txt

1 2023-03-03 2023-03-03 创建
1 2023-03-03 2023-03-03 创建
1 2023-03-03 2023-03-03 创建

[root@cp145 ~]# hdfs dfs -mkdir -p /tmp/lalian/orders/
[root@cp145 ~]# hdfs dfs -put ./orders.txt /tmp/lalian/orders/

用select可以查到数据
在这里插入图片描述

创建一个增减分区表

create table ods_orders_inc(orderId int,createDate string,modifiedTime string,status string
) partitioned by (day string) --通过day分区
row format delimited fields terminated by '\t';

将orders表的数据传入ods_orders_inc

insert overwrite table ods_orders_inc partition (day = '2023-03-03')
select orderId,createDate,modifiedTime,status from orders;
select * from ods_orders_inc;

在这里插入图片描述

查看分区

show partitions ods_orders_inc;

在这里插入图片描述

创建历史表

create table dws_orders_his(orderId int,createDate string,modifiedTime string,status string,start_time string,end_time string
) row format delimited fields terminated by '\t';

插入数据

insert overwrite table dws_orders_his
select orderId,createDate,modifiedTime, status, modifiedTime,-- start_time '9999-12-31' -- end_time 
from ods_orders_inc where day = '2023-03-03';

查看数据

select * from dws_orders_his;

在这里插入图片描述

操作

将hdfs中的orders.txt删除,上传增加了字段的新orders.txt
在这里插入图片描述
覆写分区表

insert overwrite table ods_orders_inc partition (day='2023-03-04')
select orderId, createDate, modifiedTime, status from orders
where modifiedTime = '2023-03-04';

查看分区,出现03-04分区

show partitions ods_orders_inc;

在这里插入图片描述
查看 day=‘2023-03-04’ 分区

select * from ods_orders_inc where day='2023-03-04';

将03-04分区的数据整合覆盖到历史表中

with
t1 as (select orderId, createDate, modifiedTime, status, modifiedTime start_time,'9999-12-31' end_timefrom ods_orders_inc where day = '2023-03-04'),
t2 as ( selectt1.orderId,t1.createDate,t1.modifiedTime,t1.status,t1.start_time,if(t2.orderId is not null and t1.end_time > '2023-03-04','2023-03-04',t1.end_time) end_timefrom dws_orders_his t1 left join (select orderId,modifiedTime from ods_orders_inc where day = '2023-03-04') t2on t1.orderId = t2.orderId ),
t3 as (select * from t1 union all select * from t2)
insert overwrite table dws_orders_his
select * from t3 order by t3.orderId,t3.modifiedTime;
--或者
insert overwrite table dws_orders_his
select tb.orderId,tb.createDate,tb.modifiedTime,tb.status,tb.start_time,tb.end_time
from (
(select orderId, createDate, modifiedTime, status,modifiedTime as start_time,'9999-12-31' as end_time
from ods_orders_inc where day='2023-03-04')
union all
(select t1.orderId,t1.createDate,t1.modifiedTime,t1.status,t1.start_time,case when t2.orderId is not null and t1.end_time > '2023-03-04'then '2023-03-04' else t1.end_time end end_time
from dws_orders_his t1 left join (select orderId from ods_orders_inc where day='2023-03-04') t2
on t1.orderId = t2.orderId)
) tb order by tb.orderId,tb.start_time;

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
一帆风顺二龙腾飞三阳开泰祝福语... 本篇文章极速百科给大家谈谈一帆风顺二龙腾飞三阳开泰祝福语,以及一帆风顺二龙腾飞三阳开泰祝福语结婚对应...
美团联名卡审核成功待激活(美团... 今天百科达人给各位分享美团联名卡审核成功待激活的知识,其中也会对美团联名卡审核未通过进行解释,如果能...