Hive 语句复习

时间:2020-05-12 12:33:05   收藏:0   阅读:63

1、union 和 union all 的区别

Union,对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;

Union All,对两个结果集进行并集操作,包括重复行,不进行排序;

Intersect,对两个结果集进行交集操作,不包括重复行,同时进行默认规则的排序;

Minus,对两个结果集进行差操作,不包括重复行,同时进行默认规则的排序。

(union是可以自己排序的哦,根据select后第一个属性)

 2、regexp_extract(string subject,  string pattern,  int index)

将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。

第一参数:   要处理的字段

第二参数:    需要匹配的正则表达式

第三个参数:

正则匹配字符解释:

 

原文:https://www.cnblogs.com/qingchen-forever/p/12875296.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!