关于Hive正则匹配中文字符串的问题

时间:2018-09-28 16:19:29   收藏:0   阅读:2023

首先,中文字符集为 ‘^[\\4e00-\\u9fa5]$‘

1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\\u4e00-\\u9fa5]$’ 进行匹配

 

2.如果在终端调用,则需叫上转义符,如

hive -e "select ‘中国‘  rlike ‘^[\\\u4e00-\\\u9fa5]$’"

 

3.在scala和java中使用 同1;

val regex = new Regex("[\\u4e00-\\u9fa5]")
val a = regex.findFirstMatchIn("中国")
println(a)

 

原文:https://www.cnblogs.com/LakersChampionship/p/9718768.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!