关于Hive正则匹配中文字符串的问题
时间:2018-09-28 16:19:29
收藏:0
阅读:2023
首先,中文字符集为 ‘^[\\4e00-\\u9fa5]$‘
1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\\u4e00-\\u9fa5]$’ 进行匹配
2.如果在终端调用,则需叫上转义符,如
hive -e "select ‘中国‘ rlike ‘^[\\\u4e00-\\\u9fa5]$’"
3.在scala和java中使用 同1;
val regex = new Regex("[\\u4e00-\\u9fa5]") val a = regex.findFirstMatchIn("中国") println(a)
原文:https://www.cnblogs.com/LakersChampionship/p/9718768.html
评论(0)