Java 配置单元提取之前的文本(<;br>;
在Apache配置单元中,如何从给定字符串中提取子字符串。 我有一列包含以下值 我需要从下面的字符串中提取ABC3170,即直到Java 配置单元提取之前的文本(<;br>;,java,regex,hive,Java,Regex,Hive,在Apache配置单元中,如何从给定字符串中提取子字符串。 我有一列包含以下值 我需要从下面的字符串中提取ABC3170,即直到 我的数据如下所示。我想获取所有记录并删除之后的文本 Col1------ G3333 XYZD20 5289 ABC2620 CDF-B700S 自定义管理器 ABC3170使用函数和匹配的java正则表达式提取之前的值 正则表达式: hive> select regexp_extract(txt,"(.*?)\\s+<BR>",1),txt fro
我的数据如下所示。我想获取所有记录并删除
之后的文本 Col1
------
G3333
XYZD20
5289
ABC2620
CDF-B700S
自定义管理器
ABC3170
使用函数和匹配的java正则表达式提取
之前的值
正则表达式:
hive> select regexp_extract(txt,"(.*?)\\s+<BR>",1),txt from i;
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| _c0 | txt |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| ABC3170 | ABC3170 <BR></DIV><DIV DIR="AUTO" STYLE="DIRECTION: LTR; MARGIN: 0; PADDING: 0; FONT-FAMILY: SANS-SERIF; FONT-SIZE: 11PT; COLOR: BLACK; "> |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
(.*)\\s+
//在
配置单元查询:
hive> select regexp_extract(txt,"(.*?)\\s+<BR>",1),txt from i;
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| _c0 | txt |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| ABC3170 | ABC3170 <BR></DIV><DIV DIR="AUTO" STYLE="DIRECTION: LTR; MARGIN: 0; PADDING: 0; FONT-FAMILY: SANS-SERIF; FONT-SIZE: 11PT; COLOR: BLACK; "> |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
hive>选择regexp\u extract(,“(.*?\\s+
”,1)from。;
示例:
hive> select regexp_extract(txt,"(.*?)\\s+<BR>",1),txt from i;
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| _c0 | txt |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
| ABC3170 | ABC3170 <BR></DIV><DIV DIR="AUTO" STYLE="DIRECTION: LTR; MARGIN: 0; PADDING: 0; FONT-FAMILY: SANS-SERIF; FONT-SIZE: 11PT; COLOR: BLACK; "> |
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
hive>选择regexp_extract(txt,(.*)\\s+
”,1),从i;
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
|_c0 | txt|
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
|ABC3170 | ABC3170
|
+----------+---------------------------------------------------------------------------------------------------------------------------------------------+--+
谢谢您的回复。我已经用更多数据更新了问题。请告诉我如何获取除