如何处理配置单元中具有新行字符的json文件?

如何处理配置单元中具有新行字符的json文件?,json,hive,Json,Hive,我正在尝试将json数据加载到配置单元表中。此json数据包含换行符。当我尝试将这个json数据加载到配置单元表中时,它没有正确插入 我的配置单元表创建: 我的json数据: 我的配置单元表数据: 有谁能帮我解决这个问题吗…您可以使用regexp\u replace函数来替换 或 编写一个shell脚本,将所有换行符\n替换为空值。实际上,我并不担心特定列的选择。我担心数据加载到配置单元表的方式,因为换行符,一条记录被存储在两行中。我们可以忽略换行符以便一条记录存储在一行中吗?有人能建议我吗?你

我正在尝试将json数据加载到配置单元表中。此json数据包含换行符。当我尝试将这个json数据加载到配置单元表中时,它没有正确插入

我的配置单元表创建: 我的json数据: 我的配置单元表数据: 有谁能帮我解决这个问题吗…

您可以使用regexp\u replace函数来替换


编写一个shell脚本,将所有换行符\n替换为空值。

实际上,我并不担心特定列的选择。我担心数据加载到配置单元表的方式,因为换行符,一条记录被存储在两行中。我们可以忽略换行符以便一条记录存储在一行中吗?有人能建议我吗?你找到解决方法了吗?在Athena中处理相同的问题,并且似乎没有办法将文件作为不同的类型导入,然后通过查询将其分解。。。我不确定这有多有用
CREATE EXTERNAL TABLE serde_tab(
    gender STRING, name STRING
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
LOCATION '/user/input/text' ;
{"gender":"femal\ne","name":"xyz"}
select * from serde_tab;
OK
serde_tab.gender    serde_tab.name
femal
e   xyz
hive> select regexp_replace(string("femal\ne"),'\n','');
+---------+--+
|   _c0   |
+---------+--+
| female  |
+---------+--+