使用PySpark读取带多行字符串且不带引号的平面文件

使用PySpark读取带多行字符串且不带引号的平面文件,pyspark,Pyspark,我有一个由|(管道)分隔的平面文件,没有引号字符。示例数据如下所示: SOME_NUMBER|SOME_MULTILINE_STRING|SOME_STRING 23|multiline text1|text1 24|multi mulitline text2|text2 25|text3|text4 我要做的是将其加载到数据帧中,使其看起来像这样: 一些你的号码 一些多行字符串 几根绳子 23 多行text1 文本1 24 多行多行文本2 文本2 25 文本3 文本4 这回答了你的问题吗@麦

我有一个由
|
(管道)分隔的平面文件,没有引号字符。示例数据如下所示:

SOME_NUMBER|SOME_MULTILINE_STRING|SOME_STRING
23|multiline
text1|text1
24|multi
mulitline
text2|text2
25|text3|text4
我要做的是将其加载到数据帧中,使其看起来像这样:

一些你的号码 一些多行字符串 几根绳子 23 多行
text1 文本1 24 多行
多行
文本2 文本2 25 文本3 文本4
这回答了你的问题吗@麦克,我不这么认为。在我的例子中,我有一个多行字符串,我想解释为在pice上。在链接问题中,它更多地与移动到下一行的值有关。