Python 如何将整个列表内容添加到Pyspark数据帧行中?

Python 如何将整个列表内容添加到Pyspark数据帧行中?,python,dataframe,pyspark,Python,Dataframe,Pyspark,我正在从字符串列表创建一个新的pyspark数据帧。我的代码应该是什么样子 这是我的列表:['there'、'is'、'one'、'that'、'commands'],这是我理想中想要的: 单词(标题) 第1行:['there'、'is'、'one'、'that'、'commands'] 第2行:['test','try' 我已经试过以下代码,但没有一个能完全满足我的要求 test_list=['hi','bye','thanks'] test_list=sc.parallelize(test_

我正在从字符串列表创建一个新的pyspark数据帧。我的代码应该是什么样子

这是我的列表:['there'、'is'、'one'、'that'、'commands'],这是我理想中想要的:

单词(标题) 第1行:['there'、'is'、'one'、'that'、'commands'] 第2行:['test','try'

我已经试过以下代码,但没有一个能完全满足我的要求

test_list=['hi','bye','thanks']
test_list=sc.parallelize(test_list)

schema = StructType([StructField("name", StringType(), True)])
df3 = sqlContext.createDataFrame(test_list, schema)

我无法使用df.show()获得要显示的数据帧。

您只需要导入对象,其余一切都很好

from pyspark.sql.types import Row, StructType, StructField, StringType
test_list=['hi','bye','thanks']
test_list=sc.parallelize(test_list)

rdd= test_list.map(lambda t: Row(name=t))
schema = StructType([StructField("name", StringType(), True)])
df = sqlContext.createDataFrame(rdd, schema)
df.show()
+------+
|  name|
+------+
|    hi|
|   bye|
|thanks|
+------+

非常感谢您的分享。这与…NAME['hi','bye',thanker']或NAME'hi''bye''thanker'相同吗?我认为您在创建数据帧时遇到了问题。对不起,您的问题当时我不清楚。如果您能澄清,那么我可以做出相应的更改。我不明白您所说的--“NAME”是什么意思['hi'、'bye',thank']或NAME'hi''bye''thank''hi cph,我想要的是:NAME['hi'、'bye',thank']。谢谢!那么你想要一个条目名为'hi''bye''thank''的专栏吗?你能在你的问题中粘贴数据集的图片吗?嗨,我设法解决了我的问题。非常感谢!
from pyspark.sql.types import Row, StructType, StructField, StringType
test_list=['hi','bye','thanks']
test_list=sc.parallelize(test_list)

rdd= test_list.map(lambda t: Row(name=t))
schema = StructType([StructField("name", StringType(), True)])
df = sqlContext.createDataFrame(rdd, schema)
df.show()
+------+
|  name|
+------+
|    hi|
|   bye|
|thanks|
+------+