Python 如何使用熊猫读取项目为报价的文本文件
我有一个包含长文本的文件,每个文本都有双引号,如下所示:Python 如何使用熊猫读取项目为报价的文本文件,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个包含长文本的文件,每个文本都有双引号,如下所示: "blah1 balah1 ..... " "blah2 blah2 ......." "blah3 blah3 ......." "...." 我想用这些项目中的一列('text')创建一个dataFrame。我试过: data = pd.read_csv(data_path+'/test.csv') data.head(10) 输出类似于: blah1 blah1.... 0 blah2 blah2 1 blah3 blah3 .
"blah1 balah1 ..... "
"blah2 blah2 ......."
"blah3 blah3 ......."
"...."
我想用这些项目中的一列('text')创建一个dataFrame
。我试过:
data = pd.read_csv(data_path+'/test.csv')
data.head(10)
输出类似于:
blah1 blah1....
0 blah2 blah2
1 blah3 blah3
....
似乎除了第一行之外,它还可以检索其他行。如何像其他行一样拥有第一行?对指定列使用参数
names
,则不需要header=None
:
import pandas as pd
temp=u'''"blah1 balah1"
"blah2 blah2"
"blah3 blah3"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), names=['text1'])
print (df)
text1
0 blah1 balah1
1 blah2 blah2
2 blah3 blah3