Python 3.x 如何使用pandas读取文本数据？_Python 3.x_Pandas_Numpy

Python 3.x 如何使用pandas读取文本数据？

python-3.x pandas numpy

Python 3.x 如何使用pandas读取文本数据？,python-3.x,pandas,numpy,Python 3.x,Pandas,Numpy,我的数据在文本文件中，数据格式如下所示。数字是类，文本是我的特征。第一行，即：；5485是行的总数。我想分离类和特性，忽略第一行，即；5485如何使用熊猫？请帮帮我 5485 champion products ch批准股票分割champion products inc表示，其董事会批准了普通股的二对一股票分割计算机终端系统cpml完成出售计算机终端系统公司表示，已完成其普通股和 1 cobanco inc cbco年度净shr cts vs dlrs net vs assets mln vs

我的数据在文本文件中，数据格式如下所示。数字是类，文本是我的特征。第一行，即：；5485是行的总数。我想分离类和特性，忽略第一行，即；5485如何使用熊猫？请帮帮我

5485

champion products ch批准股票分割champion products inc表示，其董事会批准了普通股的二对一股票分割

计算机终端系统cpml完成出售计算机终端系统公司表示，已完成其普通股和

1 cobanco inc cbco年度净shr cts vs dlrs net vs assets mln vs mln depositions mln vs mln loans mln vs mln note th qtr note in available year

我认为需要参数

sep='.'

用于一列

Dataframe

（需要不在数据中的分隔符值）用于

skiprows

忽略第一行：

df = pd.read_csv(file, names=['data'], sep='|', skiprows=1)
print (df)
                                                data
0  1 champion products ch approves stock split ch...
1  2 computer terminal systems cpml completes sal...
2  1 cobanco inc cbco year net shr cts vs dlrs ne...

然后，通过第一个空格将两个列合并：

df[['class','features']] = df.pop('data').str.split(n=1, expand=True)
#convert column to numeric
df['class'] = df['class'].astype(int)
print (df)
  class                                           features
0     1  champion products ch approves stock split cham...
1     2  computer terminal systems cpml completes sale ...
2     1  cobanco inc cbco year net shr cts vs dlrs net ...

虽然这可能回答了这个问题，但最好包括一些关于这个答案如何帮助解决问题的描述。请阅读。

import pandas as pd
train = pd.read_csv("dataset.csv", header=0,delimiter=",", quoting=1)
num_reviews = train["columnTitleName"].size
for i in xrange(0, num_reviews): 
    dis =  train["columnTitleName"][i]
    print dis