Python 3.x 如何使用pandas读取文本数据?

Python 3.x 如何使用pandas读取文本数据?,python-3.x,pandas,numpy,Python 3.x,Pandas,Numpy,我的数据在文本文件中,数据格式如下所示。数字是类,文本是我的特征。第一行,即:;5485是行的总数。我想分离类和特性,忽略第一行,即;5485如何使用熊猫?请帮帮我 5485 champion products ch批准股票分割champion products inc表示,其董事会批准了普通股的二对一股票分割 计算机终端系统cpml完成出售计算机终端系统公司表示,已完成其普通股和 1 cobanco inc cbco年度净shr cts vs dlrs net vs assets mln vs

我的数据在文本文件中,数据格式如下所示。数字是类,文本是我的特征。第一行,即:;5485是行的总数。我想分离类和特性,忽略第一行,即;5485如何使用熊猫?请帮帮我

5485

champion products ch批准股票分割champion products inc表示,其董事会批准了普通股的二对一股票分割

计算机终端系统cpml完成出售计算机终端系统公司表示,已完成其普通股和

1 cobanco inc cbco年度净shr cts vs dlrs net vs assets mln vs mln depositions mln vs mln loans mln vs mln note th qtr note in available year

我认为需要参数
sep='.'
用于一列
Dataframe
(需要不在数据中的分隔符值)用于
skiprows
忽略第一行:

df = pd.read_csv(file, names=['data'], sep='|', skiprows=1)
print (df)
                                                data
0  1 champion products ch approves stock split ch...
1  2 computer terminal systems cpml completes sal...
2  1 cobanco inc cbco year net shr cts vs dlrs ne...
然后,通过第一个空格将两个列合并:

df[['class','features']] = df.pop('data').str.split(n=1, expand=True)
#convert column to numeric
df['class'] = df['class'].astype(int)
print (df)
  class                                           features
0     1  champion products ch approves stock split cham...
1     2  computer terminal systems cpml completes sale ...
2     1  cobanco inc cbco year net shr cts vs dlrs net ...

虽然这可能回答了这个问题,但最好包括一些关于这个答案如何帮助解决问题的描述。请阅读。
import pandas as pd
train = pd.read_csv("dataset.csv", header=0,delimiter=",", quoting=1)
num_reviews = train["columnTitleName"].size
for i in xrange(0, num_reviews): 
    dis =  train["columnTitleName"][i]
    print dis