Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv_Python_Pandas_Csv_Dataframe

Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv

python pandas csv dataframe

Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv,python,pandas,csv,dataframe,Python,Pandas,Csv,Dataframe,我正在尝试使用Pandas read_csv读取管道分隔的文件。但是，这些文件的顶部或底部可能包含或不包含非分隔文本我试过： pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True) 然而，这是行不通的我知道我可以使用csv库读取文件，并逐行读取以确认该行有效。不幸的是，我需要一个非循环解决方案，最好使用Pandas。谢谢你的帮助 (60084 row(s) affected) (30723 row(s) affec

我正在尝试使用Pandas read_csv读取管道分隔的文件。但是，这些文件的顶部或底部可能包含或不包含非分隔文本

我试过：

pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True)

然而，这是行不通的

我知道我可以使用csv库读取文件，并逐行读取以确认该行有效。不幸的是，我需要一个非循环解决方案，最好使用Pandas。谢谢你的帮助

(60084 row(s) affected)



(30723 row(s) affected)


(41701 row(s) affected)



(171209 row(s) affected)

(17348 row(s) affected)


ProductId|ModelId|ProgramId|BranchId|AdvisorId|TotalAssets|NewAssets|AdditionAssets|ConversionNewAssets|TerminatedAssets
102abc|1|100|xyz|vbd|100|1900|0|10|0
103abc|1|100|xyz|vbd|150|1905|0|10|0
104abc|1|100|xyz|vbd|200|1910|0|10|0
102abc|1|100|xyz|vbd|250|1915|0|10|0
103abc|1|100|xyz|vbd|300|1920|0|10|0
104abc|1|100|xyz|vbd|350|1925|0|10|0
102abc|1|100|xyz|vbd|400|1930|0|10|0
103abc|1|100|xyz|vbd|450|1935|0|10|0

(1648248 row(s) affected)

代码>注释=（）它忽略了从<代码>开始的行（< /代码>，并将其视为注释。< /LI>

skip_blank_lines=True

默认情况下忽略空行。As

skip_blank_lines

默认值为

True

请参见此处的更多可选参数

df=pd.read\u csv（'file\u sample.csv'，sep='|'，comment='（'）） >>>df ProductId ModelId…ConversionWasSets TerminatedAssets 0 102abc 1…10 0 103abc 1…10 0 2 104abc 1…10 0 3 102abc 1…10 0 4 103abc 1…10 0 5 104abc 1…10 0 6 102abc 1…10 0 7 103abc 1…10 0 [8行x 10列]

你能分享一个文件的例子吗？你的帖子中不清楚哪些文本是文件的一部分，哪些部分是你的评论。嗨，AMC，谢谢你回复我。我通过添加一个csv的示例编辑了这个问题。好的，

（受影响的n行）

是“额外的”您不需要的文本？没错，中间有x个空行。有没有办法只识别CSV部分？