Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv
我正在尝试使用Pandas read_csv读取管道分隔的文件。但是,这些文件的顶部或底部可能包含或不包含非分隔文本 我试过:Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv,python,pandas,csv,dataframe,Python,Pandas,Csv,Dataframe,我正在尝试使用Pandas read_csv读取管道分隔的文件。但是,这些文件的顶部或底部可能包含或不包含非分隔文本 我试过: pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True) 然而,这是行不通的 我知道我可以使用csv库读取文件,并逐行读取以确认该行有效。不幸的是,我需要一个非循环解决方案,最好使用Pandas。 谢谢你的帮助 (60084 row(s) affected) (30723 row(s) affec
pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True)
然而,这是行不通的
我知道我可以使用csv库读取文件,并逐行读取以确认该行有效。不幸的是,我需要一个非循环解决方案,最好使用Pandas。
谢谢你的帮助
(60084 row(s) affected)
(30723 row(s) affected)
(41701 row(s) affected)
(171209 row(s) affected)
(17348 row(s) affected)
ProductId|ModelId|ProgramId|BranchId|AdvisorId|TotalAssets|NewAssets|AdditionAssets|ConversionNewAssets|TerminatedAssets
102abc|1|100|xyz|vbd|100|1900|0|10|0
103abc|1|100|xyz|vbd|150|1905|0|10|0
104abc|1|100|xyz|vbd|200|1910|0|10|0
102abc|1|100|xyz|vbd|250|1915|0|10|0
103abc|1|100|xyz|vbd|300|1920|0|10|0
104abc|1|100|xyz|vbd|350|1925|0|10|0
102abc|1|100|xyz|vbd|400|1930|0|10|0
103abc|1|100|xyz|vbd|450|1935|0|10|0
(1648248 row(s) affected)
默认情况下忽略空行。Asskip_blank_lines=True
默认值为skip_blank_lines
True
你能分享一个文件的例子吗?你的帖子中不清楚哪些文本是文件的一部分,哪些部分是你的评论。嗨,AMC,谢谢你回复我。我通过添加一个csv的示例编辑了这个问题。好的,
(受影响的n行)
是“额外的”您不需要的文本?没错,中间有x个空行。有没有办法只识别CSV部分?