Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/logging/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv_Python_Pandas_Csv_Dataframe - Fatal编程技术网

Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv

Python 使用Pandas读取列标题上方和文件底部有非分隔文本和空行的csv,python,pandas,csv,dataframe,Python,Pandas,Csv,Dataframe,我正在尝试使用Pandas read_csv读取管道分隔的文件。但是,这些文件的顶部或底部可能包含或不包含非分隔文本 我试过: pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True) 然而,这是行不通的 我知道我可以使用csv库读取文件,并逐行读取以确认该行有效。不幸的是,我需要一个非循环解决方案,最好使用Pandas。 谢谢你的帮助 (60084 row(s) affected) (30723 row(s) affec

我正在尝试使用Pandas read_csv读取管道分隔的文件。但是,这些文件的顶部或底部可能包含或不包含非分隔文本

我试过:

pd.read_csv('file_sample.csv', sep='|', error_bad_lines=True)
然而,这是行不通的

我知道我可以使用csv库读取文件,并逐行读取以确认该行有效。不幸的是,我需要一个非循环解决方案,最好使用Pandas。 谢谢你的帮助

(60084 row(s) affected)



(30723 row(s) affected)


(41701 row(s) affected)



(171209 row(s) affected)

(17348 row(s) affected)


ProductId|ModelId|ProgramId|BranchId|AdvisorId|TotalAssets|NewAssets|AdditionAssets|ConversionNewAssets|TerminatedAssets
102abc|1|100|xyz|vbd|100|1900|0|10|0
103abc|1|100|xyz|vbd|150|1905|0|10|0
104abc|1|100|xyz|vbd|200|1910|0|10|0
102abc|1|100|xyz|vbd|250|1915|0|10|0
103abc|1|100|xyz|vbd|300|1920|0|10|0
104abc|1|100|xyz|vbd|350|1925|0|10|0
102abc|1|100|xyz|vbd|400|1930|0|10|0
103abc|1|100|xyz|vbd|450|1935|0|10|0

(1648248 row(s) affected)
    代码>注释=()它忽略了从<代码>开始的行(< /代码>,并将其视为注释。< /LI>
  • skip_blank_lines=True
    默认情况下忽略空行。As
    skip_blank_lines
    默认值为
    True
请参见此处的更多可选参数

df=pd.read\u csv('file\u sample.csv',sep='|',comment='(')) >>>df ProductId ModelId…ConversionWasSets TerminatedAssets 0 102abc 1…10 0 103abc 1…10 0 2 104abc 1…10 0 3 102abc 1…10 0 4 103abc 1…10 0 5 104abc 1…10 0 6 102abc 1…10 0 7 103abc 1…10 0 [8行x 10列]
你能分享一个文件的例子吗?你的帖子中不清楚哪些文本是文件的一部分,哪些部分是你的评论。嗨,AMC,谢谢你回复我。我通过添加一个csv的示例编辑了这个问题。好的,
(受影响的n行)
是“额外的”您不需要的文本?没错,中间有x个空行。有没有办法只识别CSV部分?