python pandas read_csv长度为>;csv中的行

python pandas read_csv长度为>;csv中的行,python,pandas,csv,Python,Pandas,Csv,当我执行file=pd.read\u csv(“x.csv”)时,它确实将csv读取到数据帧中,并执行head(),显示正确的列时,它看起来没有问题 由于我的csv有1M+行,我希望在执行len(文件)时看到1M+,但我看到了19M+。有什么问题吗?使用我朋友的计算机并对测试csv文件执行相同的操作,可以在执行len(文件)后获得正确的行数 该文件包含奇怪的特殊字符,如可能显示为??在csv中 因此,我很确定这不是因为所使用的函数——更可能的原因是python 2和3之间的差异、使用的分隔符(默

当我执行
file=pd.read\u csv(“x.csv”)
时,它确实将csv读取到数据帧中,并执行
head()
,显示正确的列时,它看起来没有问题

由于我的csv有1M+行,我希望在执行
len(文件)
时看到1M+,但我看到了19M+。有什么问题吗?使用我朋友的计算机并对测试csv文件执行相同的操作,可以在执行len(文件)后获得正确的行数

该文件包含奇怪的特殊字符,如可能显示为??在csv中

因此,我很确定这不是因为所使用的函数——更可能的原因是python 2和3之间的差异、使用的分隔符(默认值)还是缺少行之类的脏数据,还是其他原因

例如,csv包含

col1 col2 col3 col4

a       112      111       q??p

如果没有其他人可以用来尝试复制python 2.7或python 3的数据,就不可能回答这个问题?我想是python 3吧!它可以运行,所以可能不是语法问题。它可能是脏数据-但正如我们所知,csv将行数限制在1M+以内,可能csv文件中存在逗号或换行符,这些字符会给中的数据帧创建带来问题pandas@SreeramTP谢谢你的建议。我尝试在测试csv的列值中添加逗号-它给出的长度值与不添加逗号的长度值相同。那是分隔符,所以换行不重要?