Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/301.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 熊猫中的排序函数,返回混乱的数据_Python_Sorting_Pandas - Fatal编程技术网

Python 熊猫中的排序函数,返回混乱的数据

Python 熊猫中的排序函数,返回混乱的数据,python,sorting,pandas,Python,Sorting,Pandas,我正在尝试使用Pandas中的sort函数对CSV文件中的数据进行排序,使用以下代码。我在原始文件中有229行。但是排序的输出是245行,因为字段中的某些数据打印在下一行,而某些行没有任何值 sample=pd.read_csv("sample.csv" , encoding='latin-1', skipinitialspace=True) sample_sorted = sample.sort_values(by = ['rating']) sample_sorted.to_csv("sam

我正在尝试使用Pandas中的sort函数对CSV文件中的数据进行排序,使用以下代码。我在原始文件中有229行。但是排序的输出是245行,因为字段中的某些数据打印在下一行,而某些行没有任何值

sample=pd.read_csv("sample.csv" , encoding='latin-1', skipinitialspace=True)
sample_sorted = sample.sort_values(by = ['rating'])
sample_sorted.to_csv("sample_sorted.csv")
我认为,出现这个问题是因为在某些单元格中,数据是通过生成新行输入的。例如,这是原始文件中单元格的内容。当我对原始文件进行排序时,第二行被打印在新行中,在第一行和第二行之间有3行空白

"Side effects are way to extreme. 



E-mail me if you have experianced the same things."

有什么建议吗?谢谢

您可以尝试删除问题列中的换行符

sample=pd.read_csv("sample.csv" , encoding='latin-1', skipinitialspace=True)
sample["problem_column"] = (sample["problem_column"].
                            apply(lambda x: " ".join([word for word in x.split()])
                            )

看看这是否有帮助。如果没有可复制的样品,很难理解为什么会发生这种情况

你能发布一个输出:
print(sample.shape)
?@MaxU,print(sample.shape)的输出是(229,10)@Merlin,我想可能是文件中的其他字符,比如阿拉伯语字符。是的,文件有头。@Mary,这很有趣。你能把你的CSV文件上传到某个地方,这样我们就可以重现你的问题吗?@Mary我知道内容的性质是敏感的。但是,如果这是一个需要解决的重要问题,那么创建一个生成与您观察到的问题相同的伪文件可能是值得的。这样,你就可以和我们分享了。可能只需要几行就可以重新创建问题。这将帮助你更快地得到答案。