Python 3.x Azure机器学习Studio中CSV文件中包含逗号的字符串数据的列分隔不准确

Python 3.x Azure机器学习Studio中CSV文件中包含逗号的字符串数据的列分隔不准确,python-3.x,azure-machine-learning-studio,kaggle,email-parsing,Python 3.x,Azure Machine Learning Studio,Kaggle,Email Parsing,我在Azure ML Studio中的实验中使用了中的前100行,但是保存的Dataset对象中填充了奇数的4.8K行,而不是100行。那一定是因为这个问题,我理解 但是,在Python项目本地和/或Azure ML Jupyter笔记本中使用相同的数据集(从ML Studio导入的相同数据集-未单独导入Jupyter笔记本),可以正确读取行数,进一步的逻辑也可以正常工作 Jupyter示例: from azureml import Workspace ws = Workspace() ds =

我在Azure ML Studio中的实验中使用了中的前100行,但是保存的Dataset对象中填充了奇数的4.8K行,而不是100行。那一定是因为这个问题,我理解

但是,在Python项目本地和/或Azure ML Jupyter笔记本中使用相同的数据集(从ML Studio导入的相同数据集-未单独导入Jupyter笔记本),可以正确读取行数,进一步的逻辑也可以正常工作

Jupyter示例:

from azureml import Workspace
ws = Workspace()
ds = ws.datasets['The Enron Email Dataset (Minimal)']
emails_df = ds.to_dataframe()
本地示例:

import pandas as pd
emails_df = pd.read_csv('C:/enron-email-dataset/emails.csv', nrows=100)
下面是Azure ML Studio中数据集可视化的外观

很明显,当它从保存的数据集移动到一个实验中时,它会变得一团糟,但我的问题是——解决这个问题的最佳方法是什么?也许在我的Python代码中从Azure BLOB存储调用dataset

编辑1:从CSV文件中删除逗号也没有帮助。该数据集在Jupyter和本地都运行良好,但添加到实验中时,它看起来一团糟

编辑2:删除回车符导致数据集在实验中被正确可视化,但这打破了Python代码中进一步的文本预处理逻辑()。我可以修改它,使其能够在不同的环境中工作。这可能是最好的了。