Python 3.x Azure机器学习Studio中CSV文件中包含逗号的字符串数据的列分隔不准确_Python 3.x_Azure Machine Learning Studio_Kaggle_Email Parsing

Python 3.x Azure机器学习Studio中CSV文件中包含逗号的字符串数据的列分隔不准确

python-3.x

Python 3.x Azure机器学习Studio中CSV文件中包含逗号的字符串数据的列分隔不准确,python-3.x,azure-machine-learning-studio,kaggle,email-parsing,Python 3.x,Azure Machine Learning Studio,Kaggle,Email Parsing,我在Azure ML Studio中的实验中使用了中的前100行，但是保存的Dataset对象中填充了奇数的4.8K行，而不是100行。那一定是因为这个问题，我理解但是，在Python项目本地和/或Azure ML Jupyter笔记本中使用相同的数据集（从ML Studio导入的相同数据集-未单独导入Jupyter笔记本），可以正确读取行数，进一步的逻辑也可以正常工作 Jupyter示例： from azureml import Workspace ws = Workspace() ds =

我在Azure ML Studio中的实验中使用了中的前100行，但是保存的Dataset对象中填充了奇数的4.8K行，而不是100行。那一定是因为这个问题，我理解

但是，在Python项目本地和/或Azure ML Jupyter笔记本中使用相同的数据集（从ML Studio导入的相同数据集-未单独导入Jupyter笔记本），可以正确读取行数，进一步的逻辑也可以正常工作

Jupyter示例：

from azureml import Workspace
ws = Workspace()
ds = ws.datasets['The Enron Email Dataset (Minimal)']
emails_df = ds.to_dataframe()

本地示例：

import pandas as pd
emails_df = pd.read_csv('C:/enron-email-dataset/emails.csv', nrows=100)

下面是Azure ML Studio中数据集可视化的外观

很明显，当它从保存的数据集移动到一个实验中时，它会变得一团糟，但我的问题是——解决这个问题的最佳方法是什么？也许在我的Python代码中从Azure BLOB存储调用dataset

编辑1:从CSV文件中删除逗号也没有帮助。该数据集在Jupyter和本地都运行良好，但添加到实验中时，它看起来一团糟

编辑2:删除回车符导致数据集在实验中被正确可视化，但这打破了Python代码中进一步的文本预处理逻辑（）。我可以修改它，使其能够在不同的环境中工作。这可能是最好的了。