Python 在一列中拆分多个字段_Python_File_Dataframe

Python 在一列中拆分多个字段

python file dataframe

Python 在一列中拆分多个字段,python,file,dataframe,Python,File,Dataframe,我有以下的文本 04/20/2009; 04/20/09; 4/20/09; 4/3/09 Mar-20-2009; Mar 20, 2009; March 20, 2009; Mar. 20, 2009; Mar 20 2009; 20 Mar 2009; 20 March 2009; 20 Mar. 2009; 20 March, 2009 Mar 20th, 2009; Mar 21st, 2009; Mar 22nd, 2009 Feb 2009; Sep 2009; Oct 2010

我有以下的文本

04/20/2009; 04/20/09; 4/20/09; 4/3/09
Mar-20-2009; Mar 20, 2009; March 20, 2009; Mar. 20, 2009; Mar 20 2009;
20 Mar 2009; 20 March 2009; 20 Mar. 2009; 20 March, 2009
Mar 20th, 2009; Mar 21st, 2009; Mar 22nd, 2009
Feb 2009; Sep 2009; Oct 2010
6/2008; 12/2009
2009; 2010

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

我的想法是将所有日期替换为单个格式，但我需要将所有日期设置为单个pd.Series列对象

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

这就是我目前正在做的

with open('dates.txt') as file:
    for row in file:
        doc.append(line)

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

我想要像这样的东西

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

要从该文本文件创建序列，请执行以下操作

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

with open(file) as f:
    txt = f.read().replace("\n","")
series = pd.Series(txt.split(";"))

要从该文本文件创建序列，请执行以下操作

1 0          Mar-20-2009
  1         Mar 20, 2009
  2       March 20, 2009
  3        Mar. 20, 2009
  4          Mar 20 2009
2 0          20 Mar 2009
  1        20 March 2009
  2         20 Mar. 2009
  3       20 March, 2009
3 0       Mar 20th, 2009
  1       Mar 21st, 2009
  2       Mar 22nd, 2009
4 0             Feb 2009
  1             Sep 2009
  2             Oct 2010

with open(file) as f:
    txt = f.read().replace("\n","")
series = pd.Series(txt.split(";"))

你能发布预期输出吗？如果你想解析日期，使其具有相同的格式，你可以使用前天我发布的代码来解决类似的问题：你能发布预期输出吗？如果你想解析日期，使其具有相同的格式，您可以使用前天我发布的关于类似问题的代码：