Python——按列中的值在csv/DataFrame中重复行
我想按照标题为“Mstg”的列中的编号重复csv/DataFrame中的行。输出应该是一个csv文件,大约有0.5M行(太大了!)。 csv文件有以下列:“年”、“月”、“小时”、“价格1”、“价格2”…“Mstg”、“GW”。列中的所有字段都标识为数字(浮点数或整数) 我尝试了以下方法,但不起作用。可能是因为我希望重复行的列或列中的数字无法识别吗Python——按列中的值在csv/DataFrame中重复行,python,python-3.x,pandas,numpy,Python,Python 3.x,Pandas,Numpy,我想按照标题为“Mstg”的列中的编号重复csv/DataFrame中的行。输出应该是一个csv文件,大约有0.5M行(太大了!)。 csv文件有以下列:“年”、“月”、“小时”、“价格1”、“价格2”…“Mstg”、“GW”。列中的所有字段都标识为数字(浮点数或整数) 我尝试了以下方法,但不起作用。可能是因为我希望重复行的列或列中的数字无法识别吗 import pandas as pd import numpy as np project = pd.DataFrame.from_csv("p
import pandas as pd
import numpy as np
project = pd.DataFrame.from_csv("path",header=0, sep=',')
#change columns names "Mstg" and "GW" to integers
cols1 = ['Mstg']
cols2 = ['GW']
project[cols1] = project[cols1].applymap(np.int64)
project[cols2] = project[cols2].applymap(np.int64)
#repeat rows by number in Mstg column
project_expanded =project.loc[np.repeat(project.index.values,project.Mstg)]
当我运行pd.DataFrame.descripe(project_expanded)时,控制台不会显示任何内容。注意,代码一直工作到最后一行。我解决了这个问题。我的csv文件没有正确索引,因此np.repeat函数不起作用。我使用df2=df.reset_index()重置了索引,最后一行代码终于成功了!注意,代码一直工作到最后一行。我解决了这个问题。我的csv文件没有正确索引,因此np.repeat函数不起作用。我使用df2=df.reset_index()重置了索引,最后一行代码终于成功了!