Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/363.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python——按列中的值在csv/DataFrame中重复行_Python_Python 3.x_Pandas_Numpy - Fatal编程技术网

Python——按列中的值在csv/DataFrame中重复行

Python——按列中的值在csv/DataFrame中重复行,python,python-3.x,pandas,numpy,Python,Python 3.x,Pandas,Numpy,我想按照标题为“Mstg”的列中的编号重复csv/DataFrame中的行。输出应该是一个csv文件,大约有0.5M行(太大了!)。 csv文件有以下列:“年”、“月”、“小时”、“价格1”、“价格2”…“Mstg”、“GW”。列中的所有字段都标识为数字(浮点数或整数) 我尝试了以下方法,但不起作用。可能是因为我希望重复行的列或列中的数字无法识别吗 import pandas as pd import numpy as np project = pd.DataFrame.from_csv("p

我想按照标题为“Mstg”的列中的编号重复csv/DataFrame中的行。输出应该是一个csv文件,大约有0.5M行(太大了!)。 csv文件有以下列:“年”、“月”、“小时”、“价格1”、“价格2”…“Mstg”、“GW”。列中的所有字段都标识为数字(浮点数或整数)

我尝试了以下方法,但不起作用。可能是因为我希望重复行的列或列中的数字无法识别吗

import pandas as pd
import numpy as np 
project = pd.DataFrame.from_csv("path",header=0, sep=',')

#change columns names "Mstg" and "GW" to integers 
cols1 = ['Mstg']
cols2 = ['GW']
project[cols1] = project[cols1].applymap(np.int64)
project[cols2] = project[cols2].applymap(np.int64)


#repeat rows by number in Mstg column
 project_expanded =project.loc[np.repeat(project.index.values,project.Mstg)]

当我运行pd.DataFrame.descripe(project_expanded)时,控制台不会显示任何内容。

注意,代码一直工作到最后一行。我解决了这个问题。我的csv文件没有正确索引,因此np.repeat函数不起作用。我使用df2=df.reset_index()重置了索引,最后一行代码终于成功了!注意,代码一直工作到最后一行。我解决了这个问题。我的csv文件没有正确索引,因此np.repeat函数不起作用。我使用df2=df.reset_index()重置了索引,最后一行代码终于成功了!