Python 如何组合多个输入数据集(dataframe)?
我有多个数据集,希望将这些行合并到一个数据集中,以便适合分类器。是否有一种很好的方法来组合输入数据集 我的数据由股票市场的历史价值组成——我想使用完整的数据只适合一个分类器 如果我要创建一个大表,那么每个数据集的结尾和开头都会有问题 例如,将使用列表中第一个库存的最后几天,以列表中第二个库存的开始训练分类器 也许我应该在将所有数据连接到一个数据集之前对每个数据集进行规范化Python 如何组合多个输入数据集(dataframe)?,python,pandas,dataframe,dataset,Python,Pandas,Dataframe,Dataset,我有多个数据集,希望将这些行合并到一个数据集中,以便适合分类器。是否有一种很好的方法来组合输入数据集 我的数据由股票市场的历史价值组成——我想使用完整的数据只适合一个分类器 如果我要创建一个大表,那么每个数据集的结尾和开头都会有问题 例如,将使用列表中第一个库存的最后几天,以列表中第二个库存的开始训练分类器 也许我应该在将所有数据连接到一个数据集之前对每个数据集进行规范化 usr回答:与训练分类器相关的所有历史数据都已在列中-因此-追加所有行是可以的,不会对不同股票/数据集的第一天和最后一天造成
usr回答:与训练分类器相关的所有历史数据都已在列中-因此-追加所有行是可以的,不会对不同股票/数据集的第一天和最后一天造成问题如果您希望将数据帧合并为一个,您可以使用以下选项:
- 您可以使用
.append()
df=df1.append(df2,忽略索引=True)
- 您也可以使用
。使用concat可以连接两个以上的数据帧.concat()
df=pd.concat([df1,df2],忽略索引=True)
这里有更多的信息和示例:两个数据集之间的公共“主键”是什么?当你说“组合”时,你的意思是你想要数据帧的并集(行)还是连接(列)?日期-但我在寻找模式。因此,关键不那么重要。重要的是最后X天的行为-当一只股票的最后X天到下一只股票的前X天时,我遇到了一个问题,我想合并所有行(追加)是的。我明白我的问题了。现在我明白了。是的,但是没有必要。你是对的-所有与机器学习相关的历史数据都已经在列中了-因此-添加所有行将解决这个问题。第一天和最后一天与问题无关。我误解了机器学习科学中的科学