Python 熊猫:合并或联接返回错误的数据帧
我想在Python中合并或加入两个数据帧: “数据”: 以及数据帧“逐字记录”: 我想通过主键Python 熊猫:合并或联接返回错误的数据帧,python,mysql,pandas,merge,Python,Mysql,Pandas,Merge,我想在Python中合并或加入两个数据帧: “数据”: 以及数据帧“逐字记录”: 我想通过主键shortcontentid左键连接这些帧,这是两个帧的公用键。正如您所看到的,该操作只包括将逐字数据帧中的句子列添加到数据数据帧中。 我做了一个经典的合并: table = data.merge(verbatims, on='shortcontentid', how = "left") 但代码无法工作或返回错误的数据帧。例如,如果我在表上打印,我将获得逐字的值,但不会获得数据的值。 以下是一个例子
shortcontentid
左键连接这些帧,这是两个帧的公用键。正如您所看到的,该操作只包括将逐字数据帧中的句子
列添加到数据
数据帧中。
我做了一个经典的合并:
table = data.merge(verbatims, on='shortcontentid', how = "left")
但代码无法工作或返回错误的数据帧。例如,如果我在表
上打印,我将获得逐字
的值,但不会获得数据
的值。
以下是一个例子:
nonusable 2 or bigger sentences
0 1 qualite NaN
如你所见,句子
中填充了NaN,而我想看看我的实际句子
*NB : I imported my data from `pandas.csv` :
data = pandas.read_csv("data crowdflower.csv", sep=";", header=0, engine='python')*
在这些表上进行干净合并/联接的最佳方法是什么
谢谢 以以下形式尝试:
table = pandas.merge(data, verbatims, how='inner', on='shortcontentid')
print (table)
我已经部分理解了我的问题<
verbatims
中shortcontentid的code>dtype是一个整数,而数据中它是一个对象。因此,我必须将数据类型从object转换为int。我尝试了:
pandas.to_numeric(data)
但它返回以下错误:
arg must be a list, tuple, 1-d array, or Series
因此,我仍然被阻止。通过发布原始样本数据、创建dfs的代码以及错误合并的外观来解释什么不起作用。对,我编辑了我的帖子。但是,我可以发布示例数据。内部合并将不起作用,因为它只返回带有我列名的空数据框:空数据框列:[shortcontentid、小时计时、不相关、其他、邮差挑战、邮差关系、质量、邮差工作、总计g�N�ral,结果,不可用,2或更大,单位id,创建日期,更新日期,品牌,句子]索引:[]
pandas.to_numeric(data)
arg must be a list, tuple, 1-d array, or Series