Python 根据另一个df中的信息,在另一个df中添加一个新列

Python 根据另一个df中的信息,在另一个df中添加一个新列,python,pandas,Python,Pandas,他说我必须标记文件,例如: file1.txt Seqname1 Seqname2 Seq1(+) SeqA Seq2(-) SeqA Seq3(+) SeqB Seq2(-) SeqC Seq8(-) SeqY Seq8(-) SeqH Seq10(+) SeqK Clustername Names Cluster1 SeqA Cluster1 Seq1(+) Cluster1 SeqC Cluster1 Seq2(-) Cluster1 Seq3(+) Clu

他说我必须标记文件,例如:

file1.txt

Seqname1 Seqname2
Seq1(+) SeqA
Seq2(-) SeqA
Seq3(+) SeqB
Seq2(-) SeqC
Seq8(-) SeqY
Seq8(-) SeqH
Seq10(+) SeqK
Clustername Names
Cluster1    SeqA
Cluster1    Seq1(+)
Cluster1    SeqC
Cluster1    Seq2(-)
Cluster1    Seq3(+)
Cluster1    SeqB
Cluster1    SeqG
Cluster2    Seq8(-)
Cluster2    SeqY
Cluster2    SeqH
Cluster3    Seq10(+)
Cluster3    SeqK
file2.txt

Seqname1 Seqname2
Seq1(+) SeqA
Seq2(-) SeqA
Seq3(+) SeqB
Seq2(-) SeqC
Seq8(-) SeqY
Seq8(-) SeqH
Seq10(+) SeqK
Clustername Names
Cluster1    SeqA
Cluster1    Seq1(+)
Cluster1    SeqC
Cluster1    Seq2(-)
Cluster1    Seq3(+)
Cluster1    SeqB
Cluster1    SeqG
Cluster2    Seq8(-)
Cluster2    SeqY
Cluster2    SeqH
Cluster3    Seq10(+)
Cluster3    SeqK
如果该元素具有
(+)
(-)
,则首先为
名称中的每个元素签入
file2.txt
,然后检查其相应的
Clustername
,然后进入
file1.txt
并在
Clustername
列添加相应的
Clustername
。 例如,这里有一个Seq1(+),它的Clustername是
Cluster1
,然后我在
file1.txt
中查找存在
Seqname1
的行,并将
Cluster1
添加到Clustername列中

因此,最后我应该得到如下结果:

Clustername Seqname1 Seqname2
Cluster1 Seq1(+) SeqA
Cluster1 Seq2(-) SeqA
Cluster1 Seq3(+) SeqB
Cluster1 Seq2(-) SeqC
Cluster2 Seq8(-) SeqY
Cluster2 Seq8(-) SeqH
Cluster3 Seq10(+) SeqK

有人有使用python和pandas的想法吗

首先读取文件

df1=pd.read_csv('your directory path/file1.txt', sep=" ")
df2=pd.read_csv('your directory path/file2.txt', sep=" ")
然后,

我们可以使用检查包含
(+)
(-)
的行。我们可以使用性能a,然后使用:



首先读取文件

df1=pd.read_csv('your directory path/file1.txt', sep=" ")
df2=pd.read_csv('your directory path/file2.txt', sep=" ")
然后,

我们可以使用检查包含
(+)
(-)
的行。我们可以使用性能a,然后使用:



我很乐意帮忙!我有另一个问题与同样的问题。也许你会有解决办法?完成!!检查一下我很乐意帮忙!我有另一个问题与同样的问题。也许你会有解决办法?完成!!检查一下