Python 根据另一个df中的信息,在另一个df中添加一个新列
他说我必须标记文件,例如: file1.txtPython 根据另一个df中的信息,在另一个df中添加一个新列,python,pandas,Python,Pandas,他说我必须标记文件,例如: file1.txt Seqname1 Seqname2 Seq1(+) SeqA Seq2(-) SeqA Seq3(+) SeqB Seq2(-) SeqC Seq8(-) SeqY Seq8(-) SeqH Seq10(+) SeqK Clustername Names Cluster1 SeqA Cluster1 Seq1(+) Cluster1 SeqC Cluster1 Seq2(-) Cluster1 Seq3(+) Clu
Seqname1 Seqname2
Seq1(+) SeqA
Seq2(-) SeqA
Seq3(+) SeqB
Seq2(-) SeqC
Seq8(-) SeqY
Seq8(-) SeqH
Seq10(+) SeqK
Clustername Names
Cluster1 SeqA
Cluster1 Seq1(+)
Cluster1 SeqC
Cluster1 Seq2(-)
Cluster1 Seq3(+)
Cluster1 SeqB
Cluster1 SeqG
Cluster2 Seq8(-)
Cluster2 SeqY
Cluster2 SeqH
Cluster3 Seq10(+)
Cluster3 SeqK
file2.txt
Seqname1 Seqname2
Seq1(+) SeqA
Seq2(-) SeqA
Seq3(+) SeqB
Seq2(-) SeqC
Seq8(-) SeqY
Seq8(-) SeqH
Seq10(+) SeqK
Clustername Names
Cluster1 SeqA
Cluster1 Seq1(+)
Cluster1 SeqC
Cluster1 Seq2(-)
Cluster1 Seq3(+)
Cluster1 SeqB
Cluster1 SeqG
Cluster2 Seq8(-)
Cluster2 SeqY
Cluster2 SeqH
Cluster3 Seq10(+)
Cluster3 SeqK
如果该元素具有(+)
或(-)
,则首先为名称中的每个元素签入file2.txt
,然后检查其相应的Clustername
,然后进入file1.txt
并在Clustername
列添加相应的Clustername
。
例如,这里有一个Seq1(+),它的Clustername是Cluster1
,然后我在file1.txt
中查找存在Seqname1
的行,并将Cluster1
添加到Clustername列中
因此,最后我应该得到如下结果:
Clustername Seqname1 Seqname2
Cluster1 Seq1(+) SeqA
Cluster1 Seq2(-) SeqA
Cluster1 Seq3(+) SeqB
Cluster1 Seq2(-) SeqC
Cluster2 Seq8(-) SeqY
Cluster2 Seq8(-) SeqH
Cluster3 Seq10(+) SeqK
有人有使用python和pandas的想法吗 首先读取文件
df1=pd.read_csv('your directory path/file1.txt', sep=" ")
df2=pd.read_csv('your directory path/file2.txt', sep=" ")
然后,
我们可以使用检查包含(+)
或(-)
的行。我们可以使用性能a,然后使用:
首先读取文件
df1=pd.read_csv('your directory path/file1.txt', sep=" ")
df2=pd.read_csv('your directory path/file2.txt', sep=" ")
然后,
我们可以使用检查包含(+)
或(-)
的行。我们可以使用性能a,然后使用:
我很乐意帮忙!我有另一个问题与同样的问题。也许你会有解决办法?完成!!检查一下我很乐意帮忙!我有另一个问题与同样的问题。也许你会有解决办法?完成!!检查一下