Pandas 排序为CSV的副本,列出所有重复引用

Pandas 排序为CSV的副本,列出所有重复引用,pandas,duplicates,Pandas,Duplicates,鉴于此示例数据框包含副本,我尝试将这些副本组织到单独的csv输出文件中,以便每个具有副本的律师事务所都可以获得这些副本的列表以及与该副本关联的其他公司的名称 Client SSN Law Firm Jones 1111 A Jones 1111 B Smith 2222 A Smith 2222 C Williams 3333 B Jones 3333

鉴于此示例数据框包含副本,我尝试将这些副本组织到单独的csv输出文件中,以便每个具有副本的律师事务所都可以获得这些副本的列表以及与该副本关联的其他公司的名称

Client       SSN     Law Firm
Jones        1111     A
Jones        1111     B
Smith        2222     A
Smith        2222     C
Williams     3333     B
Jones        3333     C
预期CSV输出:

“律师事务所A.csv”

Client       SSN      Law Firm

Jones        1111     Law Firm A
Jones        1111     Law Firm B
Smith        2222     Law Firm A
Smith        2222     Law Firm C
“律师事务所B.csv”

Client          SSN      Law Firm

Jones           1111     Law Firm A
Jones           1111     Law Firm B
Williams        3333     Law Firm B
Williams        3333     Law Firm C

我尝试按公司对整个工作簿进行排序,但仅保存与特定公司关联的行不允许保存,该公司的任何客户也与任何其他公司关联。这就是我的问题。即使是将我的总体数据转换成这种格式,也是因为转换、数据透视表和重新索引,呵呵,只是大量的陶器数据。

律师事务所过滤
,并用于生成的
SSN

df[df["SSN"].isin(df[df['Law Firm']=="A"]["SSN"])]

好极了我是从错误的角度看待这件事的,接触总是有帮助的。谢谢你的解决方案。工作非常完美,为我解决了一个巨大的问题。