Pandas 排序为CSV的副本,列出所有重复引用
鉴于此示例数据框包含副本,我尝试将这些副本组织到单独的csv输出文件中,以便每个具有副本的律师事务所都可以获得这些副本的列表以及与该副本关联的其他公司的名称Pandas 排序为CSV的副本,列出所有重复引用,pandas,duplicates,Pandas,Duplicates,鉴于此示例数据框包含副本,我尝试将这些副本组织到单独的csv输出文件中,以便每个具有副本的律师事务所都可以获得这些副本的列表以及与该副本关联的其他公司的名称 Client SSN Law Firm Jones 1111 A Jones 1111 B Smith 2222 A Smith 2222 C Williams 3333 B Jones 3333
Client SSN Law Firm
Jones 1111 A
Jones 1111 B
Smith 2222 A
Smith 2222 C
Williams 3333 B
Jones 3333 C
预期CSV输出:
“律师事务所A.csv”
Client SSN Law Firm
Jones 1111 Law Firm A
Jones 1111 Law Firm B
Smith 2222 Law Firm A
Smith 2222 Law Firm C
“律师事务所B.csv”
Client SSN Law Firm
Jones 1111 Law Firm A
Jones 1111 Law Firm B
Williams 3333 Law Firm B
Williams 3333 Law Firm C
我尝试按公司对整个工作簿进行排序,但仅保存与特定公司关联的行不允许保存,该公司的任何客户也与任何其他公司关联。这就是我的问题。即使是将我的总体数据转换成这种格式,也是因为转换、数据透视表和重新索引,呵呵,只是大量的陶器数据。由
律师事务所过滤,并用于生成的SSN
:
df[df["SSN"].isin(df[df['Law Firm']=="A"]["SSN"])]
好极了我是从错误的角度看待这件事的,接触总是有帮助的。谢谢你的解决方案。工作非常完美,为我解决了一个巨大的问题。