如何读取多个文本文件并提取具有某些条件的数据,然后基于python中的另一个查找表添加列
我是python的初学者,我尝试使用python打开多个文本文件(总共5g数据),只选择具有c=“string111”条件的行,然后尝试根据查找表(csv文件)添加另一列,最后编写cvs或excel文件 例如:这些文件看起来像:如何读取多个文本文件并提取具有某些条件的数据,然后基于python中的另一个查找表添加列,python,excel,csv,Python,Excel,Csv,我是python的初学者,我尝试使用python打开多个文本文件(总共5g数据),只选择具有c=“string111”条件的行,然后尝试根据查找表(csv文件)添加另一列,最后编写cvs或excel文件 例如:这些文件看起来像: a b c d string1 string11 string111 678 string2 string22 string222 890 string3 string33 string333 2739 我有另一个查找csv文件: a b c e string1 s
a b c d
string1 string11 string111 678
string2 string22 string222 890
string3 string33 string333 2739
我有另一个查找csv文件:
a b c e
string1 string11 string111 string1111
string2 string22 string222 string2222
string3 string33 string333 string1111
最后,我希望得到如下csv文件:
e d
string1111 98032 (this is aggregate data)
string2222 677...
由于数据太大,很难使用excel进行处理。只是想知道解决这个简单问题的python代码
谢谢大家! 实际上,Excel完全能够处理这个问题。在Excel 2010和2013中,您可以使用免费电源查询外接程序,在Excel 2016中,它在数据功能区上称为“获取和转换” 为查找CSV创建查询,并仅将其作为连接加载 然后为其中一个CSV文件创建一个查询,应用过滤器,然后与查找CSV合并,并执行您想要执行的任何其他操作 结果可以加载到工作表中并保存为CSV 只需单击功能区图标即可完成上述操作,并且可以在高级编辑器中修改Power Query语言“M”中生成的脚本