Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/343.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将大型嵌套XML文件导入Python并将其转换为CSV_Python_Xml_Csv_Pandas - Fatal编程技术网

将大型嵌套XML文件导入Python并将其转换为CSV

将大型嵌套XML文件导入Python并将其转换为CSV,python,xml,csv,pandas,Python,Xml,Csv,Pandas,我有数百万行的巨大XML文件,其中包含数百个嵌套属性,我甚至无法正确提取这些属性并查看它们是什么。我需要将这些XML文件转换为Python/Pandas和类似格式的CSV文件。这里的每一个建议都是基于解决方案的,当你已经知道你的标签的名称,哪些是嵌套的,而我在本例中不知道。我需要遍历这些文件,为每个文件创建CSV,并将它们连接到一个CSV文件中。我还不确定是否需要连接,但我可能需要它。我怎样才能做到这一点?我试着使用xml.etree、数据帧和递归,但递归只在一个文件中消失,我还有20个更大的文

我有数百万行的巨大XML文件,其中包含数百个嵌套属性,我甚至无法正确提取这些属性并查看它们是什么。我需要将这些XML文件转换为Python/Pandas和类似格式的CSV文件。这里的每一个建议都是基于解决方案的,当你已经知道你的标签的名称,哪些是嵌套的,而我在本例中不知道。我需要遍历这些文件,为每个文件创建CSV,并将它们连接到一个CSV文件中。我还不确定是否需要连接,但我可能需要它。我怎样才能做到这一点?我试着使用xml.etree、数据帧和递归,但递归只在一个文件中消失,我还有20个更大的文件要处理

实际上,这些文件有多大?足够大以至于一台合理的机器无法装载它们,或者仅仅是你的机器?(注:除非可以正确存储/检索文件,否则不要让文件变得太大)。看看它是否能帮助您?只需将大文件的前几行提取到新文件中(并与这些文件一起开发您的解决方案):您可以从python或shell中执行此操作-例如
head-5-maging_file.name>manageble_file.name