Python 处理XML(文本)格式的TensorFlow记录

Python 处理XML(文本)格式的TensorFlow记录,python,tensorflow,Python,Tensorflow,我想使用TensorFlow来处理作为正确记录的XML字符串。我很想了解如何构造解析每个TFR记录的代码。有一组输入规则和数据类型映射应用于每个TFRecord记录以生成输出TFRecord 输入记录示例: <PLANT><COMMON>Shooting Star</COMMON><BOTANICAL>Dodecatheon</BOTANICAL><ZONE>Annual</ZONE><LIGHT>M

我想使用TensorFlow来处理作为正确记录的XML字符串。我很想了解如何构造解析每个TFR记录的代码。有一组输入规则和数据类型映射应用于每个TFRecord记录以生成输出TFRecord

输入记录示例:

<PLANT><COMMON>Shooting Star</COMMON><BOTANICAL>Dodecatheon</BOTANICAL><ZONE>Annual</ZONE><LIGHT>Mostly Shady</LIGHT><PRICE>$8.60</PRICE><EXTREF><REF1><ID>608</ID><TYPE>LOOKUP</TYPE><REF2><ID>703</ID><TYPE>STD</TYPE></EXTREF><AVAILABILITY>051399</AVAILABILITY></PLANT>
Shooting Star,8.60,703,51399
如何将此逻辑添加到图形中,使其在执行时生成输出记录?我最初的想法是,我需要将映射逻辑转换为一系列tf.ops…

我相信这将对您非常有帮助。它指定TFRecord所需的确切格式,并提供将自己的数据集转换为TFRecord文件的代码


但是,该链接没有提到XML文件。它只讨论了如何创建tf_示例并将其转换为tf记录。这实际上是退一步,向您展示如何将XML文件转换为tf_示例。请注意,它需要一些修改以满足您的需要,因为它使用的是牛津宠物数据集。

这两个链接现在都不可用。