如何在没有tensorflow的情况下在纯python中生成tfrecord文件?

如何在没有tensorflow的情况下在纯python中生成tfrecord文件?,python,tensorflow,Python,Tensorflow,有没有一种不用tensorflow在python中生成tfrecord的方法? 我想转换大数据,但我的hadoop集群无法运行tensorflow,因为glibc版本较低欢迎使用SO!你试图解决什么问题(比如搜索文件格式等)?实际上比实际困难。原则上,每个记录都是protobuf消息,每个记录又由消息组成,因此,如果可以安装协议缓冲区,构建这些消息应该很容易。问题在于TFRecord文件格式不仅如此。您可以检查,但本质上每个示例都会得到一个页眉,它是它的长度、长度的CRC、示例数据本身(序列化p

有没有一种不用tensorflow在python中生成tfrecord的方法?
我想转换大数据,但我的hadoop集群无法运行tensorflow,因为glibc版本较低

欢迎使用SO!你试图解决什么问题(比如搜索文件格式等)?实际上比实际困难。原则上,每个记录都是protobuf消息,每个记录又由消息组成,因此,如果可以安装协议缓冲区,构建这些消息应该很容易。问题在于
TFRecord
文件格式不仅如此。您可以检查,但本质上每个示例都会得到一个页眉,它是它的长度、长度的CRC、示例数据本身(序列化protobuf消息)和一个页脚,它是数据的CRC(还有可选压缩,但您可以跳过)。您还可以查看记录阅读器的来源。当然,其他选择是在其他地方制作示例,然后将它们移动到集群中,如果可能的话。谢谢您的回答。正如你所想,我在一天内成功地完成了它。它包含两个步骤:1。通过protobuf生成示例/要素类。2.组装一个TFR记录协议。