Google cloud dataflow FileIO.read()性能非常差
我正在尝试使用FileIO读取1.6 TB的BZIP2文件(因为TextIO由于一些有关拆分的问题而无法读取它们),但性能非常差,实际上读取速度为5个元素/秒 read()相对来说要快得多,但不幸的是我无法使用它Google cloud dataflow FileIO.read()性能非常差,google-cloud-dataflow,apache-beam,Google Cloud Dataflow,Apache Beam,我正在尝试使用FileIO读取1.6 TB的BZIP2文件(因为TextIO由于一些有关拆分的问题而无法读取它们),但性能非常差,实际上读取速度为5个元素/秒 read()相对来说要快得多,但不幸的是我无法使用它 在这种情况下我该怎么办?有什么方法可以提高FileIO的性能吗?@jkff我想你可以帮助兄弟!!!你看了吗?他似乎对你同样的问题给出了一些有趣的暗示。我明白这就是为什么你“打电话”给他?非常感谢@SergiMuñoz。这能回答你的问题吗@塞尔吉穆尼奥斯:是的。
在这种情况下我该怎么办?有什么方法可以提高FileIO的性能吗?@jkff我想你可以帮助兄弟!!!你看了吗?他似乎对你同样的问题给出了一些有趣的暗示。我明白这就是为什么你“打电话”给他?非常感谢@SergiMuñoz。这能回答你的问题吗@塞尔吉穆尼奥斯:是的。