Tensorflow 按设定比率混合数据集

Tensorflow 按设定比率混合数据集,tensorflow,tensorflow-datasets,tensorflow-estimator,Tensorflow,Tensorflow Datasets,Tensorflow Estimator,在tensorlfow数据集中,如何混合2个数据集,从原始数据中提取75%的数据集,从扩展数据中提取25%的数据集 d = tf.data.Dataset.list_files("raw_data/")\ .flat_map(tf.data.TFRecordDataset) ad = tf.data.Dataset.list_files("augmented_data/")\ .flat_map(tf.data.TFRecordDataset) 问题是您不能在dataset对象

在tensorlfow数据集中,如何混合2个数据集,从原始数据中提取75%的数据集,从扩展数据中提取25%的数据集

d = tf.data.Dataset.list_files("raw_data/")\
    .flat_map(tf.data.TFRecordDataset)
ad = tf.data.Dataset.list_files("augmented_data/")\
    .flat_map(tf.data.TFRecordDataset)

问题是您不能在dataset对象上使用
len()
,因此有时在迭代整个历元之前很难知道示例的确切数量。但您可以使用
take
skip
方法来近似计算

train_dataset = dataset.take(number_examples_for_train)
test_dataset = dataset.skip(number_examples_for_train)
这些方法是彼此的直接替代方法。