Tensorflow 按设定比率混合数据集
在tensorlfow数据集中,如何混合2个数据集,从原始数据中提取75%的数据集,从扩展数据中提取25%的数据集Tensorflow 按设定比率混合数据集,tensorflow,tensorflow-datasets,tensorflow-estimator,Tensorflow,Tensorflow Datasets,Tensorflow Estimator,在tensorlfow数据集中,如何混合2个数据集,从原始数据中提取75%的数据集,从扩展数据中提取25%的数据集 d = tf.data.Dataset.list_files("raw_data/")\ .flat_map(tf.data.TFRecordDataset) ad = tf.data.Dataset.list_files("augmented_data/")\ .flat_map(tf.data.TFRecordDataset) 问题是您不能在dataset对象
d = tf.data.Dataset.list_files("raw_data/")\
.flat_map(tf.data.TFRecordDataset)
ad = tf.data.Dataset.list_files("augmented_data/")\
.flat_map(tf.data.TFRecordDataset)
问题是您不能在dataset对象上使用
len()
,因此有时在迭代整个历元之前很难知道示例的确切数量。但您可以使用take
和skip
方法来近似计算
train_dataset = dataset.take(number_examples_for_train)
test_dataset = dataset.skip(number_examples_for_train)
这些方法是彼此的直接替代方法。