测试一些基本示例,以更好地理解TensorFlow中的.padded_批

测试一些基本示例,以更好地理解TensorFlow中的.padded_批,tensorflow,Tensorflow,我有一个非常简单的数据来测试我对tf.padded_batch用法的理解 文本文件另存为.txt格式: test = "I use tensorflow for this data\n I will be testing\n The current tensorflow data 请标记我使用的是tensorflow 2.0版,因此我不需要使用tf.Session来初始化变量 dataset = tf.data.TextLineDataset("test.txt") dataset = dat

我有一个非常简单的数据来测试我对tf.padded_batch用法的理解

文本文件另存为.txt格式:

test = "I use tensorflow for this data\n
I will be testing\n
The current tensorflow data
请标记我使用的是tensorflow 2.0版,因此我不需要使用tf.Session来初始化变量

dataset = tf.data.TextLineDataset("test.txt")
dataset = dataset.map(lambda string: tf.string_split([string]).values)
dataset = dataset.padded_batch(2)

for x in dataset:
    print(x.numpy())
我收到的错误:

TypeError: padded_batch() missing 1 required positional argument: 'padded_shapes'
预期产出:

[[b'I' b'use' b'tensorflow' b'for' b'this' b'data']
 [b'I' b'will' b'be' b'testing' b'unknown' b'unknown']]
[[b'The' b'current' b'tensorflow' b'data' b'unknown' b'unknown']]

我应该如何配置填充的_形状和填充的_值?我希望通过为每个空元素插入“unknown”,使张量的长度相同。(上面显示了我的预期结果,这可能有点混淆。)

请注意
tf.data.Dataset().Dataset.padded_batch
需要输入的形状,在您的情况下,因为您希望填充值是
“未知”
您将使用的填充值。下面是你想要使用的代码

dataset = tf.data.TextLineDataset("test.txt")
dataset = dataset.map(lambda string: tf.string_split([string]).values)
dataset = dataset.padded_batch(3, padded_shapes=[None], padding_values="unknown")

for x in dataset:
    print(x.numpy())

# [[b'I' b'use' b'tensorflow' b'for' b'this' b'data']
#  [b'I' b'will' b'be' b'testing' b'unknown' b'unknown']
#  [b'The' b'current' b'tensorflow' b'data' b'unknown' b'unknown']]

请注意,
tf.data.Dataset().Dataset.padded_batch
需要输入的形状,在您的情况下,因为您希望填充值是
“未知”
您将使用的填充值。下面是你想要使用的代码

dataset = tf.data.TextLineDataset("test.txt")
dataset = dataset.map(lambda string: tf.string_split([string]).values)
dataset = dataset.padded_batch(3, padded_shapes=[None], padding_values="unknown")

for x in dataset:
    print(x.numpy())

# [[b'I' b'use' b'tensorflow' b'for' b'this' b'data']
#  [b'I' b'will' b'be' b'testing' b'unknown' b'unknown']
#  [b'The' b'current' b'tensorflow' b'data' b'unknown' b'unknown']]

非常感谢你,先生。现在我明白了,非常感谢你,先生。现在我明白了