带有Tensorflow实验的批处理Seq2Seq模型

带有Tensorflow实验的批处理Seq2Seq模型,tensorflow,batch-processing,distributed-computing,sequence-to-sequence,Tensorflow,Batch Processing,Distributed Computing,Sequence To Sequence,我正在尝试使用和将我在本地运行的转换为使用Tensorflow分发功能。基本特征和目标设置如下: for every input and response (translation or prompt and response): raw input -> tokenized input -> tokenized response -> raw response 注: 特征将有一个形状[桶数][桶数输入@桶大小][输入桶大小] 目标将有一个形状[桶数][响应数@桶大小]

我正在尝试使用和将我在本地运行的转换为使用Tensorflow分发功能。基本特征和目标设置如下:

for every input and response (translation or prompt and response):
  raw input -> tokenized input -> tokenized response -> raw response
注:

  • 特征将有一个形状[桶数][桶数输入@桶大小][输入桶大小]
  • 目标将有一个形状[桶数][响应数@桶大小][响应桶大小]
有几个问题:

  • 一般来说,是否建议使用实验类和估计器接口来处理此类模型
  • 我可以用实验设置训练批量大小吗?似乎
    train_步骤
    eval_步骤
    与培训和评估的迭代相关。是否有其他选项为这些步骤设置批次大小,或者实验是否在内部/自动计算批次大小
  • 我假设实验
    train\u input\u fn
    eval\u input\u fn
    可以是任何返回特征字典和目标张量的函数。在上面的例子中,我只需要一个特征张量和一个目标张量,因为我正在创建一个自定义估计器,它可以是任何形状,只要我的估计器的
    model_fn
    期望这些形状,并且可以正确地从中返回损失。这是正确的吗
  • 似乎列车图和推断图是不同的。即使是在训练时导出图形,也不能使用该图形进行推理。如果我错了,请纠正我。似乎列车图和推断图是不同的。即使是在训练时导出图形,也不能使用该图形进行推理。如果我错了,请纠正我。