Machine learning 如何在tensorflow中构建基于字符的seq2seq模型_Machine Learning_Neural Network_Tensorflow_Recurrent Neural Network

Machine learning 如何在tensorflow中构建基于字符的seq2seq模型

machine-learning neural-network tensorflow

Machine learning 如何在tensorflow中构建基于字符的seq2seq模型,machine-learning,neural-network,tensorflow,recurrent-neural-network,Machine Learning,Neural Network,Tensorflow,Recurrent Neural Network,需要对tensorflow中现有的seq2seq模型进行哪些更改，以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务？对于预测性ext应用程序来说，这是一个好的配置吗此任务可能需要修改以下函数签名： def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell, num_encoder_symbols, num_decoder_symbols,

需要对tensorflow中现有的seq2seq模型进行哪些更改，以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务？对于预测性ext应用程序来说，这是一个好的配置吗

此任务可能需要修改以下函数签名：

def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell,
                          num_encoder_symbols, num_decoder_symbols,
                          output_projection=None, feed_previous=False,
                          dtype=dtypes.float32, scope=None):

除了减少输入输出词汇表外，还需要进行哪些其他参数更改来实现这样的字符级seq2seq模型？

我认为，如果您通过空白分隔训练来准备输入数据文件，您可以在tensorflow中使用现有的seq2seq模型，而无需对基于字符的单元进行任何代码更改例如：

The quick brown fox.

变成：

T h e _SPACE_ q u i c k _SPACE_ b r o w n _SPACE_ f o x .

然后，你的词汇自然会变成字符而不是单词

您可以试验vocab大小、嵌入大小、消除嵌入层等，以了解什么最适合您的数据