Machine learning 如何在tensorflow中构建基于字符的seq2seq模型

Machine learning 如何在tensorflow中构建基于字符的seq2seq模型,machine-learning,neural-network,tensorflow,recurrent-neural-network,Machine Learning,Neural Network,Tensorflow,Recurrent Neural Network,需要对tensorflow中现有的seq2seq模型进行哪些更改,以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务?对于预测性ext应用程序来说,这是一个好的配置吗 此任务可能需要修改以下函数签名: def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell, num_encoder_symbols, num_decoder_symbols,

需要对tensorflow中现有的seq2seq模型进行哪些更改,以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务?对于预测性ext应用程序来说,这是一个好的配置吗

此任务可能需要修改以下函数签名:

def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell,
                          num_encoder_symbols, num_decoder_symbols,
                          output_projection=None, feed_previous=False,
                          dtype=dtypes.float32, scope=None):

除了减少输入输出词汇表外,还需要进行哪些其他参数更改来实现这样的字符级seq2seq模型?

我认为,如果您通过空白分隔训练来准备输入数据文件,您可以在tensorflow中使用现有的seq2seq模型,而无需对基于字符的单元进行任何代码更改例如:

The quick brown fox.
变成:

T h e _SPACE_ q u i c k _SPACE_ b r o w n _SPACE_ f o x .
然后,你的词汇自然会变成字符而不是单词

您可以试验vocab大小、嵌入大小、消除嵌入层等,以了解什么最适合您的数据