Machine learning 如何在tensorflow中构建基于字符的seq2seq模型
需要对tensorflow中现有的seq2seq模型进行哪些更改,以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务?对于预测性ext应用程序来说,这是一个好的配置吗 此任务可能需要修改以下函数签名:Machine learning 如何在tensorflow中构建基于字符的seq2seq模型,machine-learning,neural-network,tensorflow,recurrent-neural-network,Machine Learning,Neural Network,Tensorflow,Recurrent Neural Network,需要对tensorflow中现有的seq2seq模型进行哪些更改,以便我可以使用字符单位而不是现有的单词单位来执行seq2seq任务?对于预测性ext应用程序来说,这是一个好的配置吗 此任务可能需要修改以下函数签名: def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell, num_encoder_symbols, num_decoder_symbols,
def embedding_rnn_seq2seq(encoder_inputs, decoder_inputs, cell,
num_encoder_symbols, num_decoder_symbols,
output_projection=None, feed_previous=False,
dtype=dtypes.float32, scope=None):
除了减少输入输出词汇表外,还需要进行哪些其他参数更改来实现这样的字符级seq2seq模型?我认为,如果您通过空白分隔训练来准备输入数据文件,您可以在tensorflow中使用现有的seq2seq模型,而无需对基于字符的单元进行任何代码更改例如:
The quick brown fox.
变成:
T h e _SPACE_ q u i c k _SPACE_ b r o w n _SPACE_ f o x .
然后,你的词汇自然会变成字符而不是单词
您可以试验vocab大小、嵌入大小、消除嵌入层等,以了解什么最适合您的数据