用什么方法对encoderdecoder模型进行训练

更新时间2018-07-21 00:44:10

文本并不像图像那样有天然的格子结构，它更倾向于多个词构成序列来组成句子，以及多个句子构成序列组成一个段落。因此基于序列的模型诸如 recurrent neural network, LSTM 等比较适合。

如果是考虑使用 Stanford Parser 这样的句法树来生成句子表示，可以使用 recursive neural network 或者 tree-structure RNN/LSTM.

而具体到各种文本的任务诸如情感/词性分类，机器翻译或者语言生成模型，常见的模式有下面几种：

使用 RNN/LSTM 等去 model 一个词序列组成的句子，从最后一个词得出的隐状态来表示整个句子的信息，然后用 softmax 可以做分类任务。

用什么方法对encoder decoder模型进行训练

如果是机器翻译任务，则是训练两个 RNN/LSTM, 一个作为 encoder, 另一个做 decoder。大体思想是根据编码好的源语料的句子表示，在解码时，每次根据上次出现的词来预测接下来会出现的词概率分布，然后每次都取那个概率最大的词作为翻译出的当前词，最后直到预测出了停止符（句号）为止。根据已有的大量预料去训练这样一个 encoder-decoder，就可以得到一个翻译模型。

用什么方法对encoder decoder模型进行训练

语言生成的方法与上文类似。

根据需要，再去添加 Bi-RNN/LSTM, stack-LSTM, 以及取每次产生的隐状态均值作为句子表示，或者加入 attention-based model 等改进方法。

上一篇：哪位英语高手能帮咱们把《wecan`tstop》歌词谐音写出来呀？谢谢了！谢谢！

下一篇：请问gladyoucom这歌名的意思是“很高兴你能来”还是“高兴你来过”？