神经机器翻译Networked Media Tank（NMT）

所谓的“神经网络机器翻译”（neural machine translation，NMT），就是通过使用计算机神经网络技术，利用人工智能模仿大脑神经元进行语言翻译。NMT依赖于基于短语的统计机器翻译（phrase-based statistical machine translation，PbSMT）系统。

神经机器翻译（NMT）是一种机器翻译方法，它使用人工神经网络来预测单词序列的可能性，通常在单个集成模型中对整个句子进行建模。它们仅需要传统统计机器翻译（SMT）模型所需内存的一小部分。此外，与常规翻译系统不同，神经翻译模型的所有部分都经过（端到端）联合训练，以最大化翻译性能。

NMT使用基于神经网络的技术来实现更多上下文精确的翻译，而不是一次翻译一个单词的破碎句子。使用大型人工神经网络计算单词序列的概率，NMT将完整的句子放入一个集成模型中。

NMT的神经元可以学习和收集信息，旨在模仿人类大脑的神经元，建立联系，并将输入评估为整个单元。NMT分两个阶段进行分析：编码和解码。在编码阶段，来自源语言的文本被输入到机器中，随后被分类到语言向量中。在上下文中相似的单词将被放置在可比较的单词向量中。接下来，解码阶段有效且无缝地将矢量发送到目标语言。在整个翻译过程中，技术不仅仅是翻译单词和短语; 相反，它正在翻译上下文和信息。

特点1.

NMT“学习”语言的方法和人类并不一样。NMT依赖于统计关联性（即PbSMT）。NMT出众的点也是在于其对于语句中关联性的处理，从而根据context来判断如何给出更为具体的翻译。

特点2.

看待翻译内容的角度不同。早期MT系统关注名词、词段。但这种方法在处理“long-distance dependency”的语言时就会出现问题。而NMT系统查看的是句子的整体，甚至整个段落或文章。这让NMT能对于上下文更加敏感。

特点3.

NMT采用基于词组（phase-based）的方法，因此更有利于翻译“形态丰富的语言”（morphologically rich languages），比如德语或匈牙利语。并且能够通过词语单词构成来预测词性。

特点4.

NMT可以跨多种语言进行外推，填补训练数据的空白（zero-shot translation）。比如在MT训练中已有英语<>德语和英语<>中文的语言对，但是没有德语<>中文的语言对，那么，在没有事先训练的情况下，NMT能自动完成新语言对翻译。虽然结果可能不如训练后的成绩，但至少可以完成从不能翻译到可以翻译的进步。

TA人见解