1.开始人们需要机器翻译用于战争
(1)开始原理:通过固定单词关系进行翻译。但有语法问题
(2)定义语法规则。但无法解决一词多用,不同词语在不同语境中的意义不一样。
(3) 持续加规则,最终形成了 机器翻译。
2. IBM在90年代出现了基于统计的机器翻译
在大数据量下,通过统计,计算词与词间的关系。但统计与语序语境还是有不匹配的地方。
3. 基于神经网络的翻译
原来的翻译是基于规则的单词关系,机器不知其意义。
神经网络则要通过数据(单词)向量化找到不同的意义。
通过多维(增加维度)向量数据表示单词关系。
维度的产生是通过原始数据统计和分析而来。
通过向量定义词的相似度,相近度。
典型的应用word2vec
4. 解决语言翻译中的关系
(1)找到词的对应关系,即相似度最优
(2)更适配的语言规则,即相近度
5. 翻译向量计算transform
(1)编码器,语言转换向量
中间层,通过编码得到下一个词(未知),通过计算后续层关系找到最优解
(2)解码器,将向量转换为另一种语言
学习总结来源:https://www.bilibili.com/video/BV1LA411f7BX/?p=4&spm_id_from=pageDriver