微心网

从生存到生活

会翻译的AI

1.开始人们需要机器翻译用于战争

(1)开始原理:通过固定单词关系进行翻译。但有语法问题

(2)定义语法规则。但无法解决一词多用,不同词语在不同语境中的意义不一样。

(3) 持续加规则,最终形成了 机器翻译。


2. IBM在90年代出现了基于统计的机器翻译

在大数据量下,通过统计,计算词与词间的关系。但统计与语序语境还是有不匹配的地方。


3. 基于神经网络的翻译

原来的翻译是基于规则的单词关系,机器不知其意义。

神经网络则要通过数据(单词)向量化找到不同的意义。

通过多维(增加维度)向量数据表示单词关系。

维度的产生是通过原始数据统计和分析而来。

通过向量定义词的相似度,相近度。


典型的应用word2vec


4. 解决语言翻译中的关系

(1)找到词的对应关系,即相似度最优

(2)更适配的语言规则,即相近度


5. 翻译向量计算transform

(1)编码器,语言转换向量

中间层,通过编码得到下一个词(未知),通过计算后续层关系找到最优解

(2)解码器,将向量转换为另一种语言


学习总结来源:https://www.bilibili.com/video/BV1LA411f7BX/?p=4&spm_id_from=pageDriver


网站分类
文章归档
标签列表
友情链接

Powered By Z-BlogPHP 1.7.2

Copyright @2018-2023 冀ICP备08000199号-2