Mar
2019
机器翻译达到目前的水平,经过了几十年的发张,并经历了三次飞跃。
早在1954年,人类就开始尝试过让机器能识别人类的语言,但直到上世纪80年代,才有人摸索出方法。当时,IBM做了研究,利用一些规则方法,句法分析,语意分析等传统方法让机器看懂人类语言。但由于当时的人工智能发展处于“凛冬时期”,效果一直不好,翻译质量也一直上不去。
机器翻译的**个飞跃也是IBM做出的。IBM的研究人员用了统计的方法来做机器翻译。那时,语音识别从传统的人工智能方法专家系统转为统计学习的方法,尤以隐马尔科夫模型为代表。统计学方法的应用让机器翻译在上世纪90年代有了质的飞跃。
进入21世纪,机器翻译迎来了自己的第二次飞跃。这次的进步主要依靠深度学习神经网络的方法。这种方法也称为神经机器翻译(Neural Machine Translation),这个技术先是用到了语音识别中,再推广到图像识别和机器翻译上。
神经机器翻译,简要的说,就是对源语言的句子进行编码,即转化为计算机可以“理解”的形式,编码的结果会形成很多隐含变量,每个隐含变量代表从句首到当前词汇为止的语义信息。然后通过一个解码的过程,一个词、一个词输出译文。
到了2018年,由微软亚洲研究院与雷德蒙研究院研发的机器翻译系统,解决了NMT方法的一些局限,并借鉴了人类翻译过程中的一些方式。例如:对偶学习(Dual Learning)、推敲网络(Deliberation Networks)、一致性规范(Agreement Regularization)、联合训练(Joint Training)等,让机器翻译水平得到了大大提升。
从机器翻译的三次飞跃上不难看出,一家公司构建的翻译系统效果如何,主要取决与两点:一是算法是否足够好,二是数据是否够全、够多。
这样看,佛山翻译对于微软、谷歌、百度等大公司来说,他们有足够很好的人才来搭建神经网络,也有足够多的搜索数据可供自己搭建的网络进行训练。国内的科大讯飞和搜狗公司,由于本身在语音识别上有较长时间的积累,自然语言资料库上有优势。
下一篇:SCI论文翻译如何避免中式英语?
- [09-18] 为什么生物技术和制药知识产权需要集中翻译源?
- [08-05] 世界上被翻译**多的五本书
- [04-21] 美式英语与英式英语翻译的区别
- [01-30] 首届中日新闻词汇翻译研讨会在京举行
- [06-01] 如何进行法律文件的翻译
- [10-16] 专业领域的翻译如何进行工作
- [07-30] 从项目经理视角看译前准备
- [04-26] 如何快速提高英语翻译能力
-
地址1:佛山市禅城区汾江中路144号科华大厦1002室(创业大厦正对面)
电话:0757-82285965 13318391728
-
地址2:佛山市禅城区魁奇路澜石(国际)金属交易中心大厅一楼
电话:0757-82285965 13318391728