机器翻译的最新进展与瓶颈所在

云计算
谷歌翻译主要是采用统计翻译模型,往计算器内输入大量的文字文本,包括源语言的文本,以及对应目标语言人工翻译的文本,通过海量统计数据来提高翻译精确度。

你想过和异国人说话不需要再有翻译,只需随身携带一个轻巧的数码机器吗?目前来看这仍是奢望。不过,或许某一天,我们终于可以不再学习头疼的外语就能实现和外国人的无缝交流。

  机器翻译是一个充满挑战的研究领域,正因为难度很大,它被列为21世纪世界十大科技难题之首。一路走来,机译经历了艰难而曲折的发展历程,既有成功和兴奋,也有挫折和困惑。

  然而,需求永远走在应用的前方。由于近年来全球化进程的加速以及国际交流的日趋频繁,人们对于翻译的需求***增长。而互联网的普遍应用则使在线翻译成了当今机译的重头戏。

  在这一领域,竞争正变得***激烈。如今功能较强、方便易用的在线翻译工具有谷歌翻译、必应翻译、脸谱翻译、宝贝鱼翻译、巴比伦翻译等,其中后起之秀的谷歌翻译***特色,同时***代表性。

  谷歌翻译目前可提供63种主要语言之间的实时翻译;它可以提供所支持的任意两种语言之间的互译,包括字词、句子、文本和网页翻译。另外它还可以帮助用户阅读搜索结果、网页、电子邮件、YouTube视频字幕以及其它信息,用户甚至还能在Gmail内进行实时的多语言对话。

  谷歌翻译主要是采用统计翻译模型,往计算器内输入大量的文字文本,包括源语言的文本,以及对应目标语言人工翻译的文本,通过海量统计数据来提高翻译精确度。

  之所以采用统计翻译模型,一个重要原因是,谷歌翻译采用了云计算架构。该架构拥有谷歌研发的分布式计算系统(MapReduce)和分布式存储系统(BigTable);而这两个系统很有创造性,而且有极大的扩展性,使得谷歌在系统吞吐量上有很大的竞争力。

  机译更激动人心的应用,在于日常对话中的实时翻译。这一领域同样是谷歌领先;它拥有较强的语音识别技术,可以通过声音实现自动检索,再将语音识别和机译结合在一起。

  2011年11月,谷歌***推出了一款手机翻译软件;该软件支持包括汉语普通话在内的14个语种。对着谷歌Android智能手机讲话的用户,几乎能实时听到他们的源语言被翻译成目标语言;而通话对方的语言也会被翻译成该用户的母语。

  谷歌董事长埃里克施密特称,这种手机翻译服务将会得到极大改善,甚至可能进行“同声传译”;其前景是令人乐观的。

  谷歌的***科学家阿施斯维努戈帕尔称,谷歌的最终目的是研发出能够翻译全球至少10亿人所说的300种语言的手机软件。

  除了传统的翻译思路,一种被称为解碼外语的新方法也小荷露出尖尖角。

  这项由南加州大学的科学家们提出的全新机译方法把英语视为一种初始语言,而需要翻译的外语类似一种加密后的高级文字,通过译码破译,把外语「破解」,变成英语。

  不过,现实是骨感的。目前,这种翻译方法只能翻译一些短句或电影字幕,尚未运用到长句或片段翻译中,但它却给机译研究打开了一条新的思路,且可以运用到任何一种语言中。科学家们称,因为不需要任何既有的文本为基础,这种翻译方法今后甚至可以对“海豚音”或“外星人语言”进行破译。

事实上,不论哪种方法,影响机译发展的***因素在于译文的质量。就已有的成就来看,机译的质量离***目标仍相差甚远。

  中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。

  同时,他还指出:在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、达、雅”的程度是不可能的。这也是制约机译质量提高的一大瓶颈。

  值得一提的是,美国发明家、未来学家雷科兹威尔最近在接受《赫芬顿邮报》采访时预言,到2029年机译的质量将达到人工翻译的水平。对于这一论断,学术界还存在很多争议。

  不论怎样,目前是人们对机译最为看好的时期,这种关注是建立在一个客观认识和理性思考的基础上的。我们也有理由相信:在计算器专家、语言学家、心理学家、逻辑学家和数学家的共同努力下,机译的瓶颈问题将会得以解决。
 

责任编辑:鸢玮 来源: 中国网
相关推荐

2023-07-17 10:21:25

TC39JavaScript

2009-09-25 09:27:33

Ubuntu 2010最新进展Lucid Lynx

2021-09-14 10:03:35

RustLinux开发工作

2020-07-02 16:00:53

​Flutter桌面应用代码

2015-11-12 09:27:13

C++最新进展

2012-11-19 10:50:39

思杰CloudStack开源

2012-11-19 10:37:57

思杰OpenStack

2021-09-16 10:15:56

Linux内核Rust

2014-06-17 09:58:15

容器Google

2023-04-06 07:30:02

2009-03-23 08:44:29

Windows Ser微软操作系统

2023-04-19 20:30:49

Rust商标政策

2013-04-09 17:27:19

GMIC球移动互联网大会

2023-04-26 16:38:08

2021-06-15 14:54:23

ReactReact 18SSR

2020-09-23 22:33:28

量子芯片网络

2023-04-17 19:12:19

2012-05-11 13:34:01

移动通信GSM亚洲移动通信博览会

2022-12-28 14:55:15

数据泄露网络安全

2017-08-11 17:48:23

开放 数据中心
点赞
收藏

51CTO技术栈公众号