您的位置:首页 >要闻 >

谷歌翻译,Gboard应用程序改进了对印度语言的支持

谷歌宣布了九种印度语言的神经机器翻译(NMT),并将同样的技术扩展到Chrome浏览器和谷歌地图评论上的自动翻译功能。谷歌的神经机器翻译系统是一个更先进的系统,依靠深度神经网络进行翻译。该模型类似于机器学习在其他任务中的工作方式,比如图像识别,除了在这种情况下,神经网络被教授语言和逐句翻译。

NMT的支持正在向印地语、孟加拉语、马拉地语、泰米尔语、泰卢固语、古吉拉特语、旁遮普语、马拉雅拉姆语和卡纳达语推出。谷歌表示,与旧系统相比,该系统允许更快、更准确、更高质量的翻译。这项技术还将包括Chrome浏览器的自动翻译功能,并允许将网络内容更准确地翻译成印度地区语言。

谷歌还宣布,其Gboard应用程序现在将支持所有22种时间表印度语言,并在搜索中集成印地语词典。这一整合将意味着用户现在可以使用devnagari脚本或英语搜索印地语单词,谷歌将显示单词的含义,类似于对英语单词的显示方式。

对谷歌来说,关注印度语言并不新鲜。2014年,谷歌宣布成立“印度语言互联网联盟(ILIA)”,以推广印地语网络,使用户更容易访问。谷歌还在印度大量采购各种地区语言的翻译;该公司表示,由于这项倡议,迄今为止已经完成了1000多万次翻译。

“印度有超过4亿互联网用户,预计到2020年将增加到6.5亿用户。印度是世界第二大互联网用户市场。大多数人通过移动访问,印度有超过3亿人使用智能手机访问互联网。我们在谷歌的使命是让互联网包容每个印度人,“谷歌东南亚和印度副总裁拉詹·阿南丹在活动中说。

然而,印度面临的挑战将永远是以地区语言出现在线内容。“谷歌一直在努力解决这个问题,”Anandan补充道。

谷歌于2015年9月利用自己的TensorFlow技术启动了使用神经网络进行翻译的项目。2016年9月,使用该软件的中译英软件上线。

“当我们开始这个项目时,我们预计网络需要3年时间才能开始翻译。然而,在13个半月多一点的时间里,我们已经成功地推出了这个,“梅尔文·约翰逊解释说,他是谷歌的研究科学家工程师,也是这个项目的一部分。

“神经机器翻译正在弥合基于短语的翻译和人类翻译之间的差距。我们现在把它移到一个多语言模型,在这个模型中,系统学习多种语言的翻译。它在网络上寻找两种不同语言的平行文档,然后将它们分解成句子,“约翰逊在声明中解释道。

对于谷歌及其产品来说,确保在印度使用地区性语言非常重要。正如谷歌自己与毕马威进行的研究显示的那样,印度语互联网用户比英语互联网用户多得多。

谷歌和毕马威的研究显示,印度语互联网用户的数量为2.34亿,并预测到2021年,这一数字将上升到5.36亿。印度目前的英语互联网用户数量为1.75亿,到2021年将上升到1.99亿。

根据谷歌和毕马威的研究,未来五年,印度每10个新互联网用户中就有近9个使用印度语言,预计印地语将大幅增长,到2021年,印地语人数可能会上升到7500万。在这种情况下,web上的内容以区域语言提供变得更加必要。

最后,Google的Gboard应用程序,它是在iOS和Android现在支持印地文,孟加拉语,Telugu,Marathi,Tamil,Urdu,和Gujarati的音译,同时支持22印度时间表语言。Gboard内置了Google搜索按钮,由于新的翻译工具,用户现在可以依靠这个来用自己的地区语言进行搜索。

Gboard还将提供自动校正和预测这些新语言。在原生脚本中除了传统的QWERTY布局之外,还会有键盘的布局。

相关推荐

猜你喜欢

特别关注