您的位置:首页 >创业 >

“语言是我们所做工作的核心”: Google搜索的Pandu Nayak

随着Google现在开始理解甚至用罗马脚本编写的印度语言,并弄清楚要针对哪种查询使用哪种语言,这将是很久以前开始的工作的高潮。pandu Nayak知道所做的所有努力。这位谷歌研究员兼副总裁已经在这份工作上工作了16年。

“语言是我们工作的核心。而且,你可以从早期的搜索演变中看到这一点,“他在视频通话中解释道。“因此,(我们) 以语言为导向的第一件事就是拼写校正。”虽然这现在看起来很简单,但作为谷歌核心搜索领导团队成员的纳亚克 (Nayak) 澄清说,“拥有一种巧妙的拼写方式实际上需要你理解语言”。

“随后,语言的下一个重大创新是围绕同义词…… 这个想法,即单词在不同的上下文中意味着不同的事物,” 他继续说道。然后是语言理解的阶段,引擎开始理解鞋子的 “鞋底” 和 “鞋底” 鱼之间的区别。虽然它已经取得了进展,Nayak承认他们 “做得不太对”,因为当有人真正在寻找鱼时,你仍然会看到鞋底的一些结果。

“你可以用语言得到所有这些非常有趣的现象。因为语言是这种复杂的东西…… 它是非常微妙的,细微的,诸如此类的,”他告诉indianexpress.com,并补充说,最近的创新是如何围绕机器学习和深度学习的,“ 在理解句子,自然语言和对话方面取得了飞跃 ”。

另请阅读: 谷歌搜索以相关的当地语言显示结果,即使你输入英文字符

“如果你做得不好,人们就不会使用你的产品,因为语言对我们如此重要,” 他补充道。“正确对待这一点对于与您的用户取得成功至关重要。”

然后是将这些学习带到其他语言的问题,谷歌称之为本地化。但是统计方法使这变得容易一些。“从根本上说,我们使用的技术往往是统计技术,着眼于语言和语言使用的大规模统计数据…… 这并不是说我们学习英语语法,然后学习印地语语法等等,” 他说,并补充说,既然基础技术本质上是统计的,他们可以很容易地推广到许多不同的语言。“只要你在该语言的文件方面有正确的培训数据,等等。通过拥有正确的培训数据,您可以学习正确的敏感性。”

但这只是一部分。然后面临着必须解决不同语言的特殊问题的挑战。“许多东亚语言,如汉语、日语和韩语,都有分割的问题。每个字符真的就像一个单词…… 你必须想出一种方法来分割它。所以你有特殊的算法来做到这一点,“Nayak解释了他们是如何解决汉字字符问题的。

将名词组合在一起形成复合名词的德语风格提出了一个不同的问题。“要真正理解这门语言,你必须学会如何去复合它。所以你需要一些特殊的技术。”

然后在印度,有音译,特别是人们用英语写印地语。“你需要一些特殊的处理来正确处理音译,这样你就可以得到实际被说的话。”

虽然用印度地区语言打字和搜索仍然相当困难,但Nayak接受 “将语音识别作为一种操作方式是非常有价值的”。这就是为什么他说,谷歌 “在改善印度语言的语音识别方面投入了大量资金”,并 “为训练数据获取正确的数据,正确的算法”。

已经完成的工作已经开始显示出一些结果。“他们工作得相当不错,但我认为我们想让它变得更好,这样就很容易做到这一点,没有错误。”

“另一种策略是,我们可以接受您的英语查询,根据查询,我们可以将其翻译或将其音译为您的地区语言,并显示结果。因此,现在只需轻按一下这些结果,看看这些结果是否对您更好。”他解释说,Google正在印度推出的最新功能。

“你不必输入这些东西,但我们试着用翻译来猜测,这是另一种已经走了很长一段路的技术,” 他解释了这种新技术如何帮助解决印度语言输入的问题。Nayak说,一旦推出了其中一些功能,Google的印地语搜索流量就会急剧增加。此外,由于语境化是语音输入的重要组成部分,Nayak说,它肯定会像现在的英语一样使用语言。“我不认为这是一个长期的问题。我认为这只是时间问题。”

关于改善其他印度语言的搜索体验,Nayak说这是 “不同因素的组合,理解语言是其中的一部分”。他说,即使Google取得了重大进展,但事实是,可以用英语训练算法的内容较少。“与生态系统合作构建这些内容是我们非常感兴趣的事情。例如,我们也希望从翻译开始,“他说,毕竟“ 让搜索变得很棒的是内容 ”。

“诚然,还有很多事情要做。我认为我们对印度和印度市场有实质性的承诺,我非常希望未来情况会变得更好。我相信,真正解决这些问题将真正帮助用户。“

纳亚克 (Nayak) 从IIT-Bombay毕业,并获得了斯坦福大学 (Stanford University) 的计算机科学博士学位,他领导着Google的排名团队,并对适用于搜索的语言理解特别感兴趣。作为斯坦福大学计算机科学系的兼职教授,他与克里斯·曼宁 (Chris Manning) 一起教授信息检索,还教授了有关人工智能推理方法的课程。在美国国家航空航天局艾姆斯研究中心工作了一段时间后,他还担任了Stratify,Inc的首席技术官,在那里他从事了远程代理项目,这是第一个获得航天器主要命令的人工智能系统。

相关推荐

猜你喜欢

特别关注