您的位置:首页 >创业 >

从语音到视频,为什么印度语言再次成为Google的重点

在过去的两年里,印度的互联网发生了巨大的变化。随之而来的数据大战使移动宽带的价格暴跌,使许多人可以更轻松,负担得起的访问。印度的互联网人口约为4.5亿个用户,其中超过3.9亿是活跃用户。但是,根据搜索巨头Google的说法,推动在线消费的是互联网上地区语言的增长和视频消费的增加。

“今天的印度有大约4亿个用户,其中2.5亿用户只能用自己的语言上网。所以说真的,印度语言互联网用户已经相当大了。实际上,当今印度互联网上的非英语用户比英语用户更多。”Google印度董事总经理Rajan Anandan在互动中告诉indianexpress.com。

据预测,这一2.5亿数字将达到5亿印度语言互联网用户的2021年。“我认为印度互联网的想法只是英语,那是四年前,印度的非英语互联网只是印地语用户是三年前。今天,每一种语言都在爆炸,“阿南丹指出。

<iframe src = "https://www.dailymotion.com/embed/video/ k2czusufjdkcxufoo3" 宽度 = "100%" 高度 = "363"></iframe>

正如谷歌所看到的那样,增长来自二线、三线、四线城市和农村地区; 地铁不再是唯一的驱动力。根据阿南丹的说法,“更多的妇女正在农村地区上网。我们认为,2024年,印度45% 的互联网用户群将是女性。不再仅仅是千禧一代了。“

印度语言的在线内容

然而,区域语言中基于文本的内容仍然是一个缺乏的领域。这就是Google希望其新的 “navlekha” 平台能提供帮助的地方。“如果你看看印度语言的互联网,非视频,也就是文本,只有1% 的内容是印度语言的。多达99% 的人仍然是英语,这就是巨大的差距所在,“他解释说。

问题不在于印度缺乏地区语言的书面文本内容。该内容不在互联网上。Navlekha计划通过让区域语言的发布者将其基于pDF的内容转换为web存在来改变所有这些。

Anandan解释说: “Navlekha可以让您使用所需的任何语言来获取pDF,并将其转换为web状态。”这个想法是联系杂志、图书出版商,帮助他们把他们的区域内容带到网上。

“假设我是泰米尔杂志出版商,我出版了一份印刷出版物。可能只是一本杂志,每月10页。所以从本质上讲,我有一个pDF文档…… 这让你做的是把那个pDF,从字面上看,在一分钟内,把它变成一个网络存在,“他指出。

Google希望它能使将印度语言的内容放到网上更加无缝。

谷歌看到在线消费增长的另一个领域是视频。事实上,据拉詹视频消费在农村地区增长更多。“这不是城市现象 (视频消费)。这不是农村现象。这是全印度的现象,”他强调。

这也解释了为什么Google准备从与AR Rahman的音乐才艺表演开始在印度推出其YouTube原创作品。

YouTube与区域内容的增长

“过去两年,YouTube在印度增长迅速。每日活跃用户群每年增长100%。超过75% 的消费发生在移动设备上。更重要的是,我们的用户一天要参与多次。这不仅是一个活跃的用户,也是一个互联的用户,因为他们也在订阅频道,并且希望在未来观看更多来自这些频道的视频,”印度YouTube娱乐主管Satya Raghavan在电话互动中告诉indianexpress.com。

根据毕马威 (KpMG) 的一项研究,印度在线消费的视频内容中有近95% 是地区语言。根据官方Comscore的数据,虽然YouTube没有给出区域内容在其平台上的观看次数,但它每月有2.45亿个唯一用户。

Raghavan说: “YouTube上的区域语言正在增长,” 尽管他拒绝分享吸引最高观点的语言的数字。但是,他坚持认为,将印地语视为唯一的印度主流语言是错误的,因为泰米尔语,泰卢固语,卡纳达语等其他语言也在增长。

他还指出,英语内容或用英语说话的创作者不再是唯一做得好的人。“2014年,我们在印度拥有16个YouTube频道,拥有100万多个订户。现在,超过300个渠道已经超过了这一里程碑,我们几乎每周都会增加两个渠道。”他补充说。

这些频道中有许多在印度拥有超过100万个订阅者的地区语言内容。实际上,印度的T系列拥有近6300万个订户,这使其成为世界第二大频道,仅次于已6600万的pewDiepie。

他还强调,由于数据不再是约束,因此用户对平台的参与度更高。“2015年,我们看到喜剧、美食和音乐内容开始增长。在南印度,区域语言内容开始增长。2016年,印度的技术渠道不断增长,我们还看到了古吉拉特语旁遮普语地区内容的增长。到2017-18年,我们看到所有垂直领域都在增长,生态系统变得更加广阔。”他解释说。

鉴于内容的多样性,可以公平地说,YouTube实际上已经成为访问各种类别的印度语言视频的最简单来源之一,这是其他平台所不能提供的,至少在这个规模上是没有的。

翻译中的挑战,声音的未来

对于Google而言,从地区语言在线获取更多内容只是问题的一部分。随着基于语音的服务的增长,以及该公司对Google Assistant的日益关注,印度的挑战仍然很大。

根据阿南丹 (Anandan) 的说法,在印度上网的新用户宁愿上网,也不愿键入或点击,这也解释了为什么基于语音的查询正在增长。

“在印度,我们的搜索查询每年增长270%。在上一个 'Google for India' 中,我们说过Google搜索应用程序上的28% 搜索查询都是基于语音的,因此您可以想象百分比正在上升很多,更高。”Rajan说。 去年,谷歌透露,印度的印地语语音搜索查询增长了400。

尽管他承认在翻译方面仍有改进的余地,但他相信Google的机器学习功能将确保随着时间的推移,基于区域语言的语音搜索只会变得更好。

“我们花了大量的时间,你知道,让机器学习,依赖大量的数据。至少在当今排名前11位的印度语言中,能够翻译成我们认为的那些语言实际上工作得很好,”他说。

区域语言的货币化

尽管印度未来的大多数互联网公民将依靠自己的语言来访问网络,但对于在线出版商,尤其是那些冒险使用白话语言的人来说,货币化的挑战仍然存在。

最近,印度互联网和移动协会 (IAMAI) 和Kantar IMRB的一份报告称,到2018年12月,印度的数字广告支出将接近12,046亿卢比,这显然是一条将继续以两位数增长的途径。

以当地语言投放广告的重要性在Google上并没有消失,Google已经开放了其中一些语言的AdWords。“听着,我确实认为货币化滞后。就我们而言,我们确保您可以使用其他语言提供AdWords。去年,我们在印地语中宣布了AdWords,然后添加了孟加拉语,现在我们添加了泰米尔语,泰卢固语,”Anandan解释说。

“如果我是一个用户,我不会说英语,我在看一些内容,你给我看英语广告,这可能不会很有效,因为我真的不知道你在说什么,” 他说。

相关推荐

猜你喜欢

特别关注