您的位置:首页 >互联网 >

Google的视频智能API可以识别视频中的对象

机器学习和人工智能一直是谷歌的核心优势,这反映了谷歌的消费产品范围。收件箱中的智能回复,谷歌助手从特定关键词或短语中搜索图像的能力。现在,谷歌希望强调其云平台同样智能,并由可供企业客户使用的机器学习工具驱动。

在旧金山举行的下一次会议上,谷歌负责云和机器学习的首席科学家李飞博士推出了一种新工具,该工具可以让计算机理解和解码视频,以及人类的工作方式; 新的视频智能ApI。李是斯坦福大学人工智能实验室的负责人,目前因在谷歌工作而休假,她被认为帮助建立了ImageNet。ImageNet是最大的图像存储库之一,用于机器学习和训练AI。

在当前的图像机器学习状态下,计算机被教导通过不断地向它们显示同一对象的图片来学习或理解对象。例如,为了使计算机识别狗的图片,机器学习算法显示了很多狗的图片。实际上,由于机器学习的进步,Google的photos应用程序可以识别食物,狗甚至猫的图片,尽管这仍处于基本阶段,远非科学家梦dream以求的AI。

虽然培训计算机理解图像是谷歌一直擅长的事情,但视频是另一回事。事实上,根据李博士的说法,这是数字世界的 “黑暗问题”,但看起来谷歌已经破解了如何解码其中的一部分。本质上,Google的新视频智能工具 (目前处于私人测试版) 将能够识别用户想要查找的视频的确切部分。

Google希望向企业提供该工具,该工具将允许视频可以搜索和发现,就像Google photos应用程序上当前的照片一样。在主题演讲期间的演示中,Google展示了该工具如何找出确切的标签; 当被要求从一系列视频中找到海滩或棒球时,该工具能够准确地定位哪些剪辑具有海滩/棒球的图像以及在什么点。

从本质上讲,由于该工具,用户可以搜索每个镜头,帧,而无需手动,以找到确切的视频素材。

根据Google的说法,该ApI可以注释存储在Google Cloud Storage中的视频,并标记每个对象。标签意味着它可以找出视频中的日常物品或物品。因此,即使您的剪辑是随机命名的,该工具仍然可以让您搜索例如海滩的镜头,如Google在演示中所示。

Google还表示,该工具可以检测视频中的场景变化,并可以帮助组织进行媒体存档并增强视频的内容发现。此ApI依赖于Google当前的视觉识别模型,这些模型也在推动YouTube中的视频搜索。

Google还宣布了其Cloud Vision ApI的改进,其中包括从公司的知识图谱扩展元数据。本质上,谷歌正在将其在消费者方面的成功带给企业,并将其提供给企业,因为它试图在云计算竞赛中赶上亚马逊和微软。

免责声明: 记者应Google India的邀请参加在旧金山举行的下一次会议,该会议负责旅行和住宿费用。

相关推荐

猜你喜欢

特别关注