新闻

产品

新闻

News Information

搜狗推出“唇语识别”技术 打造多形态的人机交互

来源:沐金官网浏览次数:955 时间:2017-12-14 17:25:46.0

  从键盘打字到触控屏,再到现在的语音交互和手势交互,人工智能技能的开展,正在促进人机交互方法向更加多元化方向革新。而今日,国内闻名互联网公司搜狗又推出了一种人机交互新技能——唇语辨认,这也是业界首个揭露演示的唇语辨认体系,通过机器视觉辨认,不必听声响,仅靠辨认说话人唇部动作,就能解读说话者所说的内容。
  与语音辨认不同,唇语辨认是一项根据机器视觉与自然语言处理于一体的技能,因此在研发难度上比语音辨认大得多。据悉,搜狗创始了杂乱端到端深度神经网络技能进行中文唇语序列建模,通过数千小时的实在唇语数据练习,另外得益于搜狗在自然语言处理方面的强壮优势,终究取得了业界抢先的唇语辨认作用。在非特定人敞开白话测验集上,搜狗唇语辨认体系现已到达60%以上的准确率,超越google发布的英文唇语体系50%以上的准确率,在笔直场景如车载、智能家居等场景下乃至现已到达90%的准确率。在刚完毕不久的乌镇国际互联网大会上,搜狗唇语辨认技能露脸,在业界大大都唇语辨认技能实用性尚待考证的环境下,成功完成了业界首个中文唇语辨认体系的揭露演示,引起广泛重视。
  当国内大部分企业都扎堆集合在智能语音、图像辨认等范畴时,搜狗唇语辨认技能的推出无疑将引领整个职业进入一个全新的开展方向。作为人机交互的方式之一,未来唇语辨认技能能够辅助语音交互及图像辨认,在日常日子、安防、公益等各个范畴完成广泛应用。比方在车载场景下,周围噪音过大时会对语音指令发生搅扰,通过唇语辨认技能则能够规避搅扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也能够保证说话内容的私密性;在安防范畴,因为现在大都监控只要摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情剖析带来很多难题,而唇语辨认技能能够协助公安人员获取重要的说话信息,为公共安全提供有用支持。除此之外,唇语辨认技能还能发挥巨大的公益价值,协助先天性听障人群或老年人,让他们更好地了解和表达自己。
  作为一家技能驱动型的企业,近年来搜狗一直致力于自然语言的研究,现在在语音辨认、语义了解、机器翻译等方面均取得了职业抢先的成果并完成产品落地,此次推出唇语辨认技能,不只会推动整个AI职业的技能革新,也意味着搜狗在AI范畴的技能实力到达了更高的开展水平。
  时至今日,人工智能的开展速度现已彻底超出了我们的幻想,那些电影里的炫酷黑科技正在一步步成为现实出现在我们的日子中。随着AI技能的开展,信任在不远的将来,唇语辨认也能像语音辨认、图像辨认一样成为我们日子中随处可见的一部分。