今天,搜狗推出了一种新的人机交互技术——唇语识别,据说是通过机器视觉识别说话人唇部动作,来解读说话者所说的内容。
作为人机交互的新形式,唇语识别技术未来可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也可以保证说话内容的私密性。
唇语识别在安防领域也可以有大动作,由于目前多数监控只有摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情分析带来很多难题,而唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。
搜狗官方表示,通过复杂的点到点的深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。
这样新的交互识别技术,对社会的安全可以提供有很大的帮助,不仅如此,这技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。这样的技术还会用在哪些领域呢?
喜欢数码科技资讯的你记得订阅[安卓中国]。
根据机哥第八定律,93.94% 爱搞机的人都关注了「好机友」微信公众号【微信号:goodjiyou】,看啥看,就差你啦~
登陆[锋潮科技]官网浏览更多精彩内容(https://www.anzhuo.cn)
from 锋潮科技 http://ift.tt/2AWYsyP
via IFTTT
Aucun commentaire:
Enregistrer un commentaire