谷歌DeepMind人工智能 学会读唇语让监控变“监听”
2016-11-25 16:01:18
来源:
互联网
谷歌的人工智能DeepMind又厉害了。
近日,DeepMind部门与牛津大学研究人员共同创造了一个记录:在测试的上千小时BBC视频片段中,DeepMind AI实现了46.8%的读唇识别文字精准率。也许你觉得46.8%不是很牛,但其实经过训练的人类读唇专家,正确率也仅为12.4%而已。
牛津大学的研发小组在本月早些时候发布了报告,首先他们开发了一款名为“Lipnet”的读唇软件,其测试成绩为93.4%准确率,似乎比DeepMind AI更高,但其实这是在特制录像的条件下完成的,测试语句全部为公式化。
DeepMind AI则不同,它完全是在“看电视”的情况下测试的,也就是说片段随机、片段中人物的语音随机,更具挑战性。为此,DeepMind AI经过了约5000小时的训练,包括大量新闻节目,锻炼并学习“看、听、读、拼”的能力。
DeepMind的研究表明,AI可以实现更强大的语言学习能力,并且拥有广泛的应用价值,比如帮助听障人士理解自然对话、可以诠释无声电影或是集成到诸如Siri和Alexa等语音助手中。
当然,也有人对该技术感到恐惧,认为这是一种更方便的监控技术。不过研究人员表示,该技术需要在明亮的、高分辨率视频画面中运行,目前的监控视频还不具备操作条件。但无论如何,AI正在变得越来越聪明,这是一件好事。