消息!人工智能声呐眼镜可识别唇语,准确率约为95%

时间:2023-04-10 14:14:17 来源: 读创


(相关资料图)

美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。

EchoSpeech眼镜。图片来源:康奈尔大学

这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。

研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。

此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。

来源:科技日报

审读:孙世建

标签:

精彩推送

新闻8点见丨“张继科事件”持续发酵,是时候给公众一个真相了-今日讯

新闻8点见,多一点洞见。每天早晚8点与你准时相约,眺望更大的世界。张继科拿前女友私密视频抵债的纷争...

来源:2023.04.03

科新机电:一季度净利预增30.32%-36.24%

证券时报e公司讯,科新机电(300092)4月3日晚间发布业绩预告,预计2023年一季度归母净利4400万元-4600万

来源:2023.04.03

快讯:华发物业负债率99.4%再居港股物企负债榜首位_焦点快播

乐居财经严明会4月3日,乐居财经研究院发布《2022年港股物企负债榜》,华发物业服务负债率居首,为99 3...

来源:2023.04.03

冯小刚还要糟蹋多少女演员

冯小刚执导的新剧《回响》前几天大结局了。就演员阵容而言,它绝对称得上豪华。前来客串的大咖更是数不...

来源:2023.04.03

每日视点!不负遇见的唯美句子_不负遇见

1、就是说好聚好散。2、好好珍惜这份情义,到再见的时候,也容易相处。3、不要辜负一份好意。本文到此分...

来源:2023.04.03

“最美天路”来了!滇藏铁路云南段预计年内开通运营

记者4月1日从云南铁路部门了解到,滇藏铁路全线重点控制性工程哈巴雪山隧道建设进入冲刺阶段。按照计划...

来源:2023.04.03

一拳超人:全漫存在感最低的王者来袭,拥有龙级实力却三秒跪!

森林王,是龙级实力的怪人,却被升级为闪光核的杰诺斯无伤干掉!当然与远古王不同的是,岩石王是埋藏与...

来源:2023.04.03

当前快播:合肥集中供地:59.56亿元成交5宗摇号地块 龙湖、中铁建各摘得其一

观点网讯:4月3日,观点新媒体获悉,合肥集中供地摇号阶段结果出炉,以下公布5宗地摇号结果,总成交价合...

来源:2023.04.03

拜年词语一到十_春节拜年的词语范例

1、那叫惊艳,二龙精珠,三羊泰,四面八方,五谷丰登,六六大顺,七星璀璨,四面玲珑,简直完美。2、工...

来源:2023.04.03

新闻快讯

X 关闭

X 关闭

新闻快讯