时间:2023/3/26来源:本站原创作者:佚名

大益阳客户端讯(通讯员郭灿辉王倩文)为了解普通市民对耳语音识别的了解情况以及现有语音识别技术的缺陷,7月25日,来自南京航空航天大学理学院的“元音耳语音识别”实践团队回到家乡益阳,在万达广场进行了街头调研。“我觉得现在语音识别的主要问题就是方言和口音,如果有方言和口音掺杂,就会识别不清楚。”其中一名采访对象反映。

耳语音就是我们常说的悄悄话。人说话的一切气流都是通过声带的,声带的不同状态可以形成不同的发声态,耳语声就是发声态的一种。团队成员表示,“耳语与正常音的发声生理差异导致了声学特性的差异。”即使把耳语放大,得到的信息也不会和正常说话一样,因此耳语音的识别技术一直处于相对空缺状况。通过重点研究汉语耳语音的声学特征,团队对耳语的生理、声学和感知特性进行比较,提取声学元音特征,并且对这些特征建模分析,建立了耳语元音语音库。

一般来说,人们的交流通过声带振动进行语音发声,但这种交流方式对于失音患者来说却难上加难。在这种情况下,不依靠声带振动就能“发声”的耳语音就成了这些患者的选择。进行耳语音识别的研究,不仅可以帮助失音患者进行人机语音交互,还能极大地扩展语音识别系统的应用场景,在原本不便发声的公共场所,比如图书馆,进行交流。

暑期实践之前,团队就建立了元音耳语音识别大学生创新项目组,有理学院物理系语音识别方向的老师助阵,后续计划将此次调研大家所反映的识别效果不好错误率高、噪声对识别的影响大、多语种识别等的问题添入后续耳语音识别模型优化过程中,目前已经进行了模型构建,预计会在年底全部完成并通过“互联网+”大赛投入实践。

展开全文


转载请注明原文网址:http://www.yiyangzx.com/yysly/11735.html
------分隔线----------------------------