WordRecorder:使用深度学习设备进行基于声学的准确手写识别
摘要
本文介绍了WordRecorder,这是一种高效准确的手写识别系统,该系统使用笔和纸产生的声学信号识别单词,从而实现无处不在的手写识别。为了实现这一目标,我们精心制作了一个新的基于深度学习的声学传感框架,其中包含三个主要组成部分,即分割、分类和单词建议。首先,我们设计了一种双窗口方法,通过利用手写的微妙声学信号特征,将原始声学信号分割成一系列单词和字母。然后,我们集成了一组简单而有效的信号处理技术,以进一步将原始声学信号细化为适合深度学习分类的归一化频谱图。之后,我们定制一个适合智能设备的深度神经网络。最后,我们整合了一个单词建议模块来增强识别性能。我们的框架同时实现了计算效率和理想的分类精度。我们使用现成的智能手表对设计进行原型设计,并进行广泛的评估。我们的结果表明,WordRecorder 在一系列不同的环境、用户和写作习惯中,为经过培训的用户提供了 81% 的准确率,为未经培训的用户存档了 75% 的准确率。
作者
Haishi Du; Ping Li; Hao Zhou; Wei Gong; Gan Luo; Panlong Yang
期刊\会议
IEEE INFOCOM (CCF-A) [Link] [PDF]
关键词
机器学习,手写识别