实际上语音输入有2个关键,
语音输入有2个关键,一个是语音识别(Speech Recognition),还有一个是上下文关联(Context Analysis)。
Nortel当年搞的识别系统(好像是叫Nortel Speech Server吧)如今还是电话AVR语音识别的主要功能块。
现在的语音输入系统除了Speech Recognition以外,还有Context Analysis的功能,它能把正确率提高一个数量级。这就是为什么用语音输入一段话,一篇文章很顺利,错误很少,而输入1个2个Command常会错误百出的原因。