我发明的声控界面需要语音识别、文本识别、图像识别和视频识别四大识别领域的综合发展,这有一个问题,即混合模式识别,一声“你好”是打招呼,一个微笑也是打招呼,即一个语音和一张图像或视频的模式一样,这种现象在声控界面中是普遍现象,怎么办能高效成功发展这种混合模式识别,可以用我以前的研究,统一编码,“你好”的语音和微笑的图像或视频如果统一编码都是打招呼则混合模式识别理论就出来了,混合模式的理论不止用于识别,还可以用于声控界面的其他科技上
https://m.sciencenet.cn/blog-3482188-1357961.html
上一篇:
对声控界面的一点想法下一篇:
我很愤怒