语音识别解决方案

习电智慧会议语音识别平台,是通过语音识别、机器翻译及自然语言处理等技术,实现语音转写、内容投屏、实时翻译、纪要整理、音频文本下载等功能,智慧语音系统内置的声学模型以汉语拼音声韵母为基本识别单元进行声学建模,兼顾了模型的颗粒度及可扩展性。为了提高模型训练的鲁棒性,采用数万小时的通用语音数据,并进行了data augment,主要包括speed/volumn/RIR/pitch/noise perturbation 等手段,把训练数据量又扩大了20 倍

支持语言模型和声学模型定制化。语言模型可针对客户的行业领域的专有词汇、行业术语等做优化,如业务流程中的热词资源可以通过语言模型实时训练后,达到理想的识别效果;声学模型则针对客户所属地区的口音做针对性优化。

针对业务中出现的新兴词汇,可通过自定义发音的热词机制做到即时支持,无需做额外的模型训练工作。热词数量支持万条以上,并可在运行时灵活切换。

急速查看更多关于语音识别的优秀案例