摩杜云产品

从基础设施到企业应用领域,摩杜云提供完善的产品体系,支撑各类上云业务场景,助力您的业务腾飞

云产品

计算

存储

数据库

网络与CDN

安全

大数据

印刷文字识别

智能语音交互

录音文件识别
提交录音文件识别请求后,商业用户的转写任务可在6小时之内完成识别并返回识别文本,最新发布极速版支持30分钟以内时长的音频转写完成时间不超过10秒。
实时语音识别
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。
一句话识别
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。
语音合成
能将用户提交的文本转换成自然流畅的语音,目前有多种音色可供选择,并提供调节语速、语调、音量等功能。
语音合成声音定制
为企业提供深度定制TTS声音的能力。通过深度学习技术,用更少的数据量,更快速高效地为客户定制个性化语音合成声音。
语音本地化部署方案
支持语音识别、语音合成、语言模型自学习工具的本地化部署,帮助企业在自己的数据中心使用与摩杜云公共云同款的智能语音服务。
智能语音设备端解决方案
针对类似故事机、音箱等各种语音交互设备,提供包括音频信号处理,打断唤醒,语音识别,语音合成等全链路语音交互能力。
语言模型自学习工具
自行上传数据,对摩杜的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制。
便携智能语音一体机
便携智能一体机由达摩院结合应用场景现有问题和用户实际需求,由智能语音识别技术+智能采集阵列硬件+音频处理算法组成。

视频服务

企业应用