提供语音识别、语音合成等语音AI能力,助力企业实现语音智能化交互
| 配置项 | 规格详情 |
|---|---|
| 语音识别(ASR) | 支持中文普通话、英语、粤语、四川话等,识别准确率≥97% |
| 语音合成(TTS) | 支持40+种音色,包括男声、女声、童声,支持SSML标记语言 |
| 实时转写 | 实时流式语音识别,首屏响应<200ms,支持标点预测 |
| 音频格式 | PCM、WAV、MP3、M4A、OGG,采样率8kHz-48kHz |
| 声纹识别 | 支持1:1声纹验证和1:N声纹检索,准确率≥99% |
| 语音唤醒 | 支持自定义唤醒词,唤醒率≥95%,误唤醒率<0.5次/小时 |
| 情感识别 | 支持高兴、悲伤、愤怒、惊讶等7种情感识别 |
| 语种扩展 | 支持日语、韩语、法语、德语、西班牙语等10+种外语 |
| 并发支持 | 基础版100并发,企业版1000并发 |
| 服务可用性 | 99.9% SLA保障 |
语音识别和合成赋能智能客服系统,实现语音交互、自动应答和工单处理
实时会议语音转文字,支持多人说话人分离,自动生成会议纪要
为智能音箱、车载系统、手机应用等提供语音交互能力
语音评测、朗读打分、口语练习,助力在线教育提升学习体验
新用户注册即享免费试用,专业团队为您保驾护航