包罗万象的语音数据中心

主要语种平行语料、全领域客服语音数据、特定场景噪音数据、语音助手实网语音数据构成包罗万象的智能语音数据库。拥有从普通话到各地方言、地道外语语料,囊括专业客服/车载和实网语音数据,可用于同步翻译、机器人语言训练等领域。

全球主要语种语料库
特定场景语音数据
语音助手实网语音数据

翻译对句语料库

涉及到66个语种之类的翻译语料库,440种组合,三亿条人工翻译对句

  • 美国儿童说英语语音数据
  • 中国儿童说中文语音数据
  • 英国儿童说英语语音数据

多领域智能语音数据

涉及普通话录音识别,方言录音识别,外语录音识别,复杂环境录音识别,均按需标注

  • 全领域客服语音数据
  • 食品类电商网站客服语音数据
  • 场景噪音数据
  • 射频噪声数据

语音助手实网语音数据

采自某语音助手实网语音数据,超精确转写。采集语料对常用中文词汇转写标注音调,添加常见语气词转写,发音人说什么转什么,去噪技术精确转写。

  • 1200小时语音助手实网语音数据
  • 2400小时语音助手实网语音数据

应用场景

语音数据产品语音文本间转化率高达95%以上,能够很好的解决智能语音识别率不高。适用于人工智能、智能家居、智能车载系统、智能安防、语音翻译等领域。

智能家居
智能安防
人工智能
智能车载系统
语音翻译

13612301124