依图语音开放平台：提供短语音听写、长语音转写、实时语音转写等功能，具备高精度、快速、广泛兼容的特点，可以帮助用户实现精准的语音识别和高效的内容审核

来源：伙乘未来宇宙 时间：2023-07-19 作者：伙乘未来宇宙 浏览量：

依图语音开放平台：提供短语音听写、长语音转写、实时语音转写等功能

依图具有全栈AI技术能力，拥有世界级领先的算法能力，全面解决机器听、看、说、理解等方面的问题。

在内容安全上，以丰富的行业经验与深刻的行业理解，为全球客户提供高标准的在线业务风控解决方案。

同时依图致力于提供协同驱动人工智能的发展和应用普及，提供接入便捷的实人认证、实时语音游戏等标准化产品。

依图语音开放平台是一个提供语音识别服务的平台。以下是介绍依图语音开放平台的几个方面：

依图语音识别算法的性能表现非常优秀。在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上，依图语音识别算法最近测得多项第一。在AISHELL2-2018A-EVAL数据集中，依图语音识别准确率达到96.29%，字错率（CER）为3.71%，领先第二名约17%。

依图语音支持用户自定义热词，以提升非热门专业词汇的识别准确率。同时，依图语音经过海量专业词汇数据训练，垂直领域的专业词汇识别准确率位于行业前列，常见垂直领域包括金融、医疗、科技、娱乐等。

依图短语音听写产品包含REST API和SDK，提供不超过60秒的语音识别服务，支持中文普通话，并且兼容多种口音。依图语音识别为开发者提供准确高效的语音转文字功能。

依图语音还提供了一种针对违规音频的识别服务，可以准确、快速识别违规音频，最大程度地保障平台内容安全。

依图语音开放平台有哪些功能？

1. 语音识别：支持99.2%的正确率，可以快速准确地将语音转写为文字。

2. 音频审核：提供高精度的ASR模型，支持定制配置，可以识别娇喘、声纹、国歌等违规内容。

3. 图像审核：拥有18亿人像库，可以精准高效地识别图片中的色情、涉政、暴恐等风险内容。

4. 文本审核：支持各种文字变体的识别，可以高效过滤违规内容。

5. 敏感人声识别：可以识别涉政音频，支持快速定制音频库。

6. 敏感歌曲识别：可以检测音频中是否包含违禁歌曲等敏感内容。

7. 娇喘识别：可以检测音频中的娇喘、呻吟等涉黄内容。

8. 声音鉴伪：可以检测音频是否为后期合成声音。