关闭
您当前的位置:首页 > 伙乘资讯 > 20AI大模型

依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能,具备高精度、快速、广泛兼容的特点,可以帮助用户实现精准的语音识别和高效的内容审核

来源:伙乘AI 时间:2023-07-19 作者:伙乘AI 浏览量:

1689729463077.png


依图语音开放平台:- 依图语音开放平台 (yitutech.com)


依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能

依图具有全栈AI技术能力,拥有世界级领先的算法能力,全面解决机器听、看、说、理解等方面的问题。

在内容安全上,以丰富的行业经验与深刻的行业理解,为全球客户提供高标准的在线业务风控解决方案。

同时依图致力于提供协同驱动人工智能的发展和应用普及,提供接入便捷的实人认证、实时语音游戏等标准化产品。


依图语音开放平台是一个提供语音识别服务的平台。以下是介绍依图语音开放平台的几个方面:

依图语音识别算法的性能表现非常优秀。在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上,依图语音识别算法最近测得多项第一。在AISHELL2-2018A-EVAL数据集中,依图语音识别准确率达到96.29%,字错率(CER)为3.71%,领先第二名约17%。


依图语音支持用户自定义热词,以提升非热门专业词汇的识别准确率。同时,依图语音经过海量专业词汇数据训练,垂直领域的专业词汇识别准确率位于行业前列,常见垂直领域包括金融、医疗、科技、娱乐等。

依图短语音听写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。依图语音识别为开发者提供准确高效的语音转文字功能。

依图语音还提供了一种针对违规音频的识别服务,可以准确、快速识别违规音频,最大程度地保障平台内容安全。


依图语音开放平台有哪些功能?

1. 语音识别:支持99.2%的正确率,可以快速准确地将语音转写为文字。

2. 音频审核:提供高精度的ASR模型,支持定制配置,可以识别娇喘、声纹、国歌等违规内容。

3. 图像审核:拥有18亿人像库,可以精准高效地识别图片中的色情、涉政、暴恐等风险内容。

4. 文本审核:支持各种文字变体的识别,可以高效过滤违规内容。

5. 敏感人声识别:可以识别涉政音频,支持快速定制音频库。

6. 敏感歌曲识别:可以检测音频中是否包含违禁歌曲等敏感内容。

7. 娇喘识别:可以检测音频中的娇喘、呻吟等涉黄内容。

8. 声音鉴伪:可以检测音频是否为后期合成声音。

9. 图像鉴伪:可以检测图片/视频是否为后期合成内容。


应用场景:

1. 社交娱乐:可以用于直播平台的内容审核,识别涉政、辱骂、色情等违规内容。

2. 金融企业:可以用于语音识别和声纹识别,提供安全的身份验证和客户服务。

3. 云服务商:可以用于音视频处理和内容审核,提供安全可靠的云服务。


依图语音开放平台如何使用?

用户可以通过依图语音开放平台的控制台进行注册和登录,然后根据具体需求选择相应的功能进行调用。详细的使用方式和接口文档可以在帮助中心中查看。


1.jpg

微信扫一扫分享资讯

相关推荐
暂无相关推荐
热门话题
推荐文章