依图语音开放平台:- 依图语音开放平台 (yitutech.com)
依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能
依图具有全栈AI技术能力,拥有世界级领先的算法能力,全面解决机器听、看、说、理解等方面的问题。
在内容安全上,以丰富的行业经验与深刻的行业理解,为全球客户提供高标准的在线业务风控解决方案。
同时依图致力于提供协同驱动人工智能的发展和应用普及,提供接入便捷的实人认证、实时语音游戏等标准化产品。
依图语音开放平台是一个提供语音识别服务的平台。以下是介绍依图语音开放平台的几个方面:
依图语音识别算法的性能表现非常优秀。在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上,依图语音识别算法最近测得多项第一。在AISHELL2-2018A-EVAL数据集中,依图语音识别准确率达到96.29%,字错率(CER)为3.71%,领先第二名约17%。
依图语音支持用户自定义热词,以提升非热门专业词汇的识别准确率。同时,依图语音经过海量专业词汇数据训练,垂直领域的专业词汇识别准确率位于行业前列,常见垂直领域包括金融、医疗、科技、娱乐等。
依图短语音听写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。依图语音识别为开发者提供准确高效的语音转文字功能。
依图语音还提供了一种针对违规音频的识别服务,可以准确、快速识别违规音频,最大程度地保障平台内容安全。
依图语音开放平台有哪些功能?
1. 语音识别:支持99.2%的正确率,可以快速准确地将语音转写为文字。
2. 音频审核:提供高精度的ASR模型,支持定制配置,可以识别娇喘、声纹、国歌等违规内容。
3. 图像审核:拥有18亿人像库,可以精准高效地识别图片中的色情、涉政、暴恐等风险内容。
4. 文本审核:支持各种文字变体的识别,可以高效过滤违规内容。
5. 敏感人声识别:可以识别涉政音频,支持快速定制音频库。
6. 敏感歌曲识别:可以检测音频中是否包含违禁歌曲等敏感内容。
7. 娇喘识别:可以检测音频中的娇喘、呻吟等涉黄内容。
8. 声音鉴伪:可以检测音频是否为后期合成声音。
9. 图像鉴伪:可以检测图片/视频是否为后期合成内容。
应用场景:
1. 社交娱乐:可以用于直播平台的内容审核,识别涉政、辱骂、色情等违规内容。
2. 金融企业:可以用于语音识别和声纹识别,提供安全的身份验证和客户服务。
3. 云服务商:可以用于音视频处理和内容审核,提供安全可靠的云服务。
依图语音开放平台如何使用?
用户可以通过依图语音开放平台的控制台进行注册和登录,然后根据具体需求选择相应的功能进行调用。详细的使用方式和接口文档可以在帮助中心中查看。