Loading...

依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能

AI大模型2个月前发布 阿强
38 0

依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能

依图具有全栈能力,拥有世界级领先的算法能力,全面解决机器听、看、说、理解等方面的问题。

在内容安全上,以丰富的行业经验与深刻的行业理解,为全球客户提供高标准的在线业务风控解决方案。

同时依图致力于提供协同驱动的发展和应用普及,提供接入便捷的实人认证、实时语音游戏等标准化产品。

依图语音开放平台是一个提供语音识别服务的平台。以下是介绍依图语音开放平台的几个方面:

依图语音识别算法的性能表现非常优秀。在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上,依图语音识别算法最近测得多项第一。在AISHELL2-2018A-EVAL数据集中,依图语音识别准确率达到96.29%,字错率(CER)为3.71%,领先第二名约17%。

依图语音支持用户自定义热词,以提升非热门专业词汇的识别准确率。同时,依图语音经过海量专业词汇,垂直领域的专业词汇识别准确率位于行业前列,常见垂直领域包括金融、医疗、科技、娱乐等。

依图短语音听写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。依图语音识别为开发者提供准确高效的语音转文字功能。

依图语音还提供了一种针对违规音频的识别服务,可以准确、快速识别违规音频,最大程度地保障平台内容安全。

依图语音开放平台:https://speech.yitutech.com/

依图语音开放平台:提供短语音听写、长语音转写、实时语音转写等功能插图

    © 版权声明

    相关文章

    暂无评论

    暂无评论...