电子工程师技术服务社区
公告
登录
|
注册
首页
技术问答
厂商活动
正点原子
板卡试用
资源库
下载
文章
社区首页
问答
语音识别都有哪些开放的云平台
已解决
73482
个问题
已帮助
5993
位优秀工程师
语音识别都有哪些开放的云平台
Angel_YY
2018-10-30
浏览量:1270
最好是免费的,主要用来测试语音项目。
显示全部
嵌入式
关注问题
写回答
0
0
收起
我来回答
上传资料:
选择文件
文件大小不超过15M(格式支持:doc、ppt、xls、pdf、zip、rar、txt)
最佳答案
wo4fisher
庆科、百度云、科大讯飞,目前已知的庆科正在做一个活动,万物有声,用他家开发的模组,使用串口就可以进行语音合成和语音识别,但是需要一个模块。百度提供免费的语音识别和语音合成接口,可以免费使用,有API和SDK。
发布于
2018-10-30
举报
评论 0
0
0
其他答案
数量:
14
yhj416606438
阿里云和庆科云对个人用户是免费的
发布于
2018-10-30
举报
评论 0
0
0
捷波
比较知名的有百度云、阿里云、科大讯飞
发布于
2018-10-30
举报
评论 0
0
0
liuxiaofei126
百度的dueros平台目前是开源的,调用非常方便
发布于
2018-10-30
举报
评论 0
0
0
dreamadmirer
百度的DueRos
发布于
2018-10-30
举报
评论 0
0
0
涛涛涛涛涛
有钱可以考虑科大讯飞,没钱就阿狸啊,百度啊
发布于
2018-10-30
举报
评论 0
0
0
放电
阿里云的吧,庆科的也是免费的
发布于
2018-10-30
举报
评论 0
0
0
飞羽扑火
庆科最近比赛,免费使用的
发布于
2018-10-30
举报
评论 0
0
0
drepa
像百度DuerOS那种就是开源的,庆科的貌似也算是开源平台。
发布于
2018-10-31
举报
评论 0
0
0
FEItwo
语音识别开发平台有很多,具体总结如下:(更详细的介绍参见本人的博文:几个常见的语音交互平台的简介和比较)
1.商业化的语音交互平台
1)微软Speech API
微软的Speech API(简称为SAPI)是微软推出的包含语音识别(SR)和语音合成(SS)引擎的应用编程接口(API),在Windows下应用 广泛。目前,微软已发布了多个SAPI版本(最新的是SAPI 5.4版),这些版本要么作为于Speech SDK开发包发布,要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读,包括英文、中文、日文等。
2).IBM viaVoice
IBM是较早开始语音识别方面的研究的机构之一,早在20世纪50年代末期,IBM就开始了语音识别的研究,计算机被设计用来检测特定的语言 模式并得出声音和它对应的文字之间的统计相关性。1999年,IBM发布了VoiceType的一个免费版。2003年,IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权,随后ScanSoft与Nuance合并,如今viaVoice早已淡出人们的视线,取而代之的是Nuance。
3)Nuance
Nuance通讯是一家跨国计算机软件技术公司,总部设在美国马萨诸塞州伯灵顿,主要提供语音和图像方面的解决方案和应用。目前的业务集中 在服务器和嵌入式语音识别,电话转向系统,自动电话目录服务等。Nuance语音技术除了语音识别技术外,还包扩语音合成、声纹识别等技术。世界语音技术市场,有超过80%的语音识别是采用Nuance识别引擎技术, 其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。苹果的iPhone 4S的Siri语音识别中就应用了Nuance的语音识别服务。
4)科大讯飞
科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项 技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额,语音合成产品市场份额达到70%以上。
5)其他
其他的影响力较大商用语音交互平台有谷歌的语音搜索(Google Voice Search),百度和搜狗的语音输入法等等。
2.开源的语音交互平台
1)CMU-Sphinx
CMU-Sphinx也简称为Sphinx(狮身人面像),是卡内基 - 梅隆大学( Carnegie Mellon University,CMU)开发的一款开源的语音识别系统, 它包括一系列的语音识别器和声学模型训练工具。最早的Sphinx-I 由@李开复 (Kai-Fu Lee)于1987年左右开发,使用了固定的HMM模型(含3个大小为256的codebook),它被号称为第一个高性能的连续语音识别 系统(在Resource Management数据库上准确率达到了90%+)。 最新的Sphinx语音识别系统包含如下软件包:
Pocketsphinx — recognizer library written in C.
Sphinxba
se — support library required by Pocketsphinx
Sphinx4 — adjustable modifiable recognizer written in Java
CMUclmtk — language model tools
Sphinxtrain — acoustic model training tools
这些软件包的可执行文件和源代码在sourceforge上都可以免费下载得到。
2)HTK
HTK是Hidden Markov Model Toolkit(隐马尔科夫模型工具包)的简称,HTK主要用于语音识别研究,最初是由剑桥大学工程学院(Cambridge University Engineering Department ,CUED)的机器智能实验室(前语音视觉及机器人组) 于1989年开发的,它被用来构建CUED的大词汇量的语音识别系统。HTK的最新版本是09年发布的3.4.1版,关于HTK的实现原理和各个工具的使用方法可以参看HTK的文档HTKBook。
3)Julius
Julius是一个高性能、双通道的大词汇量连续语音识别(large vocabulary continues speech recognition,LVCSR)的开源项目, 适合于广大的研究人员和开发人员。它使用3-gram及上下文相关的HMM,在当前的PC机上能够实现实时的语音识别,单词量达到60k个。
4)RWTH ASR
该工具箱包含最新的自动语音识别技术的算法实现,它由 RWTH Aachen 大学的Human Language Technology and Pattern Recognition Group 开发。RWTH ASR工具箱包括声学模型的构建、解析器等重要部分,还包括说话人自适应组件、说话人自适应训练组件、非监督训练组件、个性化 训练和单词词根处理组件等。
5)其他
上面提到的开源工具箱主要都是用于语音识别的,其他的开源语音识别项目还有Kaldi 、simon 、iATROS-speech 、SHoUT 、 Zanzibar OpenIVR 等。
发布于
2018-10-31
举报
评论 0
0
0
FEItwo
语音识别开发平台有很多,具体总结如下:(更详细的介绍参见本人的博文:几个常见的语音交互平台的简介和比较)
1.商业化的语音交互平台
1)微软Speech API。。。网上有
发布于
2018-10-31
举报
评论 0
0
0
chen0000009
目前完全开放的平台还没有,但部分开放的,就是商用要钱,但对于开发者免费提供一段时间服务的有百度DuerOS和亚马逊AWS平台
发布于
2018-11-09
举报
评论 0
0
0
木兮青鱼
这个可以参考一下阿里云的平台,但是是要收费的,使用的效果也很不错
发布于
2018-11-25
举报
评论 0
0
0
Kylo
建议使用科大的方案,实际的效果比较好
发布于
2018-11-27
举报
评论 0
0
0
Reuben
科大讯飞和阿里云的平台都很好用
发布于
2018-12-10
举报
评论 0
0
0
相关问题
问题达人
换一批
文章
知识经验换现金
换一批
语音识别都有哪些开放的云平台
写回答
关注问题
×
我要举报该内容,理由是:
内容质量差:
内容太水、伸手党
垃圾广告信息:
广告、招聘、推广、测试内容等
偏离问答主题:
与技术无关、讨论类
与社区已有内容重复:
违规内容:
色情、暴力、血腥、敏感信息等
不友善内容:
人事攻击、挑衅辱骂、恶意行为
以上选项都不是: