语音识别期刊有哪些专利

3个回答默认排序

默认排序

按时间排序

shenli83浪漫满屋

已采纳

语音识别开发平台有很多，具体总结如下：商业化的语音交互平台1)微软Speech API微软的Speech API（简称为SAPI）是微软推出的包含语音识别（SR）和语音合成（SS）引擎的应用编程接口（API），在Windows下应用广泛。目前，微软已发布了多个SAPI版本（最新的是SAPI 4版），这些版本要么作为于Speech SDK开发包发布，要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读，包括英文、中文、日文等。2)IBM viaVoiceIBM是较早开始语音识别方面的研究的机构之一，早在20世纪50年代末期，IBM就开始了语音识别的研究，计算机被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性。1999年，IBM发布了VoiceType的一个免费版。2003年，IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权，随后ScanSoft与Nuance合并，如今viaVoice早已淡出人们的视线，取而代之的是Nuance。3）NuanceNuance通讯是一家跨国计算机软件技术公司，总部设在美国马萨诸塞州伯灵顿，主要提供语音和图像方面的解决方案和应用。目前的业务集中在服务器和嵌入式语音识别，电话转向系统，自动电话目录服务等。Nuance语音技术除了语音识别技术外，还包扩语音合成、声纹识别等技术。世界语音技术市场，有超过80%的语音识别是采用Nuance识别引擎技术，其名下有超过1000个专利技术，公司研发的语音产品可以支持超过50种语言，在全球拥有超过20亿用户。苹果的iPhone 4S的Siri语音识别中就应用了Nuance的语音识别服务。4）科大讯飞科大讯飞作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额，语音合成产品市场份额达到70%以上。5）其他其他的影响力较大商用语音交互平台有谷歌的语音搜索（Google Voice Search），百度和搜狗的语音输入法等等。开源的语音交互平台1）CMU-SphinxCMU-Sphinx也简称为Sphinx（狮身人面像），是卡内基 - 梅隆大学（ Carnegie Mellon University，CMU）开发的一款开源的语音识别系统，它包括一系列的语音识别器和声学模型训练工具。最早的Sphinx-I 由@李开复（Kai-Fu Lee）于1987年左右开发，使用了固定的HMM模型（含3个大小为256的codebook），它被号称为第一个高性能的连续语音识别系统（在Resource Management数据库上准确率达到了90%+）。最新的Sphinx语音识别系统包含如下软件包： Pocketsphinx — recognizer library written in C Sphinxbase — support library required by Pocketsphinx Sphinx4 — adjustable, modifiable recognizer written in Java CMUclmtk — language model tools Sphinxtrain — acoustic model training tools这些软件包的可执行文件和源代码在sourceforge上都可以免费下载得到。2）HTKHTK是Hidden Markov Model Toolkit（隐马尔科夫模型工具包）的简称，HTK主要用于语音识别研究，最初是由剑桥大学工程学院（Cambridge University Engineering Department ，CUED）的机器智能实验室（前语音视觉及机器人组）于1989年开发的，它被用来构建CUED的大词汇量的语音识别系统。HTK的最新版本是09年发布的1版，关于HTK的实现原理和各个工具的使用方法可以参看HTK的文档HTKBook。3）JuliusJulius是一个高性能、双通道的大词汇量连续语音识别（large vocabulary continues speech recognition，LVCSR）的开源项目，适合于广大的研究人员和开发人员。它使用3-gram及上下文相关的HMM，在当前的PC机上能够实现实时的语音识别，单词量达到60k个。4）RWTH ASR该工具箱包含最新的自动语音识别技术的算法实现，它由 RWTH Aachen 大学的Human Language Technology and Pattern Recognition Group 开发。RWTH ASR工具箱包括声学模型的构建、解析器等重要部分，还包括说话人自适应组件、说话人自适应训练组件、非监督训练组件、个性化训练和单词词根处理组件等。

225 评论 1小时前发布

ysatispaco

国际刊号办理需要哪些资料？1、提供该香港公司的注册证书或商业登记证复印件（若有）；2、提供申请刊物的封面和版权页；3、提供刊物的中、英文名称及汉语拼音；4、刊物首期出版日期；5、刊物出版周期（如月刊、半月刊等）。注意事项当该刊名变更时，就得另申请一个 ISSN 。如果期刊停刊，那么被删除的 ISSN 也不会被其它期刊再使用。因此，国际期刊资料系统中心在分配 ISSN 时，必须为该期刊编订一个有别于其它期刊刊名的识别题名 (KeyTitle)

123 评论 2小时前发布

fionazhang77

商业化的语音交互平台：1)微软Speech API微软的Speech API（简称为SAPI）是微软推出的包含语音识别（SR）和语音合成（SS）引擎的应用编程接口（API），在Windows下应用广泛。目前，微软已发布了多个SAPI版本（最新的是SAPI 4版），这些版本要么作为于Speech SDK开发包发布，要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读，包括英文、中文、日文等。2)IBM viaVoiceIBM是较早开始语音识别方面的研究的机构之一，早在20世纪50年代末期，IBM就开始了语音识别的研究，计算机被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性。1999年，IBM发布了VoiceType的一个免费版。2003年，IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权，随后ScanSoft与Nuance合并，如今viaVoice早已淡出人们的视线，取而代之的是Nuance。3）NuanceNuance通讯是一家跨国计算机软件技术公司，总部设在美国马萨诸塞州伯灵顿，主要提供语音和图像方面的解决方案和应用。目前的业务集中在服务器和嵌入式语音识别，电话转向系统，自动电话目录服务等。Nuance语音技术除了语音识别技术外，还包扩语音合成、声纹识别等技术。世界语音技术市场，有超过80%的语音识别是采用Nuance识别引擎技术，其名下有超过1000个专利技术，公司研发的语音产品可以支持超过50种语言，在全球拥有超过20亿用户。苹果的iPhone 4S的Siri语音识别中就应用了Nuance的语音识别服务。4）科大讯飞科大讯飞作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额，语音合成产品市场份额达到70%以上。5）其他其他的影响力较大商用语音交互平台有谷歌的语音搜索（Google Voice Search），百度和搜狗的语音输入法等等。

134 评论 2小时前发布

语音识别期刊有哪些专利

3个回答 默认排序 默认排序 按时间排序

相关问答

论文问答

向你推荐

热门问题

3个回答默认排序

默认排序

按时间排序