江北嘴投资集团>>两江新区>>正文

全球最新语音识别世界纪录在两江新区诞生

2018/11/14 14:26:34  来源:两江新区官网

 

      依托全市最大数字经济产业园,两江新区人工智能产业正迅速发展。记者从两江新区获悉, 10月 29日,入驻两江新区数字经济产业园的AI独角兽重庆中科云丛科技有限公司在语音识别技术上取得重大突破,该企业融合图像识别与语音识别的优势,推出了全新Pyramidal-FSMN语音识别模型,超过微软、IBM、阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新语音识别世界纪录。

    超越人类专业速记员水平

    云从科技领跑人工智能行业

    据悉,语音识别技术是智能感知的重要部分,通过语音识别,机器就可以像人类一样听懂说话,进而能够理解、思考与反馈。近年来,在深度学习技术的帮助下,语音识别取得了极大的进展,从实验室开始走向市场,走向实用化。基于语音识别技术的输入法、搜索和翻译等人机交互场景都有了广泛的应用。2018年6月,阿里巴巴达摩院推出了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%,错词率降低至3.96%。

    由云从科技自主研发的全新Pyramidal-FSMN语音识别模型在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率(Worderrorrate,WER)降低至2.97%,较之前提升了25%,已超越人类专业速记员水平。

    同时,该模型融合图像识别与语音识别的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合, 能够同时有效的提取空间和时间上不同粒度的信息,对比目前业界使用最为广泛的LSTM模型,训练速度更快、识别准确率更高。

    “该突破将推动语音识别技术的大幅进步,也使得语音识别离更良好的智慧交互体验越来越近。”相关负责人告诉记者,此次突破标志着云从科技在今年4月刷新跨镜追踪技术(ReID)三项世界纪录后在新领域再次取得重大成果,也是云从科技打造核心技术闭环路径中的关键一步。

    记者了解到,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,此次语音识别突破属于智能感知中的一环。在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上,云从科技创始人周曦提出了人工智能发展的五个阶段,而核心技术闭环正是五个阶段的重要基础。云从科技在今年先后首发3D结构光人脸识别技术及刷新跨镜追踪技术三项世界纪录,并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”,正稳步推进从核心技术到智能生态的五步走战略。

    营商环境持续优化

    两江新区打造数字经济发展高地

    作为国家级开发开放新区,依托已建成的重庆市最大数字经济产业园,两江新区正不断优化营商环境,加速数字经济与实体经济融合发展,已集聚了一批数字经济优质企业。云从科技正是其中的代表之一。

    “无论是在办公场地、政策扶持还是人才培养上,两江新区都给予了我们很多帮助。” 云从科技创始人周曦告诉记者,随着规模扩大,云从科技更是即将迁入重庆两江数字经济产业园二期办公,依托两江新区优势资源,云从科技正在致力整合算力、智力、数据等资源及其成果,打造人工智能平台,进一步促进人工智能在金融、安防、交通、零售、教育等重要行业的落地。

    不只营商环境,人工智能作为将大数据、云计算资源整合、深化的纽带,在两江新区同样有着很好的产业发展环境。据周曦介绍,云从科技将通过和联通、浪潮等企业合作,把应用做活,形成场景化的解决方案,而中国联通大数据有限公司、浪潮集团等在两江新区已是早有布局。

    依托良好的产业、人才、基础设施等各方面的发展优势,两江新区正在数字经济建设方面持续发力,使其成为经济高质量发展的有力支撑。依托已建成的重庆最大数字经济产业园,两江新区下一步将全面升级打造“智慧两江”,形成全市大数据智能化经济发展的领头羊、主力军、展示窗口及高技术人才与数字经济企业聚集高地。    (两江新区记者 王丹)


集团概况

重庆市江北嘴中央商务区投资集团有限公司是重庆具有投融资功能的国有独资企业,注册资本20亿元。按照重庆市政府授权,公司主要负责江北嘴中央商务区和南岸区广阳岛的土地储备整治、市政基...【详细】

集团子公司