首页>>厂商>>语音识别与合成>>得意音通

口语学习的革命——得意口语学习系统

2004/10/09

一、得意口语学习系统简介

  得意公司拥有出色的语音识别技术,可应用于自动化和智能化的汉语/英语口语练习与测试评价,为口语学习者提供了一个全新的学习模式,将成为中国人学外语和外国人学汉语的重要工具,带来新的一轮"学习的革命"。

  "得意"口语学习系统的原理是基于语音音素及其他参数的提取与分割,将使用者的语音音素系列与标准模型的语音音素序列进行自动比对,并将比对结果通过视图形象而直观地给出,从而对学习者的语音给出恰当的评价(比如对每个音素给出一个得分等),以帮助其改进和提高口语发音,使其接近或达到语音的标准水平。由于利用可视化的朗读评分等人机交互的方式,而且通过视觉、听觉等综合手段,反复提示和帮助用户接近标准发音,因而显著提高了学习者的学习兴趣,这对提高英语学习成绩有很多帮助。

二、得意口语学习系统强大的功能

得意口语学习系统主要功能包括:


功能具体说明:

  (1)能够显示标准声音和用户录音的声调曲线,从而以形象的提示,辅助用户的声调发音联系;
  (2)能够清楚地区分出音节;
  (3)能够在一个连续的句子发音中,指出哪个音节的声调不准确,那个音节的发音有问题;
  (4)能够对于局部进行评分,能够对整体进行评分。除识别单词外,系统还将接收到的语音信号作出定位,并寻找出含有相关音段、音节及单词的具体位置。为这些语言单位(音段、音节和单词)产生出基准测定,从而评定受测者的口语表达的内容和流利程度。

三、得意口语学习系统广泛的应用

  1、语言学习软件/VCD--随时可学的口语家教可把得意口语学习系统集成到语言学习软件和VCD中,满足不同层次、不同需求的各类用户:
等等

2、复读机/mp3口语学习--随身携带的口语教师

  可与复读机/mp3配套使用,用户可直接对着麦克风朗读,也可把录音与标准模型对照,提供了更方便和全面的口语训练方案。

3、网络远程口语培训--由你作主的口语教室
  支持网络远程服务,系统可实时处理众多用户通过网络传来的语音,1台普通的奔腾四PC服务器,并发处理能力为20~50个用户(系统处理能力与业务流程设计有关),用户可随时上网选择自己所需的内容进行个性化的学习和训练。

4、电话/网络口语考试--公正权威的口语裁判
  用户可通过电话或者网络,接入得意的口语学习测试系统,在系统的引导下,测试用户的日常对话的整体能力、正确性和流畅性。此方案非常适合教育机构、商业企业、政府部门方便、快捷、可靠、客观地考核各类人才的口语能力和会话水平,应用于优秀人才聘用、工作能力考察、设定入学和毕业标准、评估教学成效等领域。

四、国际水平的得意语音识别技术

  ASR是自动语音识别(Automatic Speech Recognition)的缩写,其目标是让计算机能够辨别出人们所说的话的内容。ASR通常有以下几种分类方法:

(1) 特定人和非特定人;
(2) 小词汇量、中词汇量和大词汇量;
(3) 语音命令(孤立词)识别、关键词检出,以及连续语音识别(听写)等。

  其中(1)语音命令识别引擎要求用户所说的语音中最多只能含有一个词表中定义的词;(2)关键词检出引擎中则允许用户所说的语音中除了含有一个或多个词之外,还可以包含其它无关的内容,识别器将只检测出那些在词表中定义过的词,同时忽略其它无关的内容;(3)连续语音识别引擎则会把用户所说的语音逐字逐句地转换为文字,是实现"声音"到"文字"转换的技术,它的实现中涉及到声学模型和语言模型:声学模型用以从声音信号中识别出"音(例如拼音)",而语言模型用以把"音"转换成"字(例如有意义的文本语句)"。

  得意非特定人语音命令识别API v3.0的特点有:非特定人、连续语音;孤立词词表可以更改;目前支持标准普通话;阈值 (或称操作点) 可以调整;高效、精确、灵活、可靠;以及基于客户端/服务器模式的框架结构 (多线程+多事件)。

  (1) 非特定人:说话人不限年龄、性别、口音,只要基本上是说普通话即可;
  (2) 连续语音:能够识别连续语音。用户可以自然地与得意接线员对话,不需刻意停顿或强调。
  (3) 关键词检出:能够从用户所说的句子中检出其中的关键词如名字和部门等信息从而帮助用户顺利地转接电话。
  (4) 高识别率:对固定电话、手机电话等均能够准确地识别,正确识别率高达99%以上。
  (5) 实时的语音识别:优化设计的识别引擎使得得意接线员能够实时地为用户实现电话接转。
  (6) 与硬件无关:识别引擎不需要引入额外的硬件即可实时处理语音流。与电话卡无关的特性使得用户可以基于任何电话卡构建自己的语音互联网络系统。

  得意公司的发展战略是,与国内外公司和机构开展广泛深入的合作,为它们提供最佳的技术成果、解决方案和信息服务。得意公司的市场定位是:为硬件生产商、软件开发商、系统集成商、通讯网络运营商、通信增值服务平台运营商等提供相应的应用编程接口(API)和/或软件开发工具包(SDK),或者捆绑、集成定制的软件系统。

得意音通公司供稿 CTI论坛编辑



相关链接:
得意珠三角综合智能信息增值平台项目中标 2009-08-20
北京软件产品质量检测检验中心对《海量语音文件的目标说话人筛选系统》进行测试 2009-06-25
广东政府和清华大学举行了全面开展产学研合作协议签约仪式 2009-06-25
得意中文整句输入法V1.0开源for Windows Mobile5.0 2009-01-23
得意声纹识别VPR4.0_b20080808新版本发布 2008-08-27

分类信息:     行业_教育_解决方案   技术_语音识别_解决方案