首页>>厂商>>系统集成及应用软件开发商>>广州新太科技公司

新太TTS/ASR系统介绍

  人类 花了近30年的时间才使语音识别技术得以实用化,人们可以与计算机自由地交谈和沟通,实现"动口不动手"的美好愿望。尤其是近年来 Internet 的高速发展,让语音识别技术有了更广阔的应用前景和实用意义。

  网络时代,电话访问WEB 点和E-MAIL信息是一 个面向大众提供企(事)业单位基本信息的大型资料库,其内容十分丰富,用户可以通过多种方式查询到感兴趣单位的信息,是企业面向市场、面向大众提供优质服务的增值服务。

  传统的电话查询WEB信息和E -MAIL信息只能通过168台进行,所以对大部分企业用户来讲,文本资料要首先录制成语音 文件,然后才能提供服务,效率低 、存储空间大,维护十分复杂,扩充困难。特别是对于一些如天气查询、股票行情的查询等,对用户来说,每查询一个信息都要根据语音提示进行大量的按键操作,而且容易出错。

  而新太集团作为一个在信息 行业研究多年的服务提供 商,一直跟踪市场、关注用户最新需求,并敏锐地洞察到了这种信息交互的低效性后,随组织人力进行跟踪开发。于今年初推出了新太又一成熟的新产品TTS/ASR(文语转换 TEXT TO SPEECH /自动语音识别 AUTOMATIC SPEECH RECOGNITION )系统。

  文语 转化系统提供了实时语音文本互相转化的功能。通过TTS不仅节省了语音文件的空间1000 倍,而且解决了一些无法进行实时录音的功能,减轻了工作量,提高了实时性(信息的时效性)。通过ASR使用户不需进行烦琐的按键操作就可快捷的查找到自己感兴趣的信息。

一、系统总体设计

  TTS是一 个专业级的中文文语转换系统 ,所处理的资料以中文文本文件的资料为主。新太TTS是新太根据中国人自己的语音特色和规律开发出来的,其发音语调的准确率和多音字及词组的处理已经达到商业化的级别。

  ASR 语音识别是一个较新兴的技术,具有极大的发展潜力和应用市场。目前新太科技利用Philips最先进的自然语音识别平台Speech Pearl 开发出一 套适合电信业务和一般企业具有完整语音识别功能的系统。目前已出的版本提供英语,普通话的识别,可根据用户具体需求,在以后的版本中还可提供粤语及其它地方方言的识别。

  新太科技将这套系统集成到 新太的NAP2000IVSP声讯平台中, 以拓展信息交互的应用领域。应用领域包括:160/168声讯服务系统、客户服务中心系统、航班时刻信息查询及股票查询系统、无线寻呼、号码查询系统、天气预报系统等。

1 系统结构

TTS服务器

  TTS 关建立在新太NAP2000IVSP、声讯平台上,是由数据库查询、数据组织、文语转化、语 音文件生成等服务 构成的原型系统。运行系统包括上述4个组成部分。在实际工作中,可以在一台NT上运行。一台NT可以同时服务16个用户的文语转化,以一个声讯系统同时20%的通道使用 TTS的功能,则可以服务3E190线)规模的系统。

其功能包括:

ASR服务器

  目前新太集团利用Philips最先进的自然语音识别平台SpeechPearl 开发出一套适合 电信业务和一般企业具有完整语音识别功能的系统。新太集团将这套系统集成到新太的NA P2000IVSP声讯平台中,以拓 展语音识别技术的应用领域。应用领域包括:160168声讯服务系统、客户服务中心系统、航班时刻信息查询及股票查询系统、无线寻呼、号码查询系统、天气预报系统等。

  平台IVR节点将用户的语音 录下来,将其保存在网络文件系统中的一个文件中,并将该文件的绝对路径传给ASR网关 ASR网关根据其配置文件,找到其网关对应的网络路径,然后将该文件的 语音数据传给ASR网关的后台引擎,后台引擎根据给定的语法规定将语音识别出来,识别结果返回给ASR网关存储在网络文件中,同时将识别结果的相关信息传给IVR节点。

网关服务器

  网关 服务器实现与其他异构网络、专业数据库连 接时数据的传输及通信。网关服务器可视业务及系统、数据库的不同而采用不同的数据通讯协议转换模块。各网关通过在网关服务器内注册就可接入系统,通过网关服务器可方便地 实现与第三方数据源如气象局、民航、银行、证券等的数据交互。

2、新太TTS/ASR系统工作流程

根据用户的具体要求目前有两种实现流程:

适于文件比较长且文语较复杂的语音合成。

  用户打电话进入系统,IVR 节点将用户的语音信息录制成语音文件存储在网络文件系统的一个文件中,并将该文件的 绝对路径传给ASR网关,ASR网关根据其配置文件,找到其网关对应的网络路径,然后将该 文件的语音数据传给ASR网关后台引擎,后台引擎根据给定的语法规定将语音识别出来, 将识别结果返回给ASR网关,将其存储在网络文件系统中,同时将识别完成信息传给IVR 点。IVR节点根据用户请求启 动相应流程调用TTS网关,TTS网关根据取得的请求,向指定的数据库进行访问,将取得的相关信息转化为文本信息,调用文语转化模块将文本信息合成语音信息播放给用户。

适于一些简单的文本信息及数据信息,可由系统调用流程自动合成。

  系统 预先将一些 简单信息录制成语音文件存放在语音文件中,ASR直接将识别的用户语音信息转化为文本信息存储在文件系统中,IVR节点根据识别结果将语音信息进行合成,再播放给用户。

二、业务功能举例

  新太TTS/ASR系统是一个完 整的平台,根据新太自身业务功能特点,我们将其建立在NAP2000IVSP平台上,主要是 针对原来平台上业务的新的应用,可以支持多种数据库和文本文件的同时访问。系统能提 供集中式的文语转 换功能、自动语音识别功能、全文检索功能、格式转化功能,数据库访问功能、以及二次开发功能等。在此系统平台上可开通多种业务,目前已实现的业务如:电话听E-MAIL 、语音查询天气、股票行情查询、航班查询等多种通过语音取代按键操作的自动语音播放信息查询业务。

1、天气查询

  与传统的天气查询 不同的是,用户通过拨打一特服号接入到系统后,不用在系统语音提示下进行多次按键选 择,只需在系统语音提示下对着电话说出自己所要查询的城市名即可查到自己所要的信息 。这种方式对用户来说快捷方便,适于要查找多个地方的天气情况 ,每查找完一个信息不用退出系统重新选择,只需根据系统语音提示报出你所另外要查找的地名即可。因为每天的天气是动态变化的,所以平台要通过网关到气象局实时取得数据。

2、股票行情查询

  证券交 易市场的发展伴随着经济的发展而发展,股市的动态牵动着千万股民的心,为了方便股民 及时快捷的查找股市行情,提供一种实时语音交互的信息查询是市场与客户所迫切需要的 。股民只需对着电话简单的说出所要查找的股票代 码即可获得所需的信息。股市是随时动态变化的,对用户的查询信息通过网关实时到证券所数据库取得相关信息,送往TTS文语转换模块转换为语音文件通过IVR播放给用户。

3、航班查询

  随着 社会的发展,人们出差旅游的机会越来越多,对各地航班的查询访问量也更频繁。传统航 班查询都是通过话务员或航班公司售票处座席提供服务,利用新太TTS/ASR系统,用户直 接对着电话说 出所要查询的航班,平台通过网关到航空公司数据库查找,查找到的信息送至TTS文语合成模块,根据ASR识别的用户语音请求,将相应用户信息通过IVR节点播放给用户。

4、电话收发E-mail

  用电话接收E-mail的方法可 以有两种,传统的方法是由话务员把E- mail的内容直接念给用户听。另一种即利用TTS技术,平台读取E-mail的内容,然后把文本内容送往文语转换模块将其转化为语音信息,通过IVR节点播放给用户。

  用电话发E-mail业务是指用 户通过电话接入系统,用户打电话告知系统所要发信的目的电 子邮件地址,由ASR自动识别系统内已定义好的IP地址,通过IVR节点录音的语音文件以附件的方式生成Email通过Internet发送到对方的Email信箱中。

  通过电话收发E-mail大大的方便了那些上网不方便,但又需要通过E-mail与外界联系的朋友。

2001/03/30

语音互联网平台介绍