也谈语音识别技术在玩具领域的低成本应用

赵大有 2003/01/06

  据香港玩具厂商会最近完成的一项有关香港玩具业前景的调查报告分析,大部分玩具商认为电子和创新科技玩具将是未来三年的主流订购货品。为此,经香港立法局讨论通过,香港政府不久将成立"香港玩具创新设计中心",以帮助和推动玩具业的创新、高科技应用和设计师的水平。

  所谓的高科技对一般人而言,是那么的神秘莫测。有人说成本是产品销售的关键,在玩具上应用高科技是否符合玩具生产的低成本要求呢?在此,我要告诉大家的是,首先科技是为生产服务的,只有真正能推动生产力发展的科学技术,才会有生命力;再者,基于半导体技术的不断发展,高科技不仅能应用到玩具生产上,而且有许多畅销正是因为它们集成了多种高科技,才会变得更智能、更有趣,从而成为包括儿童和成人在内的各种人群的宠爱。

  玩具产品中的科技运用,离不开声、光、电三方面,语音(包括发声、说话、唱歌)、接触感觉、互动感应(包括触摸感应、光感应、热感应、语音感应)、动作控制(包括内部程序控制和外部线控、红外、射频、声控、语音控制)等。从技术看,低级到高级,简单到复杂都存在,从语音IC、智能IC、中央处理器,应用呈现出不同的台阶,既不会高不可攀也不存在高门槛,多层次的分布也为企业在产品中的运用提供了很大的空间。

  在国外,特别是在日本,玩具设计师往往会把科学家在智能机器人研究方面发明、创造的高新技术,从中选取一种应用到智能玩具的设计开发,或用来对传统玩具进行创新改造上。这些技术包括机械机构优化设计、语音识别技术、图像识别技术、路径规划、自主避障、电池电量检测、微电脑技术、物体跟踪技术、轨迹跟踪技术等等,以后我会为大家一一进行详尽的介绍;在此我挑选一种使用成本低、功能实用性强、易操作的技术推荐给大家——语音识别、语音合成技术。为什么呢?

  例如,当我们看到一名儿童与另一个天真烂漫的娃娃在进行着有趣的对话,那娃娃一会儿娓娓而谈,一会儿又唱又笑,她们之间的亲密程度已使人没有注意到其中有一个是玩具娃娃,这就是在传统的公仔玩具里植入了一颗语音识别芯片后,获得了生命力的高智能仿生娃娃。而当我们看到一个活泼可爱的宠物跟着它的主人撒欢,并随着主人的指令作者各种不同的动作,甚至还开口说话、唱歌了,你们不要奇怪,这就是利用语音识别技术设计出来的智能宠物玩具。这些有"灵感"能"思维",有听觉,能讲话的玩具的出现将打破自公仔玩具问世以来的长期聋哑感,并将给人们带来更多的能与之进行交流,甚至帮助孩子们学习成长的智能玩具。要达到上述这些类似人类特征的要求,唯一的条件是要使得娃娃听懂人们的问话,并经过"思考",能善解人意地答复问题。

  充分利用语音识别技术,就能做到上述要求。在20世纪六七十年代以来,语音识别的研究人员一直致力于语音识别专用芯片的研究,但是,大多数的语音识别专用芯片识别性能差,不具备实用的要求。直到近十年以来,随着语音识别算法的深入研究和集成电路技术的发展,才出现了一些具有实用价值和市场前景的语音识别专用芯片。其中,较为成功的芯片是由美国Sensory Integrated Circuit公司开发的RSC系列语音识别芯片,是一颗为消费类电子产品应用的低价位的语音识别专用芯片。

  依据专家的说法,语音识别技术现在正处于高速增长的状况,因为硅片价格和寄存器成本不断下滑,算法更复杂、完善,半导体技术也好过以前很多,应用前景非常广阔。

  确实,有好几家玩具公司正在使用SENSORY语音识别系列芯片并取得了辉煌的成绩,美国MGA公司的语音控制智能机器人玩具Commandobot,美国TIGER公司的机器宠物小鸟Chirpy-chi,日本SONY公司的智能机器狗Aibo等世界知名的流行玩具,无不是采用了美国Sensory公司的语音识别技术。

  Sensory的推广机构遍布全球,欧洲、美洲、在亚洲还有它专门的技术开发合作伙伴,深圳市捷通语音技术开发有限公司(WWW.SZJTVOICE.COM)负责中国玩具厂商的开发设计需要。

  同时,国内一些专家学者、科研机构、技术公司一直在研究开发中国人自己的语音识别技术。清华大学与华录集团合作,成功地研究开发了国内的第一个具有自主知识产权的语音识别专用芯片。该芯片以8位MCU为核心,采用嵌入式芯片设计方法。芯片中包括了8位MCU核、低通滤波器、A/D、D/A、预放、功放、RAM、ROM、PWM等模块,并载入了语音识别、语音压缩编码、语音合成算法,构成一个完整的高集成度语音识别片上系统。该芯片能够识别约20~30条特定人语音命令,同时具有语音合成(提示)与语音编解码(回放)功能。语音识别率达到98%以上,性能达到国际先进水平。由于华录是优先考虑了语音识别技术在玩具业的应用,与国际上同类芯片相比,华录的语音识别芯片在基于汉语的SI(不依靠说话者语音)技术的应用方面有明显的优势,同时它还增加了其他同类芯片没有的自带LCD驱动功能,更吸引人的是它比其他的芯片的功耗低一至二倍。


语音识别芯片的基本结构框图

  目前他们正在研发新一代基于16位定点DSP的语音识别专用芯片,其性能将更加强大。该芯片将能够识别特定人、非特定人语音命令和汉语数码,识别的语音命令可以达到200条以上。此外,系统中还包括:高质量低速率语音编解码、

  语音合成、说话人识别、回声抵消、噪声相消等其他功能。其中,非特定人汉语数码语音识别率达到98%以上,人名呼叫拨号识别率达到99.5%,达到国际先进水平。该芯片可以用于汽车电子系统,实现语音控制和语音拨号,语音PDA,高档语音智能玩具,语音监录器,智能语音遥控器,高档电话伴侣等。

  华录润声公司负责人说,随着研究的进一步深入和半导体工艺的完善,相信我们自己的语音识别芯片,无论在性能和价格上,都将大大优于国外的同类芯片,真正为中国玩具也实现高科技的低成本应用提供物质保证,从而带动国内传统玩具实现低成本改造,提高国产玩具的档次和国际竞争力。

深圳捷通公司供稿 CTI论坛编辑



相关链接:
捷通82语音识别模块产品说明书 2003-06-09
语音合成芯片情况介绍和产品设想 2003-05-06
数字可视复读机方案 2003-04-09
语音识别控制电话机方案 2003-04-04
智能早教机方案 2003-04-03

分类信息:     文摘   技术_语音识别_文摘