清华大学学报(自然科学版)
JOURNAL OF TSINGHUA UNIVERSITY(SCIENCE AND TECHNOLOGY) 2003 Vol.43 No.1 P.16-19 -------------------------------------------------------------------------------- 基于语音学分类的汉语三音子识别单元的算法 Phonetic classification-based triphone for continuous mandarin speech recognition 李春 王作英 摘 要:为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法.这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享.提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法.实验表明: 基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28. 关键词:汉语连续语音识别; 三音子; 语音学分类; 训练算法; 识别算法 分类号:TP391 文献标识码:A 文章编号:1000-0054(2003)01-0016-04 基金项目:国家 "八六三" 高技术项目 (863-306-ZD03-01-2) 作者简介:李春(1978-),男(汉),江西,硕士研究生.通信联系人: 王作英,教授,E-mail: wzy-dee@tsinghua.edu.cn 作者单位:李春(清华大学,电子工程系,北京,100084) 王作英(清华大学,电子工程系,北京,100084) 参考文献: [1]计天颖. 一种汉语连续语音识别的算法及其实现 [D]. 北京: 清华大学,1995.JI Tianying. An algorithm and implementation for Chinese continuous speech recognition [D]. Beijing: Tsinghua University,1995. (in Chinese) [2]赵庆卫. 非特定人大词汇量汉语连续语音识别系统的研究 [D]. 北京: 清华大学,1998.ZHAO Qingwei. The research on speaker-independent large-vocabulary Mandarin continuous speech recognition system [D]. Beijing: Tsinghua University,1998. (in Chinese) [3]WANG Zuoying,SUN Jiasong,XIAO Xi,et al. A minimum corpus designed for training the acoustic model [A]. Academia Sinica,Oriental COCOSDA Proceedings [C]. Taipei,Taiwan: Academia Sinica,1999. 77-80. [4]HUANG Xuedong,Acero A,HON Hsiaowen. Spoken Language Processing [M]. New Jersey: Prentice Hall,2001. 427-434. [5]MEI Yuhwang. Subphonetic acoustic modeling for speaker-independent continuous speech recognition [D]. Pittsburgh: Carnegie Mellon Univ,1994. [6]赵庆卫. 一种基于"音节间相关的识别单元"的汉语连续语音识别算法 [J]. 清华大学学报,1999,39(9): 6568.ZHAO Qingwei. An algorithm for Mandarin continuous speech recognition based on context-dependent unit between syllables [J]. J Tsinghua University,1999,39(9): 65-68. (in Chinese) 收稿日期:2001年9月20日 出版日期:2003年1月1日 |
原文 发表于清华大学学报(自然科学版 浏览:1561 |
| ||
| ||
新增文选 | |||||||||||
| |||||||||||
| |||||||||||
|