Combining selection tree with observation reordering pruning for efficient speaker identification using GMM-UBM (English)

Zhenyu Xiong, / Zheng, T.F. / Zhanjiang Song, / Wenhu Wu,

In: Proceedings. (ICASSP '05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. ; 1 ; I/625-I/628 Vol. 1 ; 2005

ISBN:

0-7803-8874-7

ISSN:

1520-6149

Conference paper / Electronic Resource

How to get this title?

Check access

LUH Campus collection

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Export, share and cite

In this paper a new method of reducing the computational load for Gaussian mixture model universal background model (GMM-UBM) based speaker identification is proposed. In order to speed up the selection of N-best Gaussian mixtures in a UBM, a selection tree (ST) structure as well as relevant operations is proposed. Combined with the existing observation reordering pruning (ORP) method which was proposed for rapid pruning of unlikely speaker model candidates, the proposed method achieves a much larger computation reduction factor than any single individual method. Experimental results show that a GMM-UBM system used in a conjunction with ST and ORP can speed up the computation by a factor of about 16 with an error rate increase of only about 1% compared with a baseline GMM-UBM system.

Title:

Combining selection tree with observation reordering pruning for efficient speaker identification using GMM-UBM
Contributors:

Zhenyu Xiong, ( author ) / Zheng, T.F. ( author ) / Zhanjiang Song, ( author ) / Wenhu Wu, ( author )
Published in:

Proceedings. (ICASSP '05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. ; 1 ; I/625-I/628 Vol. 1
Publisher:

IEEE

Publication date:

2005-01-01
Size:

216149 byte
ISBN:

0-7803-8874-7
ISSN:

1520-6149
DOI:

https://doi.org/10.1109/ICASSP.2005.1415191
Type of media:

Conference paper
Type of material:

Electronic Resource
Language:

English
Source:

IEEE

Table of contents conference proceedings

The tables of contents are generated automatically and are based on the data records of the individual contributions available in the index of the TIB portal. The display of the Tables of Contents may therefore be incomplete.

0_1: 2005 IEEE International Conference on Acoustics, Speech, and Signal Processing
| 2005
digital version
1117: Author index
| 2005
digital version
cxviii: Breaker page
| 2005
digital version
cxviii: ICASSP 2005 Proceedings
| 2005
digital version
I: SP-L4.2: SPEAKER ADAPTIVE CONFIDENCE SCORING USING BAYESIAN COMBINING
Kim, T.-Y. / Ko, H. / IEEE et al. | 2005
print version
I: SP-L4.3: IMPROVING UTTERANCE VERIFICATION USING ADDITIONAL CONFIDENCE MEASURES IN ISOLATED SPEECH RECOGNITION INTERFACES
Greenland, G. / Wong, W. / Kunov, H. / IEEE et al. | 2005
print version
I: SP-L5.1: ADAPTATION OF PRECISION MATRIX MODELS ON LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION
Sim, K. C. / Gales, M. J. F. / IEEE et al. | 2005
print version
I: SP-L4.6: COMBINATION OF MULTIPLE PREDICTORS TO IMPROVE CONFIDENCE MEASURE BASED ON LOCAL POSTERIOR PROBABILITIES
Fu, Y. / Du, L. / IEEE et al. | 2005
print version
I: SP-L6.2: NON-INTRUSIVE GMM-BASED SPEECH QUALITY MEASUREMENT
Falk, T. / Xu, Q. / Chan, W.-Y. / IEEE et al. | 2005
print version
I: SP-P1.6: SLIDING WINDOW SMOOTHING FOR MAXIMUM ENTROPY BASED INTONATIONAL PHRASE PREDICTION IN CHINESE
Li, J.-F. / Hu, G.-P. / Wang, R.-H. / Dai, L.-R. / IEEE et al. | 2005
print version
I: SP-P2.2: "OF ALL THINGS THE MEASURE IS MAN": AUTOMATIC CLASSIFICATION OF EMOTIONS AND INTER-LABELER CONSISTENCY
Steidl, S. / Levit, M. / Batliner, A. / Noth, E. / Niemann, H. / IEEE et al. | 2005
print version
I: SP-P2.9: SOFT DECODING OF TEMPORAL DERIVATIVES FOR ROBUST DISTRIBUTED SPEECH RECOGNITION IN PACKET LOSS
James, A. / Milner, B. / IEEE et al. | 2005
print version
I: SP-P3.7: BAYESIAN MODEL BASED NON-INTRUSIVE SPEECH QUALITY EVALUATION
Chen, G. / Parsa, V. / IEEE et al. | 2005
print version
I: SP-P4.8: ANALYSIS OF A LARGE IN-CAR SPEECH CORPUS AND ITS APPLICATION TO THE MULTIMODEL ASR
Fujimura, H. / Miyajima, C. / Itou, K. / Takeda, K. / Itakura, F. / IEEE et al. | 2005
print version
I: SP-P5.9: AUTOMATIC PROCESSING OF AUDIO LECTURES FOR INFORMATION RETRIEVAL: VOCABULARY SELECTION AND LANGUAGE MODELING
Park, A. / Hazen, T. / Glass, J. / IEEE et al. | 2005
print version
I: SP-P6.7: MASK ESTIMATION BASED ON SOUND LOCALISATION FOR MISSING DATA SPEECH RECOGNITION
Harding, S. / Barker, J. / Brown, G. J. / IEEE et al. | 2005
print version
I: SP-P6.10: SUBSPACE-BASED SPEAKER-INDEPENDENT VOWEL RECOGNITION
Muralishankar, R. / O Shaughnessy, D. / IEEE et al. | 2005
print version
I: SP-P8.3: EXTRACTING ADDITIONAL INFORMATION FROM GAUSSIAN MIXTURE MODEL PROBABILITIES FOR IMPROVED TEXT-INDEPENDENT SPEAKER IDENTIFICATION
Narayanaswamy, B. / Gangadharaiah, R. / IEEE et al. | 2005
print version
I: SP-P8.9: A NEW COMMON COMPONENT GMM-BASED SPEAKER RECOGNITION METHOD
Wang, Y.-R. / Chiang, C.-Y. / IEEE et al. | 2005
print version
I: SP-P10.8: ALIZE, A FREE TOOLKIT FOR SPEAKER RECOGNITION
Bonastre, J.-F. / Wils, F. / Meignier, S. / IEEE et al. | 2005
print version
I: SP-P12.3: CROSS DOMAIN AUTOMATIC TRANSCRIPTION ON THE TC-STAR EPPS CORPUS
Gollan, C. / Bisani, M. / Kanthak, S. / Schluter, R. / Ney, H. / IEEE et al. | 2005
print version
I: SP-P13.3: VOICED/UNVOICED DETERMINATION OF SPEECH SIGNAL IN NOISY ENVIRONMENT USING HARMONICITY MEASURE BASED ON INSTANTANEOUS FREQUENCY
Arifianto, D. / Kobayashi, T. / IEEE et al. | 2005
print version
I: SP-P13.8: OBJECTIVE QUALITY MEASURES FOR GLOTTAL INVERSE FILTERING OF SPEECH PRESSURE SIGNALS
Backstrom, T. / Airas, M. / Lehto, L. / Alku, P. / IEEE et al. | 2005
print version
I: SP-P16.9: INCORPORATING DIALOGUE CONTEXT AND TOPIC CLUSTERING IN OUT-OF-DOMAIN DETECTION
Lane, I. / Kawahara, T. / IEEE et al. | 2005
print version
I: SP-P17.10: SPEECH ENHANCEMENT BASED ON FILTERING THE SPECTROTEMPORAL MODULATIONS
Mesgarani, N. / Shamma, S. / IEEE et al. | 2005
print version
I: SP-L1.1: POLYGLOT SYNTHESIS USING A MIXTURE OF MONOLINGUAL CORPORA
Latorre, J. / Iwano, K. / Furui, S. / IEEE et al. | 2005
print version
I: SP-L3.6: RELATIVE ENERGY AND INTELLIGIBILITY OF TRANSIENT SPEECH INFORMATION
Yoo, S. / Boston, J. R. / Durrant, J. / Kovacyk, K. / Karn, S. / Shaiman, S. / El-Jaroudi, A. / Li, C.-C. / IEEE et al. | 2005
print version
I: SP-L5.5: MINIMUM CLASSIFICATION ERROR FOR LARGE SCALE SPEECH RECOGNITION TASKS USING WEIGHTED FINITE STATE TRANSDUCERS
McDermott, E. / Katagiri, S. / IEEE et al. | 2005
print version
I: SP-L6.3: A MULTIPLE-DESCRIPTION PCM SPEECH CODER USING STRUCTURED DUAL VECTOR QUANTIZERS
Voran, S. / IEEE et al. | 2005
print version
I: SP-L7.3: ADAPTIVE TIME SEGMENTATION OF NOISY SPEECH FOR IMPROVED SPEECH ENHANCEMENT
Hendriks, R. C. / Heusdens, R. / Jensen, J. / IEEE et al. | 2005
print version
I: SP-L11.2: LOG-ENERGY DYNAMIC RANGE NORMALIZATION FOR ROBUST SPEECH RECOGNITION
Zhu, W. / O Shaughnessy, D. / IEEE et al. | 2005
print version
I: SP-P2.7: A HIDDEN TRAJECTORY MODEL WITH BI-DIRECTIONAL TARGET-FILTERING: CASCADED VS. INTEGRATED IMPLEMENTATION FOR PHONETIC RECOGNITION
Deng, L. / Li, X. / Yu, D. / Acero, A. / IEEE et al. | 2005
print version
I: SP-P3.2: ADAPTIVE TRAINING FOR HIDDEN SEMI-MARKOV MODEL
Yamagishi, J. / Kobayashi, T. / IEEE et al. | 2005
print version
I: SP-P6.9: INFLUENCE OF AUTOCORRELATION LAG RANGES ON ROBUST SPEECH RECOGNITION
Shannon, B. J. / Paliwal, K. K. / IEEE et al. | 2005
print version
I: SP-P9.6: FUZZY PARAMETER CLUSTERING METHOD IN SPEECH RECOGNITION
Xu, X. / Zhu, J. / IEEE et al. | 2005
print version
I: SP-P14.7: TONOTOPIC MULTI-LAYERED PERCEPTRON: A NEURAL NETWORK FOR LEARNING LONG-TERM TEMPORAL FEATURES FOR SPEECH RECOGNITION
Chen, B. / Zhu, Q. / Morgan, N. / IEEE et al. | 2005
print version
I: SP-P14.9: QUASI-CONTINUOUS LOCAL CODEBOOK FEATURES FOR MULTILINGUAL ACOUSTIC PHONETIC MODELLING
Diehl, F. / Moreno, A. / IEEE et al. | 2005
print version
I: SP-P15.2: AUTOMATIC DISFLUENCY REMOVAL ON RECOGNIZED SPONTANEOUS SPEECH - RAPID ADAPTATION TO SPEAKER DEPENDENT DISFLUENCIES
Honal, M. / Schultz, T. / IEEE et al. | 2005
print version
I: SP-P16.13: AUTOMATIC DIALOG ACT SEGMENTATION AND CLASSIFICATION IN MULTIPARTY MEETINGS
Ang, J. / Liu, Y. / Shriberg, E. / IEEE et al. | 2005
print version
I: SP-L2.6: UNSUPERVISED SEMANTIC INTENT DISCOVERY FROM CALL LOG ACOUSTICS
Li, X. / Gunawardana, A. / Acero, A. / IEEE et al. | 2005
print version
I: SP-L6.6: CODING WITH SIDE INFORMATION TECHNIQUES FOR LSF RECONSTRUCTION IN VOICE OVER IP
Agiomyrgiannakis, Y. / Stylianou, Y. / IEEE et al. | 2005
print version
I: SP-L7.4: SPEECH ENHANCEMENT USING HARMONIC REGENERATION
Plapous, C. / Marro, C. / Scalart, P. / IEEE et al. | 2005
print version
I: SP-L7.5: INSTANT NOISE ESTIMATION USING FOURIER TRANSFORM OF AMDF AND VARIABLE START MINIMA SEARCH
Lin, Z. / Goubran, R. A. / IEEE et al. | 2005
print version
I: SP-L8.5: PROSODY MODELING AND EIGEN-PROSODY ANALYSIS FOR ROBUST SPEAKER RECOGNITION
Chen, Z.-H. / Liao, Y.-F. / Juang, Y.-T. / IEEE et al. | 2005
print version
I: SP-L9.6: LANDMARK-BASED SPEECH RECOGNITION: REPORT OF THE 2004 JOHNS HOPKINS SUMMER WORKSHOP
Hasegawa-Johnson, M. / Baker, J. / Borys, S. / Chen, K. / Coogan, E. / Greenberg, S. / Juneja, A. / Kirchhoff, K. / Livescu, K. / Mohan, S. et al. | 2005
print version
I: SP-L11.5: PARTICLE FILTER BASED NON-STATIONARY NOISE TRACKING FOR ROBUST SPEECH RECOGNITION
Fujimoto, M. / Nakamura, S. / IEEE et al. | 2005
print version
I: SP-P1.5: PROSODY ANALYSIS AND MODELING FOR EMOTIONAL SPEECH SYNTHESIS
Jiang, D.-n. / Zhang, W. / Shen, L.-q. / Cai, L.-h. / IEEE et al. | 2005
print version
I: SP-P1.7: IDENTIFICATION AND SYNTHESIS OF CANTONESE TONES BASED ON THE COMMAND-RESPONSE MODEL FOR F0 CONTOUR GENERATION
Gu, W. / Hirose, K. / Fujisaki, H. / IEEE et al. | 2005
print version
I: SP-P1.8: COMPRESSION OF EXCEPTION LEXICONS FOR SMALL FOOTPRINT GRAPHEME-TO-PHONEME CONVERSION
Meron, J. / Veprek, P. / IEEE et al. | 2005
print version
I: SP-P3.4: SPEECH RECOGNITION IN THE BLIND CONDITION BASED ON MULTIPLE DIRECTIVITY PATTERNS USING A MICROPHONE ARRAY
Sekiya, T. / Kobayashi, T. / IEEE et al. | 2005
print version
I: SP-P3.5: AN UNSUPERVISED QUANTITATIVE MEASURE FOR WORD PROMINENCE IN SPONTANEOUS SPEECH
Wang, D. / Narayanan, S. / IEEE et al. | 2005
print version
I: SP-P3.13: VOICING-STATE CLASSIFICATION OF CO-CHANNEL SPEECH USING NONLINEAR STATE-SPACE RECONSTRUCTION
Mahgoub, Y. / Dansereau, R. / IEEE et al. | 2005
print version
I: SP-P4.2: CONTEXT-DEPENDENT DURATION MODELING
Willett, D. / IEEE et al. | 2005
print version
I: SP-P4.3: RECOGNISING SPEECH IN THE PRESENCE OF A COMPETING SPEAKER USING A `SPEECH FRAGMENT DECODER'
Coy, A. / Barker, J. / IEEE et al. | 2005
print version
I: SP-P3.14: SPEECH RATE ESTIMATION VIA TEMPORAL CORRELATION AND SELECTED SUB-BAND CORRELATION
Narayanan, S. / Wang, D. / IEEE et al. | 2005
print version
I: SP-P4.11: ACOUSTIC FEATURE COMBINATION FOR ROBUST SPEECH RECOGNITION
Zolnay, A. / Schlueter, R. / Ney, H. / IEEE et al. | 2005
print version
I: SP-P5.5: FAST TWO-STAGE VOCABULARY-INDEPENDENT SEARCH IN SPONTANEOUS SPEECH
Yu, P. / Seide, F. / IEEE et al. | 2005
print version
I: SP-P6.2: PITCH-SYNCHRONOUS ZCPA (PS-ZCPA)-BASED FEATURE EXTRACTION WITH AUDITORY MASKING
Ghulam, M. / Fukuda, T. / Horikawa, J. / Nitta, T. / IEEE et al. | 2005
print version
I: SP-P8.6: IMPROVED SPEAKER MODEL MIGRATION VIA STOCHASTIC SYNTHESIS
Navratil, J. / Ramaswamy, G. / IEEE et al. | 2005
print version
I: SP-P9.7: AUTOMATIC TRAINING SET SEGMENTATION FOR MULTI-PASS SPEECH RECOGNITION
Mao, M. / Vanhoucke, V. / Strope, B. / IEEE et al. | 2005
print version
I: SP-P9.8: GENERALIZED STATISTICAL MODELING OF PRONUNCIATION VARIATIONS USING VARIABLE-LENGTH PHONE CONTEXT
Akita, Y. / Kawahara, T. / IEEE et al. | 2005
print version
I: SP-P10.1: A PROBABILISTIC MEASURE OF MODALITY RELIABILITY IN SPEAKER VERIFICATION
Richiardi, J. / Prodanov, P. / Drygajlo, A. / IEEE et al. | 2005
print version
I: SP-P11.6: VOICE ACTIVITY DETECTION BASED ON GENERALIZED GAMMA DISTRIBUTION
Shin, J. W. / Chang, J.-H. / Yun, H. S. / Kim, N. S. / IEEE et al. | 2005
print version
I: SP-P12.9: INVESTIGATION OF ACOUSTIC MODELING TECHNIQUES FOR LVCSR SYSTEMS
Liu, X. / Gales, M. J. F. / Sim, K. C. / Yu, K. / IEEE et al. | 2005
print version
I: SP-P12.8: BAYESIAN MODEL COMBINATION (BAYCOM) FOR IMPROVED RECOGNITION
Sankar, A. / IEEE et al. | 2005
print version
I: SP-P15.4: TWO-STAGE SPEAKER ADAPTATION OF HYBRID TIED-POSTERIOR ACOUSTIC MODELS
Stadermann, J. / Rigoll, G. / IEEE et al. | 2005
print version
I: SP-P15.11: ALTERNATE PHONE MODELS FOR CONVERSATIONAL SPEECH
Lamel, L. / Gauvain, J.-L. / IEEE et al. | 2005
print version
I: SP-P16.11: A NEW ASR EVALUATION MEASURE AND MINIMUM BAYES-RISK DECODING FOR OPEN-DOMAIN SPEECH UNDERSTANDING
Nanjo, H. / Kawahara, T. / IEEE et al. | 2005
print version
I: SP-P17.4: OVERCOMING THE STATISTICAL INDEPENDENCE ASSUMPTION W.R.T. FREQUENCY IN SPEECH ENHANCEMENT
Fingscheidt, T. / Beaugeant, C. / Suhadi, S. / IEEE et al. | 2005
print version
I: SP-P17.5: A TWO-STAGE ALGORITHM FOR ENHANCEMENT OF REVERBERANT SPEECH
Wu, M. / Wang, D. / IEEE et al. | 2005
print version
I: SP-P17.13: AN IMPROVED ESTIMATION OF A PRIORI SPEECH ABSENCE PROBABILITY FOR SPEECH ENHANCEMENT: IN PERSPECTIVE OF SPEECH PERCEPTION
Choi, M. S. / Kang, H.-G. / IEEE et al. | 2005
print version
I: SP-L1.3: SPECTRAL CONVERSION BASED ON MAXIMUM LIKELIHOOD ESTIMATION CONSIDERING GLOBAL VARIANCE OF CONVERTED PARAMETER
Toda, T. / Black, A. W. / Tokuda, K. / IEEE et al. | 2005
print version
I: SP-L8.4: SPEAKER VERIFICATION USING ADAPTED ARTICULATORY FEATURE-BASED CONDITIONAL PRONUNCIATION MODELING
Leung, K.-Y. / Mak, M.-W. / Siu, M. / Kung, S.-Y. / IEEE et al. | 2005
print version
I: SP-L8.6: PROSODIC MODELING FOR SPEAKER RECOGNITION BASED ON SUB-BAND ENERGY TEMPORAL TRAJECTORIES
Adami, A. / IEEE et al. | 2005
print version
I: SP-L9.4: THE IBM 2004 CONVERSATIONAL TELEPHONY SYSTEM FOR RICH TRANSCRIPTION
Soltau, H. / Kingsbury, B. / Mangu, L. / Povey, D. / Saon, G. / Zweig, G. / IEEE et al. | 2005
print version
I: SP-L10.3: SPEECH SIGNAL ANALYSIS WITH EXPONENTIAL AUTOREGRESSIVE MODEL
Ishizuka, K. / Kato, H. / Nakatani, T. / IEEE et al. | 2005
print version
I: SP-L10.6: AN AUTO-REGRESSIVE, NON-STATIONARY EXCITED SIGNAL PARAMETER ESTIMATION METHOD AND AN EVALUATION OF A SINGING-VOICE RECOGNITION
Sasou, A. / Goto, M. / Hayamizu, S. / Tanaka, K. / IEEE et al. | 2005
print version
I: SP-P2.10: DBN-BASED MULTI-STREAM MODELS FOR MANDARIN TONEME RECOGNITION
Lei, X. / Ji, G. / Ng, T. / Bilmes, J. / Ostendorf, M. / IEEE et al. | 2005
print version
I: SP-P3.1: SCALABLE CONCATENATIVE SPEECH SYNTHESIS BASED ON THE PLURAL UNIT SELECTION AND FUSION METHOD
Tamura, M. / Mizutani, T. / Kagoshima, T. / IEEE et al. | 2005
print version
I: SP-P4.5: EFFECT OF PHASE-SENSITIVE ENVIRONMENT MODEL AND HIGHER ORDER VTS ON NOISY SPEECH FEATURE ENHANCEMENT
Stouten, V. / Van hamme, H. / Wambacq, P. / IEEE et al. | 2005
print version
I: SP-P6.6: TWO-STAGE NOISE SPECTRA ESTIMATION AND REGRESSION BASED IN-CAR SPEECH RECOGNITION USING SINGLE DISTANT MICROPHONE
Li, W. / Itou, K. / Takeda, K. / Itakura, F. / IEEE et al. | 2005
print version
I: SP-P6.8: SPEECH PROCESSING USING JOINT FEATURES DERIVED FROM THE MODIFIED GROUP DELAY FUNCTION
Hegde, R. / Murthy, H. / Rao, G. V. R. / IEEE et al. | 2005
print version
I: SP-P7.2: LANGUAGE MODEL ESTIMATION FOR OPTIMIZING END-TO-END PERFORMANCE OF A NATURAL LANGUAGE CALL ROUTING SYSTEM
Goel, V. / Kuo, H.-K. / Deligne, S. / Wu, C. / IEEE et al. | 2005
print version
I: SP-P9.3: OPTIMAL CLUSTERING AND NON-UNIFORM ALLOCATION OF GAUSSIAN KERNELS IN SCALAR DIMENSION FOR HMM COMPRESSION
Li, X.-B. / Soong, F. K. / Myrvoll, T. A. / Wang, R.-H. / IEEE et al. | 2005
print version
I: SP-P10.6: T-NORM FOR TEXT-DEPENDENT COMMERCIAL SPEAKER VERIFICATION APPLICATIONS: EFFECT OF LEXICAL MISMATCH
Hebert, M. / Boies, D. / IEEE et al. | 2005
print version
I: SP-P10.9: SPEAKER ADAPTIVE COHORT SELECTION FOR TNORM IN TEXT-INDEPENDENT SPEAKER VERIFICATION
Sturim, D. / Reynolds, D. / IEEE et al. | 2005
print version
I: SP-P10.10: HYBRID SPEAKER-BASED SEGMENTATION SYSTEM USING MODEL-LEVEL CLUSTERING
Kim, H.-G. / Ertelt, D. / Sikora, T. / IEEE et al. | 2005
print version
I: SP-P11.1: IMPROVING THE 2.4 KB/S MILITARY STANDARD MELP (MS-MELP) CODER USING PITCH-SYNCHRONOUS ANALYSIS AND SYNTHESIS TECHNIQUES
Ertan, A. E. / Barnwell, T. P. / IEEE et al. | 2005
print version
I: SP-P11.3: TOWARDS ILBC SPEECH CODING AT LOWER RATES THROUGH A NEW FORMULATION OF THE START STATE SEARCH
Garrido, C. M. / Murthi, M. N. / Andersen, S. V. / IEEE et al. | 2005
print version
I: SP-L7.2: A WAVELET KALMAN FILTER WITH PERCEPTUAL MASKING FOR SPEECH ENHANCEMENT IN COLORED NOISE
Ma, N. / Bouchard, M. / Goubran, R. A. / IEEE et al. | 2005
print version
I: SP-L9.2: CONTRUCTING ENSEMBLES OF ASR SYSTEMS USING RANDOMIZED DECISION TREES
Siohan, O. / Ramabhadran, B. / Kingsbury, B. / IEEE et al. | 2005
print version
I: SP-L9.5: TRAINING LVCSR SYSTEMS ON THOUSANDS OF HOURS OF DATA
Evermann, G. / Chan, H. Y. / Gales, M. J. F. / Jia, B. / Mrva, D. / Woodland, P. / Yu, K. / IEEE et al. | 2005
print version
I: SP-L10.4: COMPARISON OF AUTOREGRESSIVE PARAMETER ESTIMATION ALGORITHMS FOR SPEECH PROCESSING AND RECOGNITION
Morris, R. / Arrowood, J. / Clements, M. / IEEE et al. | 2005
print version
I: SP-P3.9: FUNDAMENTAL FREQUENCY ESTIMATION AND VOCAL TREMOR ANALYSIS BY MEANS OF MORLET WAVELET TRANSFORMS
Cnockaert, L. / Grenez, F. / Schoentgen, J. / IEEE et al. | 2005
print version
I: SP-P6.5: ON DESENSITIZING THE MEL-CEPSTRUM TO SPURIOUS SPECTRAL COMPONENTS FOR ROBUST SPEECH RECOGNITION
Tyagi, V. / Wellekens, C. / IEEE et al. | 2005
print version
I: SP-P7.12: INTEGRATING MULTIPLE LAYERS OF CONCEPT INFORMATION INTO N-GRAM MODELING FOR SPOKEN LANGUAGE UNDERSTANDING
Wang, N. J.-C. / IEEE et al. | 2005
print version
I: SP-P8.4: COMBINING SELECTION TREE WITH OBSERVATION REORDERING PRUNING FOR EFFICIENT SPEAKER IDENTIFICATION USING GMM-UBM
Xiong, Z. / Zheng, T. / Song, Z. / Wu, W. / IEEE et al. | 2005
print version
I: SP-P8.12: NOISE ROBUST SPEAKER VERIFICATION USING MEL-FREQUENCY DISCRETE WAVELET COEFFICIENTS AND PARALLEL MODEL COMPENSATION
Tufekci, Z. / Gurbuz, S. / IEEE et al. | 2005
print version
I: SP-P10.11: ROBUSTNESS OF BIT-STREAM BASED FEATURES FOR SPEAKER VERIFICATION
Moreno-Daniel, A. / Juang, B.-H. / Nolazco-Flores, J. A. / IEEE et al. | 2005
print version
I: SP-P12.10: IMPROVED CONFUSION NETWORK ALGORITHM AND SHORTEST PATH SEARCH FROM WORD LATTICE
Xue, J. / Zhao, Y. / IEEE et al. | 2005
print version
I: SP-P13.1: ANALYSIS OF SPECTRAL MEASURES FOR VOICED SPEECH WITH VARYING NOISE AND PERTUBATION LEVELS
O Leidhin, E. / Murphy, P. / IEEE et al. | 2005
print version
I: SP-P16.6: THE AT&T WATSON SPEECH RECOGNIZER
Goffin, V. / Allauzen, C. / Bocchieri, E. / Hakkani-Tur, D. / Ljolje, A. / Parthasarathy, S. / Rahim, M. / Riccardi, G. / Saraclar, M. / IEEE et al. | 2005
print version
I: SP-P16.10: STRUCTURING BASEBALL LIVE GAMES BASED ON SPEECH RECOGNITION USING TASK DEPENDENT KNOWLEDGE AND EMOTION STATE RECOGNITION
Sako, A. / Ariki, Y. / IEEE et al. | 2005
print version
I: SP-P16.12: SPEECH RECOGNITION OF A NAMED ENTITY
Tomita, T. / Okimoto, Y. / Yamamoto, H. / Sagisaka, Y. / IEEE et al. | 2005
print version
I: SP-P16.14: SENTENCE EXTRACTION-BASED PRESENTATION SUMMARIZATION TECHNIQUES AND EVALUATION METRICS
Hirohata, M. / Shinnaka, Y. / Iwano, K. / Furui, S. / IEEE et al. | 2005
print version
I: SP-P17.11: IMPROVED KALMAN FILTERING FOR SPEECH ENHANCEMENT
Grancharov, V. / Samuelsson, J. / Kleijn, B. / IEEE et al. | 2005
print version
I: SP-P17.14: SPEECH ENHANCEMENT USING A SWITCHING KALMAN FILTER WITH A PERCEPTUAL POST-FILTER
Deng, J. / Bouchard, M. / Yeap, T. H. / IEEE et al. | 2005
print version
I: SP-L4.5: ROBUST SPEECH RECOGNITION BY INTEGRATING SPEECH SEPARATION AND HYPOTHESIS TESTING
Srinivasan, S. / Wang, D. / IEEE et al. | 2005
print version
I: SP-L5.2: DISCRIMINATIVE TRAINING OF CDHMMS FOR MAXIMUM RELATIVE SEPARATION MARGIN
Liu, C. / Jiang, H. / Li, X. / IEEE et al. | 2005
print version
I: SP-L7.1: SIGNAL SUBSPACE SPEECH ENHANCEMENT FOR AUDIBLE NOISE REDUCTION
You, C. / Koh, S. N. / Rahardja, S. / IEEE et al. | 2005
print version
I: SP-P2.4: META-CLASSIFIERS IN ACOUSTIC AND LINGUISTIC FEATURE FUSION-BASED AFFECT RECOGNITION
Schuller, B. / Villar, R. J. / Rigoll, G. / Lang, M. / IEEE et al. | 2005
print version
I: SP-P2.11: SPARSE KPCA FOR FEATURE EXTRACTION IN SPEECH RECOGNITION
Lima, A. / Zen, H. / Nankaku, Y. / Tokuda, K. / Kitamura, T. / Resende, F. G. / IEEE et al. | 2005
print version
I: SP-P4.7: NOISY SPEECH RECOGNITION BASED ON ROBUST END-POINT DETECTION AND MODEL ADAPTATION
Zhang, Z. / Furui, S. / IEEE et al. | 2005
print version
I: SP-P5.4: NOVEL TECHNIQUES FOR TIME-COMPRESSING SPEECH: AN EXPLORATORY STUDY
Tucker, S. / Whittaker, S. / IEEE et al. | 2005
print version
I: SP-P5.6: AN HMM-BASED TEXT SEGMENTATION METHOD USING VARIATIONAL BAYES APPROACH AND ITS APPLICATION TO LVCSR FOR BROADCAST NEWS
Koshinaka, T. / Iso, K.-i. / Okumura, A. / IEEE et al. | 2005
print version
I: SP-P6.11: ROBUST SPEECH RECOGNITION BASED ON SPECTRAL ADJUSTING AND WARPING
Zhao, R. / Wang, Z. / IEEE et al. | 2005
print version
I: SP-P7.4: RAPID LANGUAGE MODEL DEVELOPMENT USING EXTERNAL RESOURCES FOR NEW SPOKEN DIALOG DOMAINS
Sarikaya, R. / Gravano, A. / Gao, Y. / IEEE et al. | 2005
print version
I: SP-P7.9: AN EFFICIENT ALGORITHM FOR CLUSTERING SHORT SPOKEN UTTERANCES
Liu, Z. / IEEE et al. | 2005
print version
I: SP-P9.11: MODELING SUCCESSIVE FRAME DEPENDENCIES WITH HYBRID HMM/BN ACOUSTIC MODEL
Markov, K. / Nakamura, S. / IEEE et al. | 2005
print version
I: SP-P11.14: A SOFT DECISION BASED NOISE CROSS POWER SPECTRAL DENSITY ESTIMATION FOR TWO-MICROPHONE SPEECH ENHANCEMENT SYSTEMS
Zhang, X. / Jia, Y. / IEEE et al. | 2005
print version
I: SP-P12.13: CROSS-LANGUAGE ACOUSTIC MODEL REFINEMENT FOR THE INDONESIAN LANGUAGE
Martin, T. / Sridharan, S. / IEEE et al. | 2005
print version
I: SP-P13.5: DETECTION OF SYMBOLIC GESTURAL EVENTS IN ARTICULATORY DATA FOR USE IN STRUCTURAL REPRESENTATIONS OF CONTINUOUS SPEECH
Gutkin, A. / King, S. / IEEE et al. | 2005
print version
I: SP-P13.9: EFFECTS OF GLOTTAL AND LIP BOUNDARY CONDITIONS ON VOCAL-TRACT AREA FUNCTION ESTIMATES FROM SPEECH SIGNALS
Deng, H. / Ward, R. K. / Beddoes, M. / Hodgson, M. / IEEE et al. | 2005
print version
I: SP-P14.2: MINIMUM PHONEME ERROR BASED HETEROSCEDASTIC LINEAR DISCRIMINANT ANALYSIS FOR SPEECH RECOGNITION
Zhang, B. / Matsoukas, S. / IEEE et al. | 2005
print version
I: SP-P15.10: LEARNING PRONUNCIATION AND FORMULATION VARIANTS IN CONTINUOUS SPEECH APPLICATIONS
Colibro, D. / Fissore, L. / Popovici, C. / Vair, C. / Laface, P. / IEEE et al. | 2005
print version
I: SP-P16.3: UNSUPERVISED VOCABULARY EXPANSION FOR AUTOMATIC TRANSCRIPTION OF BROADCAST NEWS
Ohtsuki, K. / Hiroshima, N. / Oku, M. / Imamura, A. / IEEE et al. | 2005
print version
I: SP-P17.7: LEAKAGE MODEL AND TEETH CLACK REMOVAL FOR AIR- AND BONE-CONDUCTIVE INTEGRATED MICROPHONES
Liu, Z. / Subramanya, A. / Zhang, Z. / Droppo, J. / Acero, A. / IEEE et al. | 2005
print version
I: SP-P17.6: MATRIX QUANTIZATION BASED TIME-VARYING FILTER SPEECH ENHANCEMENT
Rao K, S. / Thippur, S. / IEEE et al. | 2005
print version
I: SP-L3.1: PROPOSAL ON OBJECTIVE SPEECH QUALITY ASSESSMENT FOR WIDEBAND IP TELEPHONY
Morioka, C. / Kurashima, A. / Takahashi, A. / IEEE et al. | 2005
print version
I: SP-L4.1: REJECTION USING RANK STATISTICS BASED ON HMM STATE SHORTLISTS
Bocchieri, E. / Parthasarathy, S. / IEEE et al. | 2005
print version
I: SP-L6.1: MULTI-FRAME GMM-BASED BLOCK QUANTISATION OF LINE SPECTRAL FREQUENCIES FOR WIDEBAND SPEECH CODING
So, S. / Paliwal, K. K. / IEEE et al. | 2005
print version
I: SP-L11.1: STATIC AND DYNAMIC SPECTRAL FEATURES: THEIR NOISE ROBUSTNESS AND OPTIMAL WEIGHTS FOR ASR
Yang, C. / Soong, F. K. / Lee, T. / IEEE et al. | 2005
print version
I: SP-L11.3: A COMPANDING FRONT END FOR NOISE-ROBUST AUTOMATIC SPEECH RECOGNITION
Guinness, J. / Raj, B. / Schmidt-Nielsen, B. / Turicchia, L. / Sarpeshkar, R. / IEEE et al. | 2005
print version
I: SP-P2.3: DISORDERED SPEECH EVALUATION USING OBJECTIVE QUALITY MEASURES
Gu, L. / Harris, J. / Shrivastav, R. / Sapienza, C. / IEEE et al. | 2005
print version
I: SP-P3.3: PERCEPTUALLY WEIGHTED LONG TERM MODELING OF SINUSOIDAL SPEECH AMPLITUDE TRAJECTORIES
Firouzmand, M. / Girin, L. / IEEE et al. | 2005
print version
I: SP-P4.1: CLOSELY COUPLED ARRAY PROCESSING AND MODEL-BASED COMPENSATION FOR MICROPHONE ARRAY SPEECH RECOGNITION
Zhao, X. / Ou, Z. / Chen, M. / Wang, Z. / IEEE et al. | 2005
print version
I: SP-P4.9: BUILDING AN EFFECTIVE CORPUS BY USING ACOUSTIC SPACE VISUALIZATION (COSMOS) METHOD
Nagino, G. / Shozakai, M. / IEEE et al. | 2005
print version
I: SP-P5.1: DYNAMIC MATCH PHONE-LATTICE SEARCHES FOR VERY FAST AND ACCURATE UNRESTRICTED VOCABULARY KEYWORD SPOTTING
Thambiratnam, K. / Sridharan, S. / IEEE et al. | 2005
print version
I: SP-P5.7: DETECTING GROUP INTEREST-LEVEL IN MEETINGS
Gatica-Perez, D. / McCowan, I. / Zhang, D. / Bengio, S. / IEEE et al. | 2005
print version
I: SP-P6.4: SPEECH FEATURE SMOOTHING FOR ROBUST ASR
Chen, C.-P. / Bilmes, J. / Ellis, D. / IEEE et al. | 2005
print version
I: SP-P6.12: ROBUST SPEECH ACTIVITY DETECTION USING LDA APPLIED TO FF PARAMETERS
Padrell, J. / Macho, D. / Nadeu, C. / IEEE et al. | 2005
print version
I: SP-P7.1: JOINT DISCRIMINATIVE LANGUAGE MODELING AND UTTERANCE CLASSIFICATION
Saraclar, M. / Roark, B. / IEEE et al. | 2005
print version
I: SP-P7.6: RANDOM CLUSTERINGS FOR LANGUAGE MODELING
Emami, A. / Jelinek, F. / IEEE et al. | 2005
print version
I: SP-P7.5: USING LOCAL & GLOBAL PHONOTACTIC FEATURES IN CHINESE DIALECT IDENTIFICATION
Lim, B. P. / Li, H. / Ma, B. / IEEE et al. | 2005
print version
I: SP-P8.7: FACTOR ANALYSIS SIMPLIFIED
Kenny, P. / Boulianne, G. / Ouellet, P. / Dumouchel, P. / IEEE et al. | 2005
print version
I: SP-P11.4: A MISSING-DATA APPROACH TO NOISE-ROBUST LPC EXTRACTION FOR VOICED SPEECH USING AUXILIARY SENSORS
Demiroglu, C. / Barnwell, T. P. / IEEE et al. | 2005
print version
I: SP-P11.7: INCREASING THE ROBUSTNESS OF CELP-BASED CODERS BY CONSTRAINED OPTIMIZATION
Chibani, M. / Gournay, P. / Lefebvre, R. / IEEE et al. | 2005
print version
I: SP-P11.12: A ROBUST NARROWBAND TO WIDEBAND EXTENSION SYSTEM FEATURING ENHANCED CODEBOOK MAPPING
Unno, T. / McCree, A. / IEEE et al. | 2005
print version
I: SP-P12.6: A STUDY ON KNOWLEDGE SOURCE INTEGRATION FOR CANDIDATE RESCORING IN AUTOMATIC SPEECH RECOGNITION
Li, J. / Tsao, Y. / Lee, C.-H. / IEEE et al. | 2005
print version
I: SP-P12.12: DEVELOPMENT OF THE CU-HTK 2004 BROADCAST NEWS TRANSCRIPTION SYSTEMS
Kim, D. Y. / Chan, H. Y. / Evermann, G. / Gales, M. J. F. / Mrva, D. / Sim, K. C. / Woodland, P. / IEEE et al. | 2005
print version
I: SP-P13.2: AUTOMATIC DYSPHONIA RECOGNITION USING BIOLOGICALLY-INSPIRED AMPLITUDE-MODULATION FEATURES
Malyska, N. / Quatieri, T. / Sturim, D. / IEEE et al. | 2005
print version
I: SP-P13.10: ADAPTIVE FILTERBANKS INSPIRED BY THE AUDITORY SYSTEM FOR SPEECH FEATURE EXTRACTION
Kumaresan, R. / Allu, G. K. / Cariani, P. / IEEE et al. | 2005
print version
I: SP-P13.12: A GRAPHICAL MODEL FOR FORMANT TRACKING
Malkin, J. / Li, X. / Bilmes, J. / IEEE et al. | 2005
print version
I: SP-P14.3: A STUDY OF AUDITORY MODELING AND PROCESSING FOR SPEECH SIGNALS
Jeon, W. / Juang, B.-H. / IEEE et al. | 2005
print version
I: SP-P15.6: KERNEL EIGENSPACE-BASED MLLR ADAPTATION USING MULTIPLE REGRESSION CLASSES
Hsiao, R. / Mak, B. / IEEE et al. | 2005
print version
I: SP-P15.7: AUTOMATICALLY TRANSCRIBING MEETINGS USING DISTANT MICROPHONES
Metze, F. / Fugen, C. / Pan, Y. / Alexander, W. / IEEE et al. | 2005
print version
I: SP-P16.5: MAXIMUM ENTROPY SEGMENTATION OF BROADCAST NEWS
Christensen, H. / Kolluru, B. / Gotoh, Y. / Renals, S. / IEEE et al. | 2005
print version
I: SP-P16.4: CLASSIFICATION OF STRUCTURED DESCRIPTIONS
Bangalore, S. / Rambow, O. / IEEE et al. | 2005
print version
I: SP-P16.8: ERROR PREDICTION IN SPOKEN DIALOG: FROM SIGNAL-TO-NOISE RATIO TO SEMANTIC CONFIDENCE SCORES
Hakkani-Tur, D. / Tur, G. / Riccardi, G. / Kim, H. K. / IEEE et al. | 2005
print version
I: SP-P17.8: SPEECH ENHANCEMENT USING A MMSE SHORT TIME SPECTRAL AMPLITUDE ESTIMATOR WITH LAPLACIAN SPEECH MODELING
Chen, B. / Loizou, P. / IEEE et al. | 2005
print version
I: SP-L2.1: INCORPORATING DISCOURSE FEATURES INTO CONFIDENCE SCORING OF INTENTION RECOGNITION RESULTS IN SPOKEN DIALOGUE SYSTEMS
Higashinaka, R. / Sudoh, K. / Nakano, M. / IEEE et al. | 2005
print version
I: SP-L3.2: NEURAL CELL TYPE RECOGNITION BETWEEN GLOBUS PALLIDUS EXTERNUS AND GLOBUS PALLIDUS INTERNUS BY GAUSSIAN MIXTURE MODELING
Fu, Q. / Clements, M. / Mewes, K. / IEEE et al. | 2005
print version
I: SP-L6.5: PREDICTIVE VQ FOR BANDWIDTH SCALABLE LSP QUANTIZATION
Ehara, H. / Morii, T. / Oshikiri, M. / Yoshida, K. / IEEE et al. | 2005
print version
I: SP-L7.6: SPEECH ENHANCEMENT BASED ON SPEECH SPECTRAL COMPLEX GAUSSIAN MIXTURE MODEL
Ding, G.-H. / Wang, X. / Cao, Y. / Ding, F. / Tang, Y. / IEEE et al. | 2005
print version
I: SP-L8.3: THE 2004 MIT LINCOLN LABORATORY SPEAKER RECOGNITION SYSTEM
Reynolds, D. / Campbell, W. / Gleason, T. / Quillen, C. / Sturim, D. / Torres-Carrasquillo, P. / Adami, A. / IEEE et al. | 2005
print version
I: SP-L10.2: COHERENT ENVELOPE DETECTION FOR MODULATION FILTERING OF SPEECH
Schimmel, S. / Atlas, L. / IEEE et al. | 2005
print version
I: SP-L11.6: ONLINE CEPSTRAL FILTERING USING A SEQUENTIAL EM APPROACH WITH POLYAK AVERAGING AND FEEDBACK
Myrvoll, T. A. / Nakamura, S. / IEEE et al. | 2005
print version
I: SP-P1.2: AN AUTOMATIC PROSODY RECOGNIZER USING A COUPLED MULTI-STREAM ACOUSTIC MODEL AND A SYNTACTIC-PROSODIC LANGUAGE MODEL
Ananthakrishnan, S. / Narayanan, S. / IEEE et al. | 2005
print version
I: SP-P1.3: F0 CONTROL CHARACTERIZATION BY PERCEPTUAL IMPRESSIONS ON SPEAKING ATTITUDES USING MULTIPLE DIMENSIONAL SCALING ANALYSIS
Kokenawa, Y. / Tsuzaki, M. / Kato, H. / Sagisaka, Y. / IEEE et al. | 2005
print version
I: SP-P3.6: SPEECH MODELLING BASED ON GENERALIZED GAUSSIAN PROBABILITY DENSITY FUNCTIONS
Kokkinakis, K. / Nandi, A. K. / IEEE et al. | 2005
print version
I: SP-P5.11: COMBINING MULTIPLE SUBWORD REPRESENTATIONS FOR OPEN-VOCABULARY SPOKEN DOCUMENT RETRIEVAL
Lee, S.-w. / Tanaka, K. / Itoh, Y. / IEEE et al. | 2005
print version
I: SP-P7.3: LANGUAGE IDENTIFICATION USING PHONETIC AND PROSODIC HMMS WITH FEATURE NORMALIZATION
Obuchi, Y. / Sato, N. / IEEE et al. | 2005
print version
I: SP-P7.7: DIALECT/ACCENT CLASSIFICATION VIA BOOSTED WORD MODELING
Huang, R. / Hansen, J. H. L. / IEEE et al. | 2005
print version
I: SP-P8.5: ADVANCES IN CHANNEL COMPENSATION FOR SVM SPEAKER RECOGNITION
Solomonoff, A. / Campbell, W. / Boardman, I. / IEEE et al. | 2005
print version
I: SP-P8.8: MINIMUM CLASSIFICATION ERROR INTERACTIVE TRAINING FOR SPEAKER IDENTIFICATION
Kida, Y. / Yamamoto, H. / Miyajima, C. / Tokuda, K. / Kitamura, T. / IEEE et al. | 2005
print version
I: SP-P10.7: A SESSION-GMM GENERATIVE MODEL USING TEST UTTERANCE GAUSSIAN MIXTURE MODELING FOR SPEAKER VERIFICATION
Aronowitz, H. / Burshtein, D. / Amir, A. / IEEE et al. | 2005
print version
I: SP-P11.11: STOCHASTIC INTEGRATION AND LONG TERM PREDICTOR ESTIMATION UNDER NOISY CONDITIONS FOR SPEECH ENHANCEMENT
Kuropatwinski, M. / Kleijn, B. / IEEE et al. | 2005
print version
I: SP-P11.13: ARTIFICIAL BANDWIDTH EXPANSION METHOD TO IMPROVE INTELLIGIBILITY AND QUALITY OF AMR-CODED NARROWBAND SPEECH
Laaksonen, L. / Kontio, J. / Alku, P. / IEEE et al. | 2005
print version
I: SP-P12.4: USING RULE-BASED KNOWLEDGE TO IMPROVE LVCSR
Beutler, R. / Kaufmann, T. / Pfister, B. / IEEE et al. | 2005
print version
I: SP-P14.10: GARCH COEFFICIENTS AS FEATURE FOR SPEECH RECOGNITION IN PERSIAN ISOLATED DIGIT
Abdolahi, M. / Amindavar, H. / IEEE et al. | 2005
print version
I: SP-P15.1: VARIATIONAL BAYESIAN ADAPTATION FOR SPEAKER CLUSTERING
Valente, F. / Wellekens, C. / IEEE et al. | 2005
print version
I: SP-L1.2: INTRODUCING ROUGHNESS IN INDIVIDUALITY TRANSFORMATION THROUGH JITTER MODELING AND MODIFICATION
Verma, A. / Kumar, A. / IEEE et al. | 2005
print version
I: SP-L2.5: MODEL ADAPTATION FOR SPOKEN LANGUAGE UNDERSTANDING
Tur, G. / IEEE et al. | 2005
print version
I: SP-L3.4: CAN YOU UNDERSTAND HIM? LET'S LOOK AT HIS WORD ACCURACY - AUTOMATIC EVALUATION OF TRACHEOESOPHAGEAL SPEECH
Schuster, M. / Noeth, E. / Haderl, T. / Steidl, S. / Batliner, A. / Rosanowski, F. / IEEE et al. | 2005
print version
I: SP-L5.3: STATISTICAL PERFORMANCE ANALYSIS OF MCE/GPD LEARNING IN GAUSSIAN CLASSIFIERS AND HIDDEN MARKOV MODELS
Afify, M. / Li, X.-W. / Jiang, H. / IEEE et al. | 2005
print version
I: SP-L6.4: A NEW SEGMENT QUANTIZER FOR LINE SPECTRAL FREQUENCIES USING LEMPEL-ZIV ALGORITHM
Kohata, M. / Suzuki, M. / Makino, S. / IEEE et al. | 2005
print version
I: SP-L8.1: IMPROVED PHONETIC SPEAKER RECOGNITION USING LATTICE DECODING
Hatch, A. / Peskin, B. / Stolcke, A. / IEEE et al. | 2005
print version
I: SP-L9.1: SUB-PHONETIC POLYNOMIAL SEGMENT MODEL FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION
Yeung, S.-K. A. / Li, C.-F. / Siu, M.-H. / IEEE et al. | 2005
print version
I: SP-L10.1: SPEECH ANALYSIS BY ESTIMATING PERCEPTUALLY RELEVANT POLE LOCATIONS
Atti, V. / Spanias, A. / IEEE et al. | 2005
print version
I: SP-P5.8: SEMANTIC DATA MINING OF SHORT UTTERANCES
Begeja, L. / Drucker, H. / Gibbon, D. / Haffner, P. / Liu, Z. / Renger, B. / Shahraray, B. / IEEE et al. | 2005
print version
I: SP-P7.8: WEB-DATA AUGMENTED LANGUAGE MODELS FOR MANDARIN CONVERSATIONAL SPEECH RECOGNITION
Ng, T. / Ostendorf, M. / Hwang, M.-Y. / Siu, M. / Bulyko, I. / Lei, X. / IEEE et al. | 2005
print version
I: SP-P7.10: MAXIMUM ENTROPY BASED GENERIC FILTER FOR LANGUAGE MODEL ADAPTATION
Yu, D. / Mahajan, M. / Mau, P. / Acero, A. / IEEE et al. | 2005
print version
I: SP-P8.10: GMM-BASED BHATTACHARYYA KERNEL FISHER DISCRIMINANT ANALYSIS FOR SPEAKER RECOGNITION
Chao, Y.-H. / Wang, H.-M. / Chang, R.-C. / IEEE et al. | 2005
print version
I: SP-P9.10: ACOUSTIC MODEL TRAINING USING GREEDY EM
Hu, R. / Li, X. / Zhao, Y. / IEEE et al. | 2005
print version
I: SP-P10.5: CLUSTERING SPEECH UTTERANCES BY SPEAKER USING EIGENVOICE-MOTIVATED VECTOR SPACE MODELS
Tsai, W.-H. / Cheng, S.-S. / Chao, Y.-H. / Wang, H.-M. / IEEE et al. | 2005
print version
I: SP-P11.8: JOINT OPTIMIZATION OF EXCITATION PARAMETERS IN ANALYSIS-BY-SYNTHESIS SPEECH CODERS HAVING MULTI-TAP LONG TERM PREDICTOR
Mittal, U. / Ashley, J. / Cruz-Zeno, E. / Jasiuk, M. / IEEE et al. | 2005
print version
I: SP-P11.9: BLOCK-BASED BANDWIDTH EXTENSION OF NARROWBAND SPEECH SIGNAL BY USING CDHMM
Yao, S. / Chan, C.-F. / IEEE et al. | 2005
print version
I: SP-P14.5: AUTOMATIC SYLLABLE STRESS DETECTION USING PROSODIC FEATURES FOR PRONUNCIATION EVALUATION OF LANGUAGE LEARNERS
Tepperman, J. / Narayanan, S. / IEEE et al. | 2005
print version
I: SP-P14.11: FMPE: DISCRIMINATIVELY TRAINED FEATURES FOR SPEECH RECOGNITION
Povey, D. / Kingsbury, B. / Mangu, L. / Saon, G. / Soltau, H. / Zweig, G. / IEEE et al. | 2005
print version
I: SP-P15.3: AGGREGATE A POSTERIORI LINEAR REGRESSION FOR SPEAKER ADAPTATION
Huang, C.-H. / Chien, J.-T. / IEEE et al. | 2005
print version
I: SP-P15.12: WHISPERY SPEECH RECOGNITION USING ADAPTED ARTICULATORY FEATURES
Jou, S.-C. / Schultz, T. / Waibel, A. / IEEE et al. | 2005
print version
I: SP-L1.5: VOICE FORGERY USING ALISP: INDEXATION IN A CLIENT MEMORY
Perrot, P. / Aversano, G. / Blouet, R. / Charbit, M. / Chollet, G. / IEEE et al. | 2005
print version
I: SP-L2.3: DIALOG ACT TAGGING USING GRAPHICAL MODELS
Ji, G. / Bilmes, J. / IEEE et al. | 2005
print version
I: SP-L3.3: ANALYSIS OF RELATIONSHIP BETWEEEN OVERALL QUALITY AND PSYCHOLOGICAL FACTORS AFFECTING HIGH-QUALITY SPEECH COMMUNICATION SERVICES
Aoki, H. / Takahashi, A. / IEEE et al. | 2005
print version
I: SP-L3.5: A WARPED BANDWIDTH EXPANSION FILTER
Boillot, M. / Harris, J. / IEEE et al. | 2005
print version
I: SP-L5.4: DISCRIMINATIVE TRAINING OF ACOUSTIC MODELS APPLIED TO DOMAINS WITH UNRELIABLE TRANSCRIPTS
Mathias, L. / Yegnanarayanan, G. / Fritsch, J. / IEEE et al. | 2005
print version
I: SP-L5.6: DISCRIMINATIVE TRAINING BASED ON THE CRITERION OF LEAST PHONE COMPETING TOKENS FOR LARGE VOCABULARY SPEECH RECOGNITION
Liu, B. / Jiang, H. / Zhou, J.-L. / Wang, R.-H. / IEEE et al. | 2005
print version
I: SP-L9.3: EFFICIENT GENERATION OF HIGH-ORDER CONTEXT-DEPENDENT WEIGHTED FINITE STATE TRANSDUCERS FOR SPEECH RECOGNITION
Schuster, M. / Hori, T. / IEEE et al. | 2005
print version
I: SP-L11.4: MULTI-RESOLUTION SPECTRAL ENTROPY FEATURE FOR ROBUST ASR
Misra, H. / Ikbal, S. / Sivadas, S. / Bourlard, H. / IEEE et al. | 2005
print version
I: SP-P1.1: IMPROVING THE UNDERSTANDABILITY OF SPEECH SYNTHESIS BY MODELING SPEECH IN NOISE
Langner, B. / Black, A. W. / IEEE et al. | 2005
print version
I: SP-P1.9: PREDICTION OF PRONUNCIATION VARIATIONS FOR SPEECH SYNTHESIS: A DATA-DRIVEN APPROACH
Bennett, C. / Black, A. W. / IEEE et al. | 2005
print version
I: SP-P2.1: INCREASED ROBUSTNESS AGAINST BIT ERRORS FOR DISTRIBUTED SPEECH RECOGNITION IN WIRELESS ENVIRONMENTS
Delaney, B. / IEEE et al. | 2005
print version
I: SP-P2.5: PACKET LOSS CONCEALMENT BASED ON VQ REPLICAS AND MMSE ESTIMATION APPLIED TO DISTRIBUTED SPEECH RECOGNITION
Peinado, A. M. / Gomez, A. M. / Sanchez, V. E. / Perez-Cordoba, J. L. / Rubio, A. J. / IEEE et al. | 2005
print version
I: SP-P2.6: A COMPARISON OF SOFT-FEATURE DISTRIBUTED SPEECH RECOGNITION WITH CANDIDATE CODECS FOR SPEECH ENABLED MOBILE SERVICES
Ion, V. / Haeb-Umbach, R. / IEEE et al. | 2005
print version
I: SP-P2.8: A COMPARISON OF CLASSIFIERS FOR DETECTING EMOTION FROM SPEECH
Shafran, I. / Mohri, M. / IEEE et al. | 2005
print version
I: SP-P3.10: AUTOMATIC SPEECH SEGMENTATION USING AVERAGE LEVEL CROSSING RATE INFORMATION
Sarkar, A. / Sreenivas, T. V. / IEEE et al. | 2005
print version
I: SP-P3.11: DWT-BASED PHONETIC GROUPS CLASSIFICATION USING NEURAL NETWORKS
Pham, V. T. / Kubin, G. / IEEE et al. | 2005
print version
I: SP-P3.12: A NOVEL KLT ALGORITHM OPTIMIZED FOR SMALL SIGNAL SETS
Gianfelici, F. / Biagetti, G. / Crippa, P. / Turchetti, C. / IEEE et al. | 2005
print version
I: SP-P4.4: AN ENVIRONMENT COMPENSATED MAXIMUM LIKELIHOOD TRAINING APPROACH BASED ON STOCHASTIC VECTOR MAPPING
Wu, J. / Huo, Q. / Zhu, D. / IEEE et al. | 2005
print version
I: SP-P8.1: DISCRIMINATIVE POWER OF TRANSIENT FRAMES IN SPEAKER RECOGNITION
Louradour, J. / Daoudi, K. / Andre-Obrecht, R. / IEEE et al. | 2005
print version
I: SP-P9.5: CLUSTER-DEPENDENT ACOUSTIC MODELING
Xiang, B. / Nguyen, L. / Matsoukas, S. / Schwartz, R. / IEEE et al. | 2005
print version
I: SP-P9.9: ON INITIALIZATION OF GAUSSIAN MIXTURES: A HYBRID GENETIC EM ALGORITHM
Pernkopf, F. / IEEE et al. | 2005
print version
I: SP-P9.12: IMPROVED COVARIANCE MODELING FOR MAXIMUM LIKELIHOOD MULTIPLE SUBSPACE TRANSFORMATIONS
Zhou, X. / Tian, Y. / Zhou, J. / Dai, B. / IEEE et al. | 2005
print version
I: SP-P10.2: A CORRELATION METRIC FOR SPEAKER TRACKING USING ANCHOR MODELS
Collet, M. / Charlet, D. / Bimbot, F. / IEEE et al. | 2005
print version
I: SP-P10.4: F-RATIO CLIENT-DEPENDENT NORMALISATION FOR BIOMETRIC AUTHENTICATION TASKS
Poh, N. / Bengio, S. / IEEE et al. | 2005
print version
I: SP-P10.12: TWO-WAY CLUSTER VOTING TO IMPROVE SPEAKER DIARISATION PERFORMANCE
Tranter, S. / IEEE et al. | 2005
print version
I: SP-P10.13: SPEAKER DETECTION WITHOUT MODELS
Gillick, D. / Stafford, S. / Peskin, B. / IEEE et al. | 2005
print version
I: SP-P11.5: A TECHNIQUE OF MULTI-TAP LONG TERM PREDICTOR (LTP) FILTER USING SUB-SAMPLE RESOLUTION DELAY
Jasiuk, M. / Ramabadran, T. / Mittal, U. / Ashley, J. / McLaughlin, M. / IEEE et al. | 2005
print version
I: SP-P12.2: FIRST STEPS IN FAST ACOUSTIC MODELING FOR A NEW TARGET LANGUAGE: APPLICATION TO VIETNAMESE
Le, V.-B. / Besacier, L. / IEEE et al. | 2005
print version
I: SP-P12.11: THAI AUTOMATIC SPEECH RECOGNITION
Suebvisai, S. / Charoenpornsawat, P. / Black, A. W. / Woszczyna, M. / Schultz, T. / IEEE et al. | 2005
print version
I: SP-P13.7: MODELING OF THE FRONT CAVITY AND SUBLINGUAL SPACE IN AMERICAN ENGLISH RHOTIC SOUNDS
Zhang, Z. / Espy-Wilson, C. / Boyce, S. / Tiede, M. / IEEE et al. | 2005
print version
I: SP-P14.4: A WAVELET AND FILTER BANK FRAMEWORK FOR PHONETIC CLASSIFICATION
Choueiter, G. / Glass, J. / IEEE et al. | 2005
print version
I: SP-P15.5: VARIOUS REFERENCE SPEAKERS DETERMINATION METHODS FOR EMBEDDED KERNEL EIGENVOICE SPEAKER ADAPTATION
Mak, B. / Ho, S. / IEEE et al. | 2005
print version
I: SP-P15.9: ADAPTIVE TRAINING USING SIMPLE TARGET MODELS
Stemmer, G. / Brugnara, F. / Giuliani, D. / IEEE et al. | 2005
print version
I: SP-P16.7: OPEN VOCABULARY CHINESE NAME RECOGNITION WITH THE HELP OF CHARACTER DESCRIPTION AND SYLLABLE SPELLING RECOGNITION
Tsai, C.-H. / Wang, N. J.-C. / Huang, P. / Shen, J.-L. / IEEE et al. | 2005
print version
I: SP-L1.6: AN IMPROVED SPECTRAL AND PROSODIC TRANSFORMATION METHOD IN STRAIGHT-BASED VOICE CONVERSION
Qin, L. / Chen, G. / Ling, Z. / Dai, L. / IEEE et al. | 2005
print version
I: SP-L2.2: SEMANTIC INTERPRETATION WITH ERROR CORRECTION
Raymond, C. / Bechet, F. / Camelin, N. / De Mori, R. / Damnati, G. / IEEE et al. | 2005
print version
I: SP-L2.4: A CLARIFICATION ALGORITHM FOR SPOKEN DIALOGUE SYSTEMS
Lewis, C. / Di Fabbrizio, G. / IEEE et al. | 2005
print version
I: SP-L8.2: SRI'S 2004 NIST SPEAKER RECOGNITION EVALUATION SYSTEM
Kajarekar, S. / Ferrer, L. / Shriberg, E. / Sonmez, K. / Stolcke, A. / Venkataraman, A. / Zheng, J. / IEEE et al. | 2005
print version
I: SP-P1.4: ADDITIVE MODELING OF ENGLISH F0 CONTOUR FOR SPEECH SYNTHESIS
Sakai, S. / IEEE et al. | 2005
print version
I: SP-P1.10: RECORDING SCRIPT DESIGN FOR CORPUS-BASED TTS SYSTEM BASED ON COVERAGE OF VARIOUS PHONETIC ELEMENTS
Isogai, M. / Mizuno, H. / Mano, K. / IEEE et al. | 2005
print version
I: SP-P1.12: COMPARATIVE STUDY OF AUTOMATIC PHONE SEGMENTATION METHODS FOR TTS
Adell, J. / Bonafonte, A. / Gomez, J. A. / Castro, M. J. / IEEE et al. | 2005
print version
I: SP-P2.12: EFFECTS OF PHONEME CHARACTERISTICS ON TEO FEATURE-BASED AUTOMATIC STRESS DETECTION IN SPEECH
Ruzanski, E. / Hansen, J. H. L. / Meyerhoff, J. L. / Saviolakis, G. / Koenig, M. / IEEE et al. | 2005
print version
I: SP-P4.10: HMM/ANN BASED SPECTRAL PEAK LOCATION ESTIMATION FOR NOISE ROBUST SPEECH RECOGNITION
Ikbal, S. / Bourlard, H. / Magimai-Doss, M. / IEEE et al. | 2005
print version
I: SP-P5.2: A STREAM-WEIGHT OPTIMIZATION METHOD FOR MULTI-STREAM HMMS BASED ON LIKELIHOOD VALUE NORMALIZATION
Tamura, S. / Iwano, K. / Furui, S. / IEEE et al. | 2005
print version
I: SP-P5.10: BLIND CHANGE DETECTION FOR AUDIO SEGMENTATION
Omar, M. / Chaudhari, U. / Ramaswamy, G. / IEEE et al. | 2005
print version
I: SP-P6.1: VARIATIONAL BAYESIAN FEATURE SALIENCY FOR AUDIO TYPE CLASSIFICATION
Valente, F. / Wellekens, C. / IEEE et al. | 2005
print version
I: SP-P7.13: AUTOMATIC LANGUAGE IDENTIFICATION USING ERGODIC HMM
SantoshKumar, S. A. / Ramasubramanian, V. / IEEE et al. | 2005
print version
I: SP-P9.4: HIERARCHICAL CORRELATION COMPENSATION FOR HIDDEN MARKOV MODELS
Lin, H. / Tian, Y. / Zhou, J. / Jiang, H. / IEEE et al. | 2005
print version
I: SP-P11.2: ULTRA LOW BIT RATE SPEECH CODING USING AN ERGODIC HIDDEN MARKOV MODEL
Lee, M. / Durey, A. / Moore, E. / Clements, M. / IEEE et al. | 2005
print version
I: SP-P11.10: SEGMENTATION-BASED SPEECH ENHANCEMENT FOR INTELLIGIBILITY IMPROVEMENT IN MELP CODERS USING AUXILIARY SENSORS
Demiroglu, C. / Kamath, S. / Anderson, D. / IEEE et al. | 2005
print version
I: SP-P12.1: LATTICE SEGMENTATION AND SUPPORT VECTOR MACHINES FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION
Venkataramani, V. / Byrne, W. / IEEE et al. | 2005
print version
I: SP-P12.7: DEVELOPMENT OF THE CUHTK 2004 MANDARIN CONVERSATIONAL TELEPHONE SPEECH TRANSCRIPTION SYSTEM
Gales, M. J. F. / Jia, B. / Liu, A. / Sim, K. C. / Woodland, P. / Yu, K. / IEEE et al. | 2005
print version
I: SP-P13.6: MATHEMATICAL EVIDENCE OF THE ACOUSTIC UNIVERSAL STRUCTURE IN SPEECH
Minematsu, N. / IEEE et al. | 2005
print version
I: SP-P15.8: A NOVEL METHOD FOR RAPID SPEAKER ADAPTATION BASED ON SUPPORT SPEAKER WEIGHTING
Cai, T. / Zhu, J. / IEEE et al. | 2005
print version
I: SP-P16.2: CONSTRAINED PHRASE-BASED TRANSLATION USING WEIGHTED FINITE STATE TRANSDUCER
Zhou, B. / Chen, S. / Gao, Y. / IEEE et al. | 2005
print version
I: SP-P17.3: CODEBOOK-BASED BAYESIAN SPEECH ENHANCEMENT
Srinivasan, S. / Samuelsson, J. / Kleijn, B. / IEEE et al. | 2005
print version
I: SP-P17.9: SEPARATION OF FRICATIVES AND AFFRICATES
Hu, G. / Wang, D. / IEEE et al. | 2005
print version
I: SP-L1.4: A STUDY ON RESIDUAL PREDICTION TECHNIQUES FOR VOICE CONVERSION
Suendermann, D. / Bonafonte, A. / Ney, H. / Hoege, H. / IEEE et al. | 2005
print version
I: SP-L4.4: GENERALIZED POSTERIOR PROBABILITY FOR MINIMUM ERROR VERIFICATION OF RECOGNIZED SENTENCES
Lo, W. K. / Soong, F. K. / IEEE et al. | 2005
print version
I: SP-L10.5: AN ALGORITHM FOR LOCATING FUNDAMENTAL FREQUENCY MARKERS IN SPEECH SIGNALS
Dikshit, P. / Zahorian, S. / Nagulapati, S. / IEEE et al. | 2005
print version
I: SP-P1.11: OPTIMAL SUBSET SELECTION FROM TEXT DATABASES
Tian, J. / Nurminen, J. / Kiss, I. / IEEE et al. | 2005
print version
I: SP-P3.8: ROBUST PITCH ESTIMATION AT VERY LOW SNR EXPLOITING TIME AND FREQUENCY DOMAIN CUES
Shahnaz, C. / Zhu, W.-P. / Ahmad, M. O. / IEEE et al. | 2005
print version
I: SP-P4.6: TOWARDS SPEECH RECOGNITION ORIENTED DEREVERBERATION
Jinachitra, P. / Prieto, R. / IEEE et al. | 2005
print version
I: SP-P4.12: ACOUSTIC TRAINING FROM HETEROGENEOUS DATA SOURCES: EXPERIMENTS IN MANDARIN CONVERSATIONAL TELEPHONE SPEECH TRANSCRIPTION
Tsakalidis, S. / Byrne, W. / IEEE et al. | 2005
print version
I: SP-P5.3: LIP READING FOR ROBUST SPEECH RECOGNITION ON EMBEDDED DEVICES
Perez, J. F. G. / Frangi, A. F. / Solano, E. L. / Lukas, K. / IEEE et al. | 2005
print version
I: SP-P5.12: ROBUST LIP-MOTION FEATURES FOR SPEAKER IDENTIFICATION
Cetingul, H. E. / Yemez, Y. / Erzin, E. / Tekalp, A. M. / IEEE et al. | 2005
print version
I: SP-P6.3: MFCC COMPENSATION FOR IMPROVED RECOGNITION OF FILTERED AND BAND-LIMITED SPEECH
Morales, N. / Hansen, J. H. L. / Toledano, D. T. / IEEE et al. | 2005
print version
I: SP-P7.11: LANGUAGE IDENTIFICATION USING PITCH CONTOUR INFORMATION
Lin, C.-Y. / Wang, H.-C. / IEEE et al. | 2005
print version
I: SP-P8.2: SPEAKER IDENTIFICATION IN UNKNOWN NOISY CONDITIONS - A UNIVERSAL COMPENSATION APPROACH
Ming, J. / Stewart, D. / Vaseghi, S. / IEEE et al. | 2005
print version
I: SP-P8.11: A STUDY OF THE RELATIVE IMPORTANCE OF TEMPORAL CHARACTERISTICS IN TEXT-DEPENDENT AND TEXT-CONSTRAINED SPEAKER VERIFICATION
Nealand, J. / Pelecanos, J. / Zilca, R. / Ramaswamy, G. / IEEE et al. | 2005
print version
I: SP-P9.1: INITIALIZING SUBSPACE CONSTRAINED GAUSSIAN MIXTURE MODELS
Olsen, P. / Visweswariah, K. / Gopinath, R. / IEEE et al. | 2005
print version
I: SP-P9.2: MULTI-RATE AND VARIABLE-RATE MODELING OF SPEECH AT PHONE AND SYLLABLE TIME SCALES
Cetin, O. / Ostendorf, M. / IEEE et al. | 2005
print version
I: SP-P10.3: ESTIMATING AND EVALUATING CONFIDENCE FOR FORENSIC SPEAKER RECOGNITION
Campbell, W. / Reynolds, D. / Campbell, J. / Brady, K. / IEEE et al. | 2005
print version
I: SP-P12.5: ADAPTATION STRATEGIES FOR THE ACOUSTIC AND LANGUAGE MODELS IN BILINGUAL SPEECH TRANSCRIPTION
Dieguez-Tirado, J. / Garcia-Mateo, C. / Docio-Fernandez, L. / Cardenal-Lopez, A. / IEEE et al. | 2005
print version
I: SP-P13.4: SNR AND LOCAL NOISE POWER ESTIMATIONS BASED ON GAUSSIAN MIXTURE MODELING ON THE LOG-POWER DOMAIN
Takeda, K. / Dat, T. H. / Fujimura, H. / Itakura, F. / IEEE et al. | 2005
print version
I: SP-P13.11: MULTI-SPEAKER ARTICULATORY RECONSTRUCTION BASED ON AN EIGEN ARTICULATORY HMM
Hiroya, S. / Mochida, T. / IEEE et al. | 2005
print version
I: SP-P13.13: DYSPHONIC SPEECH ANALYSIS USING GENERALIZED VARIOGRAM
Kacha, A. / Grenez, F. / Schoentgen, J. / Benmahammed, K. / IEEE et al. | 2005
print version
I: SP-P14.1: TRAINING WIDEBAND ACOUSTIC MODELS USING MIXED-BANDWIDTH TRAINING DATA VIA FEATURE BANDWIDTH EXTENSION
Seltzer, M. / Acero, A. / IEEE et al. | 2005
print version
I: SP-P14.6: PREDICTING FORMANT FREQUENCIES FROM MFCC VECTORS
Darch, J. / Milner, B. / Shao, X. / Vaseghi, S. / Yan, Q. / IEEE et al. | 2005
print version
I: SP-P14.8: TOWARDS AN INTELLIGENT ACOUSTIC FRONT-END FOR AUTOMATIC SPEECH RECOGNITION: BUILT-IN SPEAKER NORMALIZATION (BISN)
Yapanel, U. / Hansen, J. H. L. / IEEE et al. | 2005
print version
I: SP-P16.1: OPEN VOCABULARY ASR FOR AUDIOVISUAL DOCUMENT INDEXATION
Allauzen, A. / Gauvain, J.-L. / IEEE et al. | 2005
print version
I: SP-P17.1: BLIND DEREVERBERATION BASED ON ESTIMATES OF SIGNAL TRANSMISSION CHANNELS WITHOUT PRECISE INFORMATION OF CHANNEL ORDER
Hikichi, T. / Delcroix, M. / Miyoshi, M. / IEEE et al. | 2005
print version
I: SP-P17.2: FAST ESTIMATION OF A PRECISE DEREVERBERATION FILTER BASED ON SPEECH HARMONICITY
Kinoshita, K. / Nakatani, T. / Miyoshi, M. / IEEE et al. | 2005
print version
I: SP-P17.12: ADAPTIVE DECORRELATION FILTERING ALGORITHM FOR SPEECH SOURCE SEPARATION IN UNCORRELATED NOISES
Hu, R. / Zhao, Y. / IEEE et al. | 2005
print version
I/1: Polyglot synthesis using a mixture of monolingual corpora
Latorre, J. / Iwano, K. / Furui, S. et al. | 2005
digital version
I/5: Introducing roughness in individuality transformation through jitter modeling and modification
Verma, A. / Kumar, A. et al. | 2005
digital version
I/9: Spectral conversion based on maximum likelihood estimation considering global variance of converted parameter
Toda, T. / Black, A.W. / Tokuda, K. et al. | 2005
digital version
I/13: A study on residual prediction techniques for voice conversion
Sundermann, D. / Bonafonte, A. / Ney, H. et al. | 2005
digital version
I/17: Voice forgery using ALISP: indexation in a client memory
Patrick, P.Z. / Aversano, G. / Blouet, R. / Charbit, M. / Chollet, G. et al. | 2005
digital version
I/21: An improved spectral and prosodic transformation method in STRAIGHT-based voice conversion
Long Qin, / Gao-Peng Chen, / Zhen-Hua Ling, / Li-Rong Dai, et al. | 2005
digital version
I/25: Incorporating discourse features into confidence scoring of intention recognition results in spoken dialogue systems
Higashinaka, R. / Sudoh, K. / Nakano, M. et al. | 2005
digital version
I/29: Semantic interpretation with error correction
Raymond, C. / Bechet, F. / Camelin, N. / De Mori, R. / Damnati, G. et al. | 2005
digital version
I/33: Dialog act tagging using graphical models
Gang Ji, / Bilmes, J. et al. | 2005
digital version
I/37: A clarification algorithm for spoken dialogue systems
Lewis, C. / Di Fabbrizio, G. et al. | 2005
digital version
I/41: Model adaptation for spoken language understanding
Tur, G. et al. | 2005
digital version
I/45: Unsupervised semantic intent discovery from call log acoustics
Xiao Li, / Gunawardana, A. / Acero, A. et al. | 2005
digital version
I/49: Proposal on objective speech quality assessment for wideband IP telephony
Morioka, C. / Kurashima, A. / Takahashi, A. et al. | 2005
digital version
I/53: Neural cell type recognition between globus pallidus externus and globus pallidus internus by Gaussian mixture modeling
Qiang Fu, / Clements, M. / Mewes, K. et al. | 2005
digital version
I/57: Analysis of relationship between overall quality and psychological factors affecting high-quality speech communication services
Aoki, H. / Takahashi, A. et al. | 2005
digital version
I/61: Can you understand him? Let's look at his word accuracy-automatic evaluation of tracheoesophageal speech
Schuster, M. / Noth, E. / Haderlein, T. / Steidl, S. / Batliner, A. / Rosanowski, F. et al. | 2005
digital version
I/65: A warped bandwidth expansion filter
Boillot, M.A. / Harris, J.G. et al. | 2005
digital version
I/69: Relative energy and intelligibility of transient speech information
Sungyub Yoo, / Boston, J.R. / Durrant, J.D. / Kovacyk, K. / Karn, S. / Shaiman, S. / El-Jaroudi, A. / Ching-Chung Li, et al. | 2005
digital version
I/73: Rejection using rank statistics based on HMM state shortlists
Bocchieri, E. / Parthasarathy, S. et al. | 2005
digital version
I/77: Speaker adaptive confidence scoring using Bayesian combining
Tae-Yoon Kim, / Hanseok Ko, et al. | 2005
digital version
I/81: Improving utterance verification using additional confidence measures in isolated speech recognition interfaces
Greenland, G. / Wong, W. / Kunov, H. et al. | 2005
digital version
I/85: Generalized posterior probability for minimum error verification of recognized sentences
Wai Kit Lo, / Soong, F.K. et al. | 2005
digital version
I/89: Robust speech recognition by integrating speech separation and hypothesis testing
Srinivasan, S. / DeLiang Wang, et al. | 2005
digital version
I/93: Combination of multiple predictors to improve confidence measure based on local posterior probabilities
Yuewen Fu, / Limin Du, et al. | 2005
digital version
I/97: Adaptation of precision matrix models on large vocabulary continuous speech recognition
Sim, K.C. / Gales, M. et al. | 2005
digital version
I/101: Discriminative training of CDHMMs for maximum relative separation margin
Chaojun Liu, / Hui Jiang, / Xinwei Li, et al. | 2005
digital version
I/105: Statistical performance analysis of MCE/GPD learning in Gaussian classifiers and hidden Markov models [speech recognition example]
Afify, M. / Xin-Wei Lai, / Hui Jiang, et al. | 2005
digital version
I/109: Discriminative training of acoustic models applied to domains with unreliable transcripts [speech recognition applications]
Mathias, L. / Yegnanarayanan, G. / Fritsch, J. et al. | 2005
digital version
I/113: Minimum classification error for large scale speech recognition tasks using weighted finite state transducers
McDermott, E. / Katagiri, S. et al. | 2005
digital version
I/117: Discriminative training based on the criterion of least phone competing tokens for large vocabulary speech recognition
Bo Liu, / Hui Jiang, / Jian-Lai Zhou, / Ren-Hua Wang, et al. | 2005
digital version
I/121: Multi-frame GMM-based block quantisation of line spectral frequencies for wideband speech coding
So, S. / Paliwal, K.K. et al. | 2005
digital version
I/125: Non-intrusive GMM-based speech quality measurement
Falk, T.H. / Qingfeng Xu, / Wai-Yip Chan, et al. | 2005
digital version
I/129: A multiple-description PCM speech coder using structured dual vector quantizers
Voran, S.D. et al. | 2005
digital version
I/133: A new segment quantizer for line spectral frequencies using Lempel-Ziv algorithm [speech coding applications]
Kohata, M. / Suzuki, M. / Makino, S. et al. | 2005
digital version
I/137: Predictive VQ for bandwidth scalable LSP quantization [speech coding applications]
Ehara, H. / Morii, T. / Oshikiri, M. / Yoshida, K. et al. | 2005
digital version
I/141: Coding with side information techniques for LSF reconstruction in voice over IP
Agiomyrgiannakis, Y. / Stylianou, Y. et al. | 2005
digital version
I/145: Signal subspace speech enhancement for audible noise reduction
Chang Huai You, / Soo Ngee Koh, / Rahardja, S. et al. | 2005
digital version
I/149: A wavelet Kalman filter with perceptual masking for speech enhancement in colored noise
Ning Ma, / Bouchard, M. / Goubran, R.A. et al. | 2005
digital version
I/153: Adaptive time segmentation of noisy speech for improved speech enhancement
Hendriks, R.C. / Heusdens, R. / Jensen, J. et al. | 2005
digital version
I/157: Speech enhancement using harmonic regeneration
Plapous, C. / Marro, C. / Scalart, P. et al. | 2005
digital version
I/161: Instant noise estimation using Fourier transform of AMDF and variable start minima search
Zhong Lin, / Goubran, R. et al. | 2005
digital version
I/165: Speech enhancement based on speech spectral complex Gaussian mixture model
Guo-Hong Ding, / Xia Wang, / Yang Cao, / Feng Ding, / Yuezhong Tang, et al. | 2005
digital version
I/169: Improved phonetic speaker recognition using lattice decoding
Hatch, A.O. / Peskin, B. / Stolcke, A. et al. | 2005
digital version
I/173: SRI's 2004 NIST speaker recognition evaluation system
Kajarekar, S.S. / Ferrer, L. / Shriberg, E. / Sonmez, K. / Stolcke', A. / Venkataraman, A. / Jing Zheng, et al. | 2005
digital version
I/177: The 2004 MIT Lincoln Laboratory speaker recognition system
Reynolds, D.A. / Campbell, W. / Gleason, T. / Quillen, C. / Sturim, D. / Torres-Carrasquillo, P. / Adami, A. et al. | 2005
digital version
I/181: Speaker verification using adapted articulatory feature-based conditional pronunciation modeling
Ka-Yee Leung, / Man-Wai Mak, / Manhung Siu, / Sun-Yuan Kung, et al. | 2005
digital version
I/185: Prosody modeling and eigen-prosody analysis for robust speaker recognition
Zi-He Chen, / Yuan-Fu Liao, / Yau-Tarng Juang, et al. | 2005
digital version
I/189: Prosodic modeling for speaker recognition based on sub-band energy temporal trajectories
Adami, A.G. et al. | 2005
digital version
I/193: Sub-phonetic polynomial segment model for large vocabulary continuous speech recognition
Siu-Kei Au Yeung, / Chak-Fai Li, / Man-Hung Siu, et al. | 2005
digital version
I/197: Constructing ensembles of ASR systems using randomized decision trees
Siohan, O. / Ramabhadran, B. / Kingsbury, B. et al. | 2005
digital version
I/201: Efficient generation of high-order context dependent weighted finite state transducers for speech recognition
Schuster, M. / Hori, T. et al. | 2005
digital version
I/205: The IBM 2004 conversational telephony system for rich transcription
Soltau, H. / Kingsbury, B. / Mangu, L. / Povey, D. / Saon, G. / Zweig, G. et al. | 2005
digital version
I/209: Training LVCSR systems on thousands of hours of data
Evermann, G. / Chan, H.Y. / Gales, M.J.F. / Jia, B. / Mrva, D. / Woodland, P.C. / Yu, K. et al. | 2005
digital version
I/213: Landmark-based speech recognition: report of the 2004 Johns Hopkins summer workshop
Hasegawa-Johnson, M. / Baker, J. / Borys, S. / Chen, K. / Coogan, E. / Greenberg, S. / Juneja, A. / Kirchhoff, K. / Livescu, K. / Mohan, S. et al. | 2005
digital version
I/217: Speech analysis by estimating perceptually relevant pole locations
Atti, V. / Spanias, A. et al. | 2005
digital version
I/221: Coherent envelope detection for modulation filtering of speech
Schimmel, S. / Atlas, L. et al. | 2005
digital version
I/225: Speech signal analysis with exponential autoregressive model
Ishizuka, K. / Kato, H. / Nakatani, T. et al. | 2005
digital version
I/229: Comparison of autoregressive parameter estimation algorithms for speech processing and recognition
Morris, R.W. / Arrowood, J.A. / Clements, M.A. et al. | 2005
digital version
I/233: An algorithm for locating fundamental frequency markers in speech signals
Dikshit, P. / Zahorian, S.A. / Nagulapati, S. et al. | 2005
digital version
I/237: An auto-regressive, non-stationary excited signal parameter estimation method and an evaluation of a singing-voice recognition
Sasou, A. / Goto, M. / Hayamizu, S. / Tanaka, K. et al. | 2005
digital version
I/241: Static and dynamic spectral features: their noise robustness and optimal weights for ASR
Chen Yang, / Soong, F.K. / Tan Lee, et al. | 2005
digital version
I/245: Log-energy dynamic range normalization for robust speech recognition
Weizhong Zhu, / O'Shaughnessy, D. et al. | 2005
digital version
I/249: A companding front end for noise-robust automatic speech recognition
Guinness, J. / Raj, B. / Schmidt-Nielsen, B. / Turicchia, L. / Sarpeshkars, R. et al. | 2005
digital version
I/253: Multi-resolution spectral entropy feature for robust ASR
Misra, H. / Ikbal, S. / Sivadas, S. / Bourlard, H. et al. | 2005
digital version
I/257: Particle filter based non-stationary noise tracking for robust speech recognition
Fujimoto, M. / Nakamura, S. et al. | 2005
digital version
I/261: Online cepstral filtering using a sequential EM approach with Polyak averaging and feedback [speech recognition applications]
Myrvoll, T.A. / Nakamura, S. et al. | 2005
digital version
I/265: Improving the understandability of speech synthesis by modeling speech in noise
Langner, B. / Black, A.W. et al. | 2005
digital version
I/269: An automatic prosody recognizer using a coupled multi-stream acoustic model and a syntactic-prosodic language model
Ananthakrishnan, S. / Narayanan, S.S. et al. | 2005
digital version
I/273: F0 control characterization by perceptual impressions on speaking attitudes using multiple dimensional scaling analysis
Kokenawa, Y. / Tsuzaki, M. / Kato, H. / Sagisaka, Y. et al. | 2005
digital version
I/277: Additive modeling of English F0 contour for speech synthesis
Sakai, S. et al. | 2005
digital version
I/281: Prosody analysis and modeling for emotional speech synthesis
Dan-ning Jiang, / Wei Zhang, / Li-qin Shen, / Lian-hong Cai, et al. | 2005
digital version
I/285: Sliding window smoothing for maximum entropy based intonational phrase prediction in Chinese
Jian-Feng Li, / Guo-Ping Hu, / Ren-Hua Wang, / Li-Rong Dai, et al. | 2005
digital version
I/289: Identification and synthesis of Cantonese tones based on the command-response model for F/sub 0/ contour generation
Wentao Gu, / Hirose, K. / Fujisaki, H. et al. | 2005
digital version
I/293: Compression of exception lexicons for small footprint grapheme-to-phoneme conversion
Meron, J. / Veprek, P. et al. | 2005
digital version
I/297: Prediction of pronunciation variations for speech synthesis: a data-driven approach
Bennett, C.L. / Black, A.W. et al. | 2005
digital version
I/301: Recording script design for corpus-based TTS system based on coverage of various phonetic elements
Isogai, M. / Mizuno, H. / Mano, K. et al. | 2005
digital version
I/305: Optimal subset selection from text databases
Jilei Tian, / Nurminen, J. / Kiss, I. et al. | 2005
digital version
I/309: Comparative study of automatic phone segmentation methods for TTS
Adell, J. / Bonafonte, A. / Gomez, J.A. / Castro, M.J. et al. | 2005
digital version
I/313: Increased robustness against bit errors for distributed speech recognition in wireless environments
Delaney, B. et al. | 2005
digital version
I/317: "Of all things the measure is man" automatic classification of emotions and inter-labeler consistency [speech-based emotion recognition]
Steidl, S. / Levit, M. / Batliner, A. / Noth, E. / Niemann, H. et al. | 2005
digital version
I/321: Disordered speech evaluation using objective quality measures
Lingyun Gu, / Harris, J.G. / Shrivastav, R. / Sapienza, C. et al. | 2005
digital version
I/325: Meta-classifiers in acoustic and linguistic feature fusion-based affect recognition
Schuller, B. / Villar, R.J. / Rigoll, G. / Lang, M. et al. | 2005
digital version
I/329: Packet loss concealment based on VQ replicas and MMSE estimation applied to distributed speech recognition
Peinado, A.M. / Gomez, A.M. / Sanchez, V. / Perez-Cordoba, J.L. / Rubio, A.J. et al. | 2005
digital version
I/333: A comparison of soft-feature distributed speech recognition with candidate codecs for speech enabled mobile services
Ion, V. / Haeb-Umbach, R. et al. | 2005
digital version
I/337: A hidden trajectory model with bi-directional target filtering: cascaded vs. integrated implementation for phonetic recognition
Li Deng, / Xiang Li, / Dong Yu, / Acero, A. et al. | 2005
digital version
I/341: A comparison of classifiers for detecting emotion from speech
Shafran, I. / Mohri, M. et al. | 2005
digital version
I/345: Soft decoding of temporal derivatives for robust distributed speech recognition in packet loss
James, A. / Milner, B. et al. | 2005
digital version
I/349: DBN-based multi-stream models for Mandarin toneme recognition
Xin Lei, / Gang Ji, / Ng, T. / Bilmes, J. / Ostendorf, M. et al. | 2005
digital version
I/353: Sparse KPCA for feature extraction in speech recognition
Lima, A. / Zen, H. / Nankaku, Y. / Tokuda, K. / Kitamura, T. / Resende, F.G. et al. | 2005
digital version
I/357: Effects of phoneme characteristics on TEO feature-based automatic stress detection in speech
Ruzanski, E. / Hansen, J.H.L. / Meyerhoff, J. / Saviolakis, G. / Koenig, M. et al. | 2005
digital version
I/361: Scalable concatenative speech synthesis based on the plural unit selection and fusion method
Tamura, M. / Mizutani, T. / Kagoshima, T. et al. | 2005
digital version
I/365: Adaptive training for hidden semi-Markov model [speech synthesis applications]
Yamagishi, J. / Kobayashi, T. et al. | 2005
digital version
I/369: Perceptually weighted long term modeling of sinusoidal speech amplitude trajectories
Firouzmand, M.Z. / Girin, L. et al. | 2005
digital version
I/373: Speech recognition in the blind condition based on multiple directivity patterns using a microphone array
Sekiya, T. / Kobayashi, T. et al. | 2005
digital version
I/377: An unsupervised quantitative measure for word prominence in spontaneous speech
Dagen Wang, / Narayanan, S. et al. | 2005
digital version
I/381: Speech modelling based on generalized Gaussian probability density functions
Kokkinakis, K. / Nandi, A.K. et al. | 2005
digital version
I/385: Bayesian model based non-intrusive speech quality evaluation
Guo Chen, / Parsa, V. et al. | 2005
digital version
I/389: Robust pitch estimation at very low SNR exploiting time and frequency domain cues
Shahnaz, C. / Zhu, W.-P. / Ahmad, M.O. et al. | 2005
digital version
I/393: Fundamental frequency estimation and vocal tremor analysis by means of Morlet wavelet transforms
Cnockaert, L. / Grenez, F. / Schoentgen, J. et al. | 2005
digital version
I/397: Automatic speech segmentation using average level crossing rate information
Sarkar, A. / Sreenivas, T.V. et al. | 2005
digital version
I/401: DWT-based phonetic groups classification using neural networks
Pham, T.V. / Kubin, G. et al. | 2005
digital version
I/405: A novel KLT algorithm optimized for small signal sets [speech processing applications]
Gianfelici, F. / Biagetti, G. / Crippa, P. / Turchetti, C. et al. | 2005
digital version
I/409: Voicing-state classification of co-channel speech using nonlinear state-space reconstruction
Mahgoub, Y.A. / Dansereau, R.M. et al. | 2005
digital version
I/413: Speech rate estimation via temporal correlation and selected sub-band correlation
Narayanan, S. / Dagen Wang, et al. | 2005
digital version
I/417: Closely coupled array processing and model-based compensation for microphone array speech recognition
Xianyu Zhao, / Zhijian Ou, / Minhua Chen, / Zuoying Wang, et al. | 2005
digital version
I/421: Context dependent duration modeling [speech recognition applications]
Willett, D. et al. | 2005
digital version
I/425: Recognising speech in the presence of a competing speaker using a 'speech fragment decoder'
Coy, A. / Barker, J. et al. | 2005
digital version
I/429: An environment compensated maximum likelihood training approach based on stochastic vector mapping [speech recognition applications]
Jian Wu, / Qiang Huo, / Donglai Zhu, et al. | 2005
digital version
I/433: Effect of phase-sensitive environment model and higher order VTS on noisy speech feature enhancement [speech recognition applications]
Stouten, V. / Van Hamme, H. / Wambacq, P. et al. | 2005
digital version
I/437: Towards speech recognition oriented dereverberation
Jinachitra, P. / Prieto, R.E. et al. | 2005
digital version
I/441: Noisy speech recognition based on robust end-point detection and model adaptation
Zhipeng Zhang, / Furui, S. et al. | 2005
digital version
I/445: Analysis of a large in-car speech corpus and its application to the multimodel ASR
Fujimua, H. / Miyajima, C. / Itou, K. / Takeda, K. / Itakura, F. et al. | 2005
digital version
I/449: Building an effective corpus by using acoustic space visualization (COSMOS) method [speech recognition applications]
Nagino, G. / Shozakai, M. et al. | 2005
digital version
I/453: HMM/ANN based spectral peak location estimation for noise robust speech recognition
Ikbal, S. / Bourlard, H. / Magimai-Doss, M. et al. | 2005
digital version
I/457: Acoustic feature combination for robust speech recognition
Zolnay, A. / Schluter, R. / Ney, H. et al. | 2005
digital version
I/461: Acoustic training from heterogeneous data sources: experiments in Mandarin conversational telephone speech transcription
Tsakalidis, S. / Byrne, W. et al. | 2005
digital version
I/465: Dynamic match phone-lattice searches for very fast and accurate unrestricted vocabulary keyword spotting
Thambiratnam, K. / Sridharan, S. et al. | 2005
digital version
I/469: A stream-weight optimization method for multi-stream HMMs based on likelihood value normalization
Tamura, S. / Iwano, K. / Furui, S. et al. | 2005
digital version
I/473: Lip reading for robust speech recognition on embedded devices
Perez, J.F.G. / Frangi, A.F. / Solano, E.L. / Lukas, K. et al. | 2005
digital version
I/477: Novel techniques for time-compressing speech: an exploratory study
Tucker, S. / Whittaker, S. et al. | 2005
digital version
I/481: Fast two-stage vocabulary independent search in spontaneous speech
Peng Yu, / Seide, F. et al. | 2005
digital version
I/485: An HMM-based text segmentation method using variational Bayes approach and its application to LVCSR for broadcast news
Koshinaka, T. / Iso, K. / Okumura, A. et al. | 2005
digital version
I/489: Detecting group interest-level in meetings
Gatica-Perez, D. / McCowan, L. / Dong Zhang, / Bengio, S. et al. | 2005
digital version
I/493: Semantic data mining of short utterances
Begeja, L. / Drucker, H. / Gibbon, D. / Haffner, P. / Zhu Liu, / Renger, B. / Shahraray, B. et al. | 2005
digital version
I/497: Automatic processing of audio lectures for information retrieval: vocabulary selection and language modeling
Park, A. / Hazen, T.J. / Glass, J.R. et al. | 2005
digital version
I/501: Blind change detection for audio segmentation
Omar, M.K. / Chaudhari, U. / Ramaswamy, G. et al. | 2005
digital version
I/505: Combining multiple subword representations for open-vocabulary spoken document retrieval
Shi-Wook Lee, / Tanaka, K. / Itoh, Y. et al. | 2005
digital version
I/509: Robust lip-motion features for speaker identification
Cetingul, H.E. / Yemez, Y. / Erzin, E. / Tekalp, A.M. et al. | 2005
digital version
I/513: Variational Bayesian feature saliency for audio type classification
Valente, F. / Wellekens, C. et al. | 2005
digital version
I/517: Pitch-synchronous ZCPA (PS-ZCPA)-based feature extraction with auditory masking
Ghulam, M. / Fukuda, T. / Horikawa, J. / Nitta, T. et al. | 2005
digital version
I/521: MFCC compensation for improved recognition of filtered and bandlimited speech
Morales, N. / Hansen, J.H.L. / Toledano, D.T. et al. | 2005
digital version
I/525: Speech feature smoothing for robust ASR
Chia-Ping Chen, / Bilmes, J. / Ellis, D.P.W. et al. | 2005
digital version
I/529: On desensitizing the Mel-cepstrum to spurious spectral components for robust speech recognition
Tyagi, V. / Wellekens, C. et al. | 2005
digital version
I/533: Two-stage noise spectra estimation and regression based in-car speech recognition using single distant microphone
Weifeng Li, / Itou, K. / Takeda, K. / Itakura, F. et al. | 2005
digital version
I/537: Mask estimation based on sound localisation for missing data speech recognition
Harding, S. / Barker, J. / Brown, G.J. et al. | 2005
digital version
I/541: Speech processing using joint features derived from the modified group delay function
Hegde, R.M. / Murthy, H.A. / Rao, G.V.R. et al. | 2005
digital version
I/545: Influence of autocorrelation lag ranges on robust speech recognition
Shannon, B.J. / Paliwal, K.K. et al. | 2005
digital version
I/549: Subspace-based speaker-independent vowel recognition
Muralishankar, R. / O'Shaughnessy, D. et al. | 2005
digital version
I/553: Robust speech recognition based on spectral adjusting and warping
Rui Zhao, / Zuoying Wang, et al. | 2005
digital version
I/557: Robust speech activity detection using LDA applied to FF parameters
Padrell, J. / Macho, D. / Nadeu, C. et al. | 2005
digital version
I/561: Joint discriminative language modeling and utterance classification
Saraclar, M. / Roark, B. et al. | 2005
digital version
I/565: Language model estimation for optimizing end-to-end performance of a natural language call routing system
Goel, V. / Kuo, H.-K.J. / Deligne, S. / Cheng Wu, et al. | 2005
digital version
I/569: Language identification using phonetic and prosodic HMMs with feature normalization
Obuchi, Y. / Sato, N. et al. | 2005
digital version
I/573: Rapid language model development using external resources for new spoken dialog domains
Sarikaya, R. / Gravano, A. / Yuqing Gao, et al. | 2005
digital version
I/577: Using local & global phonotactic features in Chinese dialect identification
Boon Pang Lim, / Haizhou Li, / Bin Ma, et al. | 2005
digital version
I/581: Random clusterings for language modeling
Emami, A. / Jelinek, F. et al. | 2005
digital version
I/585: Dialect/accent classification via boosted word modeling
Rongqing Huang, / Hansen, J.H.L. et al. | 2005
digital version
I/589: Web-data augmented language models for Mandarin conversational speech recognition
Ng, T. / Ostendorf, M. / Mei-Yuh Hwang, / Manhung Siu, / Bulyko, I. / Xin Lei, et al. | 2005
digital version
I/593: An efficient algorithm for clustering short spoken utterances
Zhu Liu, et al. | 2005
digital version
I/597: Maximum entropy based generic filter for language model adaptation
Dong Yu, / Mahajan, M. / Mau, P. / Acero, A. et al. | 2005
digital version
I/601: Language identification using pitch contour information
Chi-Yueh Lin, / Hsiao-Chuan Wang, et al. | 2005
digital version
I/605: Integrating multiple layers of concept information into n-gram modeling for spoken language understanding
Wang, N.J.C. et al. | 2005
digital version
I/609: Automatic language identification using ergodic-HMM
Santosh Kumar, S.A. / Ramasubramanian, V. et al. | 2005
digital version
I/613: Discriminative power of transient frames in speaker recognition
Louradour, J. / Daoudi, K. / Andre-Obrecht, R. et al. | 2005
digital version
I/617: Speaker identification in unknown noisy conditions - a universal compensation approach
Ji Ming, / Stewart, D. / Vaseghi, S. et al. | 2005
digital version
I/621: Extracting additional information from Gaussian mixture model probabilities for improved text independent speaker identification
Narayanaswamy, B. / Gangadharaiah, R. et al. | 2005
digital version
I/625: Combining selection tree with observation reordering pruning for efficient speaker identification using GMM-UBM
Zhenyu Xiong, / Zheng, T.F. / Zhanjiang Song, / Wenhu Wu, et al. | 2005
digital version
I/629: Advances in channel compensation for SVM speaker recognition
Solomonoff, A. / Campbell, W.M. / Boardman, I. et al. | 2005
digital version
I/633: Improved speaker model migration via stochastic synthesis [speaker recognition applications]
Navratil, J. / Ramaswamy, G.N. et al. | 2005
digital version
I/637: Factor analysis simplified [speaker verification applications]
Kenny, P. / Boulianne, G. / Ouellet, P. / Dumouchel, P. et al. | 2005
digital version
I/641: Minimum classification error interactive training for speaker identification [interactive robot applications]
Kida, Y. / Yamamoto, H. / Miyajima, C. / Tokuda, K. / Kitamura, T. et al. | 2005
digital version
I/645: A new common component GMM-based speaker recognition method
Yih-Ru Wang, / Chen-Yu Chiang, et al. | 2005
digital version
I/649: GMM-based Bhattacharyya kernel Fisher discriminant analysis for speaker recognition
Yi-Hsiang Chao, / Hsin-Min Wang, / Ruei-Chuan Chang, et al. | 2005
digital version
I/653: A study of the relative importance of temporal characteristics in text dependent and text constrained speaker verification
Nealand, J.H. / Pelecanos, J.W. / Zilca, R.D. / Ramaswamy, G.N. et al. | 2005
digital version
I/657: Noise robust speaker verification using mel-frequency discrete wavelet coefficients and parallel model compensation
Tufekci, Z. / Gurbuz, S. et al. | 2005
digital version
I/661: Initializing subspace constrained Gaussian mixture models
Olsen, P.A. / Visweswariah, K. / Gopinath, R. et al. | 2005
digital version
I/665: Multi-rate and variable-rate modeling of speech at phone and syllable time scales [speech recognition applications]
Cetin, O. / Ostendorf, M. et al. | 2005
digital version
I/669: Optimal clustering and non-uniform allocation of Gaussian kernels in scalar dimension for HMM compression [speech recognition applications]
Xiao-Bing Li, / Soong, F.K. / Myrvoll, T.A. / Ren-Hua Wang, et al. | 2005
digital version
I/673: Hierarchical correlation compensation for hidden Markov models [speech recognition applications]
Hui Lin, / Ye Tian, / Jian-Lai Zhou, / Hui Jiang, et al. | 2005
digital version
I/677: Cluster-dependent acoustic modeling [speech recognition applications]
Bing Xiang, / Long Nguyen, / Matsoukas, S. / Schwartz, R. et al. | 2005
digital version
I/681: Fuzzy parameter clustering method in speech recognition
Xianghua Xu, / Jie Zhu, et al. | 2005
digital version
I/685: Automatic training set segmentation for multi-pass speech recognition
Mao, M.Z. / Vanhoucke, V. / Strope, B. et al. | 2005
digital version
I/689: Generalized statistical modeling of pronunciation variations using variable-length phone context
Akita, Y. / Kawahara, T. et al. | 2005
digital version
I/693: On initialization of Gaussian mixtures: a hybrid genetic EM algorithm
Pernkopf, F. et al. | 2005
digital version
I/697: Acoustic model training using greedy EM
Rusheng Hu, / Xiaolong Li, / Yunxin Zhao, et al. | 2005
digital version
I/701: Modeling successive frame dependencies with hybrid HMM/BN acoustic model
Markov, K. / Nakamura, S. et al. | 2005
digital version
I/705: Improved covariance modeling for maximum likelihood multiple subspace transformations [speech recognition applications]
Xi Zhou, / Ye Tian, / Jian-lai Zhou, / Bei-qian Dai, et al. | 2005
digital version
I/709: A probabilistic measure of modality reliability in speaker verification
Richiardi, J. / Prodanov, P. / Drygajlo, A. et al. | 2005
digital version
I/713: A correlation metric for speaker tracking using anchor models
Collet, M. / Charlet, D. / Bimbot, F. et al. | 2005
digital version
I/717: Estimating and evaluating confidence for forensic speaker recognition
Campbell, W.M. / Reynolds, D.A. / Campbell, J.P. / Brady, K.J. et al. | 2005
digital version
I/721: F-ratio client dependent normalisation for biometric authentication tasks
Poh, N. / Bengio, S. et al. | 2005
digital version
I/725: Clustering speech utterances by speaker using Eigenvoice-motivated vector space models
Wei-Ho Tsai, / Shih-Sian Cheng, / Yi-Hsiang Chao, / Hsin-Min Wang, et al. | 2005
digital version
I/729: T-Norm for text-dependent commercial speaker verification applications: effect of lexical mismatch
Hebert, M. / Boies, D. et al. | 2005
digital version
I/733: A session-GMM generative model using test utterance Gaussian mixture modeling for speaker verification
Aronowitz, H. / Burshtein, D. / Amir, A. et al. | 2005
digital version
I/737: ALIZE, a free toolkit for speaker recognition
Bonastre, J.-F. / Wils, F. / Meignier, S. et al. | 2005
digital version
I/741: Speaker adaptive cohort selection for Tnorm in text-independent speaker verification
Sturim, D.E. / Reynolds, D.A. et al. | 2005
digital version
I/745: Hybrid speaker-based segmentation system using model-level clustering
Hyoung-Gook Kim, / Ertelt, D. / Sikora, T. et al. | 2005
digital version
I/749: Robustness of bit-stream based features for speaker verification
Moreno-Daniel, A. / Juang, B.H. / Nolazco-Flores, J.A. et al. | 2005
digital version
I/753: Two-way cluster voting to improve speaker diarisation performance
Tranter, S.E. et al. | 2005
digital version
I/757: Speaker detection without models
Gillick, D. / Stafford, S. / Peskin, B. et al. | 2005
digital version
I/761: Improving the 2.4 kb/s military standard-MELP (MS-MELP) coder using pitch-synchronous analysis and synthesis techniques [speech coding]
Ertan, A.E. / Barnwell, T.P. et al. | 2005
digital version
I/765: Ultra low bit rate speech coding using an ergodic hidden Markov model
Lee, M.E. / Durey, A.S. / Moore, E. / Clements, M. et al. | 2005
digital version
I/769: Towards iLBC speech coding at lower rates through a new formulation of the start state search
Garrido, C.M. / Murthi, M.N. / Andersen, S.Y. et al. | 2005
digital version
I/773: A missing-data approach to noise-robust LPC extraction for voiced speech using auxiliary sensors
Demiroglu, C. / Barnwell, T. et al. | 2005
digital version
I/777: A technique of multi-tap long term predictor (LTP) filter using sub-sample resolution delay [speech coding applications]
Jasiuk, M.A. / Ramabadran, T. / Mittal, U. / Ashley, J.P. / McLaughlin, M.J. et al. | 2005
digital version
I/781: Voice activity detection based on generalized gamma distribution
Jong Won Shin, / Joon-Hyuk Chang, / Hwan Sik Yun, / Nam Soo Kim, et al. | 2005
digital version
I/785: Increasing the robustness of CELP-based coders by constrained optimization
Chibani, M. / Gournay, P. / Lefebvre, R. et al. | 2005
digital version
I/789: Joint optimization of excitation parameters in analysis-by-synthesis speech coders having multi-tap long term predictor
Mittal, U. / Ashley, J.P. / Cruz-Zeno, E.M. / Jasiuk, M.A. et al. | 2005
digital version
I/793: Block-based bandwidth extension of narrowband speech signal by using CDHMM
Sheng Yao, / Cheung-Fat Chan, et al. | 2005
digital version
I/797: Segmentation-based speech enhancement for intelligibility improvement in MELP coders using auxiliary sensors
Demiroglu, C. / Kamath, S.D. / Anderson, D.V. et al. | 2005
digital version

How to get this title?

Check access

LUH Campus collection

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Quicklinks

Borrowing & Ordering

Quicklinks

Search & discover

Quicklinks

Learning & working

Quicklinks

Publishing & Archiving

Quicklinks

About the TIB

Quicklinks

Research & Development

Combining selection tree with observation reordering pruning for efficient speaker identification using GMM-UBM (English)

How to get this title?

Export, share and cite

More details on this result

Table of contents

Table of contents conference proceedings

Similar titles

How to get this title?

Export, share and cite