SP-L2.2: PARAMETER SHARING AND MINIMUM CLASSIFICATION ERROR TRAINING OF MIXTURES OF FACTOR ANALYZERS FOR SPEAKER IDENTIFICATION (Englisch)

Yamamoto, H. / Nankaku, Y. / Miyajima, C. / Tokuda, K. / Kitamura, T. / IEEE Signal Processing Society

In: ICASSP; 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing ; I - 29-32 ; 2004

ISBN:

0780384849

ISSN:

1520-6149

Aufsatz (Konferenz) / Print

Wie erhalte ich diesen Titel?

TIB vor Ort

Nachweis Campus LUH

TIB-Dokumentlieferung Kostenpflichtig bestellen

Preisinformation

Exportieren, teilen und zitieren

Titel:

SP-L2.2: PARAMETER SHARING AND MINIMUM CLASSIFICATION ERROR TRAINING OF MIXTURES OF FACTOR ANALYZERS FOR SPEAKER IDENTIFICATION
Beteiligte:

Yamamoto, H. ( Autor:in ) / Nankaku, Y. ( Autor:in ) / Miyajima, C. ( Autor:in ) / Tokuda, K. ( Autor:in ) / Kitamura, T. ( Autor:in ) / IEEE Signal Processing Society
Kongress:

29th, ICASSP; 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing ; 2004 ; Montreal, Quebec
Erschienen in:

ICASSP; 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing ; I - 29-32

IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING ; 1 ; I - 29-32
Verlag:

IEEE

Erscheinungsort:

Piscataway, N.J.
Erscheinungsdatum:

01.01.2004
Format / Umfang:

I - 29-32
Anmerkungen:

Conference number extrapolated. "IEEE Catalog Number: 04CH37568. Conference held in 5 separate issues. Subject of Volume 1 is Speech processing
ISBN:

0780384849
ISSN:

1520-6149
Medientyp:

Aufsatz (Konferenz)
Format:

Print
Sprache:

Englisch
Schlagwörter:

Speech processing systems , Signal processing systems , Electro-acoustics , Underwater acoustics , Integrated circuits , ICASSP , Acoustics , Multichannel signal processing , Speech processing , Sensor array processing
Datenquelle:

British Library Conference Proceedings

Inhaltsverzeichnis Konferenzband

Die Inhaltsverzeichnisse werden automatisch erzeugt und basieren auf den im Index des TIB-Portals verfügbaren Einzelnachweisen der enthaltenen Beiträge. Die Anzeige der Inhaltsverzeichnisse kann daher unvollständig oder lückenhaft sein.

0_1: 2004 IEEE International Conference on Acoustics, Speech and Signal Processing
| 2004
Elektronische Ausgabe
0_1: 2004 IEEE International Conferrence on Acoustics, Speech and Signal Processing
| 2004
Elektronische Ausgabe
I: Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis
Yamagishi, J. / Tachibana, M. / Masuko, T. / Kobayashi, T. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Soft decoding strategies for distributed speech recognition over IP networks
Cardenal-Lopez, A. / Docio-Fernandez, L. / Garcia-Mateo, C. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
57: A subvector-based error concealment algorithm for speech recognition over mobile networks
Tan, Zheng-Hua / Daisgaard, P. / Lindberg, B. et al. | 2004
Gedruckte Ausgabe
I: A complexity reduction of ETSI advanced front-end for DSR
Jin-Yu Li, / Bo Liu, / Ren-Hua Wang, / Li-Rong Dai, et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Efficient and robust distributed speech recognition (DSR) over wireless fading channels: 2D-DCT compression, iterative bit allocation, short BCH code and interleaving
Wei-hao Hsu, / Lin-shan Lee, et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: A novel method for computation of periodicity, aperiodicity and pitch of speech signals
Deshmukh, O. / Singh, J. / Espy-Wilson, C. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Non-uniform speaker normalization using affine-transformation
Kumar, S.V.B. / Umesh, S. / Sinha, R. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Speech feature extraction method representing periodicity and aperiodicity in sub bands for robust speech recognition
Ishizuka, K. / Miyazaki, N. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
169: Performance analysis for a class of robust adaptive beamformers
Besson, O. / Vincent, F. et al. | 2004
Gedruckte Ausgabe
189: Spatial filtering of RF interference in radio astronomy using a reference antenna
Veen, A.J. van der / Boonstra, A.J. et al. | 2004
Gedruckte Ausgabe
I: Higher order cepstral moment normalization (HOCMN) for robust speech recognition
Chang-wen Hsu, / Lin-shan Lee, et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
229: Speech enhancement based on a combined multi-channel array with constrained iterative and auditory masked processing
Zhang, Xianxian / Hansen, J.H.L. / Rehar, K.A. et al. | 2004
Gedruckte Ausgabe
237: An improved array interpolation approach to DOA estimation in correlated signal environments
Lau, B.K. / Cook, G.J. / Leung, Y.H. et al. | 2004
Gedruckte Ausgabe
I: Meta-data conditional language modeling
Bacchiani, M. / Roark, B. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
249: Direct position determination of narrowband radio transmitters
Weiss, A.J. et al. | 2004
Gedruckte Ausgabe
I: Cross-lingual latent semantic analysis for language modeling
Woosung Kim, / Khudanpur, S. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
293: A Kalman filter based registration approach for asynchronous sensors in multiple sensor fusion applications
Zhou, Yifeng et al. | 2004
Gedruckte Ausgabe
329: A single-carrier/OFDM comparison for broadband wireless communication
Van der Perre, L. / Tubbax, J. / Horlin, F. / De Man, H. et al. | 2004
Gedruckte Ausgabe
I: Speaker indexing and adaptation using speaker clustering based on statistical model selection
Nishida, M. / Kawahara, T. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
361: Geolocation by time difference of arrival using hyperbolic asymptotes
Drake, S.R. / Dogancay, K. et al. | 2004
Gedruckte Ausgabe
393: Design of complex allpass filters
Fernandez-Vazquez, A. / Jovanovic-Dolecek, G. et al. | 2004
Gedruckte Ausgabe
397: Multiplier-free band-selectable digital filters
Santraine, A. / Leprince, S. / Taylor, F. et al. | 2004
Gedruckte Ausgabe
I: Public speech-oriented guidance system with adult and child discrimination capability
Nisimura, R. / Lee, A. / Saruwatari, H. / Shikano, K. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Improving phoneme recognition of telephone quality speech
Qiang Huang, / Cox, S. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
449: A stochastic model for the affine projection algorithm operating in a nonstationary environment
Almeida, S.J.M. de / Bermudez, J.C.M. / Bershad, N.J. et al. | 2004
Gedruckte Ausgabe
457: A statistical analysis of the multi-split LMS algorithm
Resende, L.S. / Rocha, C.A.F. / Bermudez, J.C.M. / Bellanger, M.G. et al. | 2004
Gedruckte Ausgabe
461: Sufficient condition for tap-length gradient adaption of LMS algorithm
Gu, Yuantao / Tang, Kun / Cui, Huijuan et al. | 2004
Gedruckte Ausgabe
469: A modified constant-Q transform for audio signals
Santos, C.N. dos / Netto, S.L. / Biscainho, L.W.R. / Graziosi, D.B. et al. | 2004
Gedruckte Ausgabe
501: Weighted low rank approximation and reduced rank linear regression
Werner, K. / Jansson, M. et al. | 2004
Gedruckte Ausgabe
505: Wavelet packets-based direction-of-arrival estimation
Xue, Yanbo / Wang, Jinkuan / Liu, Zhigang et al. | 2004
Gedruckte Ausgabe
I: An automatic prosody labeling system using ANN-based syntactic-prosodic model and GMM-based acoustic-prosodic model
Ken Chen, / Hasegawa-Johnson, M. / Cohen, A. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
521: A new signal model and identification algorithm for hidden semi-Markov signals
Azimi, M. / Nasiopoulos, P. / Ward, R.K. et al. | 2004
Gedruckte Ausgabe
561: Polyphase analysis of aliasing effects in enlargements
Seidner, D. et al. | 2004
Gedruckte Ausgabe
569: Can timing jitter improve random process reconstruction in presence of aliasing?
Lacaze, B. / Mailhes, C. et al. | 2004
Gedruckte Ausgabe
I: Importance of window shape for phase-only reconstruction of speech
Alsteris, L.D. / Paliwal, K.K. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
581: Frequency analysis using non-uniform sampling with application to active queue management
Gunnarsson, F. / Gustafsson, F. et al. | 2004
Gedruckte Ausgabe
I: Automatic emotional speech classification
Ververidis, D. / Kotropoulos, C. / Pitas, I. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
597: Parametric smoothing of spline interpolation
Ibanez, J. / Santamaria, I. / Pantaleon, C. / Vielva, L. et al. | 2004
Gedruckte Ausgabe
629: Diffusion equations for adaptive affine distributions
Gosme, J. / Richard, C. / Goncalves, P. et al. | 2004
Gedruckte Ausgabe
633: Comparative study of three time-frequency representations with applications to a novel correlation method
Sejdic, E. / Jiang, J. et al. | 2004
Gedruckte Ausgabe
637: A bootstrap scheme for time-frequency auto-term selection in antenna arrays
Cirillo, L.A. / Zoubir, A.M. et al. | 2004
Gedruckte Ausgabe
649: Pole optimisation in adaptive Laguerre filtering
den Brinker, A.C. / Sarroukh, B.E. et al. | 2004
Gedruckte Ausgabe
665: On adaptive interpolated FIR filters
Bilcu, R.C. / Kuosmanen, P. / Egiazarian, K. et al. | 2004
Gedruckte Ausgabe
673: A recursive least squares algorithm robust to low-power excitation
Ludovico, C.S. / Bermudez, J.C.M. et al. | 2004
Gedruckte Ausgabe
709: Kalman filtering in stochastic gradient algorithms: construction of a stopping rule
Bittner, B. / Pronzato, L. et al. | 2004
Gedruckte Ausgabe
713: Combining equalization and estimation for bandwidth extension of narrowband speech
Qian, Yasheng / Kabal, P. et al. | 2004
Gedruckte Ausgabe
753: Novel approach to AM-FM decomposition with applications to speech and music analysis
Sekhar, S.C. / Sreenivas, T.V. et al. | 2004
Gedruckte Ausgabe
757: Time-frequency-moving-average processes: principles and cepstral methods for parameter estimation
Jachan, M. / Matz, G. / Hlawatsch, F. et al. | 2004
Gedruckte Ausgabe
825: Studies in massively speaker-specific speech recognition
Shi, Yu / Chang, Eric et al. | 2004
Gedruckte Ausgabe
I: Codebook design for ASR systems using custom arithmetic units
Xiao Li, / Malkin, J. / Bilmes, J. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Parameter sharing in subband likelihood-maximizing beamforming for speech recognition using microphone arrays
Seltzer, M.L. / Stern, R.M. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
I: Extended cluster information vector quantization (ECI-VQ) for robust classification
Arrowood, J.A. / Clements, M.A. et al. | 2004
Elektronische Ausgabe Gedruckte Ausgabe
933: Notions of strong ergodicity for stochastic analysis of multirate systems
Marelli, D. / Fu, Minyue et al. | 2004
Gedruckte Ausgabe
945: An extended sure approach for multicomponent image denoising
Benazza-Benyahia, A. / Pesquet, J.C. et al. | 2004
Gedruckte Ausgabe
1009: Blind deconvolution using Bayesian methods with application to the dereverberation of speech
Daly, M.J. / Reilly, J.R. et al. | 2004
Gedruckte Ausgabe
1033: Automatic recognition of Bluetooth speech in 802.11 interference and the effectiveness of insertion-based compensation techniques
Nour-Eldin, A.H. / Tolba, H. / O'Shaughnessy, D. et al. | 2004
Gedruckte Ausgabe
1037: SP-P16.12: SENSITIVITY ANALYSIS OF NOISE ROBUSTNESS METHODS
Brayda, L. / Rigazio, L. / Boman, R. / Junqua, J.-C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
1041: Fast MCMC computations for the estimation of sparse processes from noisy observations
Davy, M. / Idier, J. et al. | 2004
Gedruckte Ausgabe
1041: Author index
| 2004
Elektronische Ausgabe
1053: An approach based on influence function to evaluate robustness and detection performance of CFAR detectors
Meng, Huadong / Wang, Xiqin / Zhang, Hao / Peng, Yingning et al. | 2004
Gedruckte Ausgabe
1069: Detection performance for discrete test statistics. Application to low-flux imagery
Ferrari, A. / Tourneret, J.Y. et al. | 2004
Gedruckte Ausgabe
1097: Signal detection and estimation using atomic decomposition and information-theoretic criteria
Lopez-Risueno, G. / Grajal, J. / Yeste-Ojeda, O.A. et al. | 2004
Gedruckte Ausgabe
I: SP-L5.1: PITCH PREDICTION FROM MFCC VECTORS FOR SPEECH RECONSTRUCTION
Shao, X. / Milner, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L5.4: EXTRACTION OF PITCH IN ADVERSE CONDITIONS
Mahadeva Prasanna, S. R. / Yegnanarayana, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L9.2: HIGHER ORDER CEPSTRAL MOMENT NORMALIZATION (HOCMN) FOR ROBUST SPEECH RECOGNITION
Hsu, C.-w. / Lee, L.-s. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.9: EMPLOYING LAPLACIAN-GAUSSIAN DENSITIES FOR SPEECH ENHANCEMENT
Gazor, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.10: ROBUST ADAPTIVE KALMAN FILTERING-BASED SPEECH ENHANCEMENT ALGORITHM
Gabrea, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.10: EIGEN-MLLRS APPLIED TO UNSUPERVISED SPEAKER ENROLLMENT FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION
Aubert, X. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.7: EFFICIENT SPECTRUM CODING FOR SUPER-WIDEBAND SPEECH AND ITS APPLICATION TO 7/10/15 KHZ BANDWIDTH SCALABLE CODERS
Oshikiri, M. / Ehara, H. / Yoshida, K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.7: FRACTIONAL FOURIER TRANSFORM FEATURES FOR SPEECH RECOGNITION
Sarikaya, R. / Gao, Y. / Saon, G. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.1: MINIMUM SEGMENTATION ERROR BASED DISCRIMINATIVE TRAINING FOR SPEECH SYNTHESIS APPLICATION
Wu, Y.-J. / Kawai, H. / Ni, J. / Wang, R.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.9: EVALUATION OF THE EFFECT OF STRESS ON FORMANTS IN FARSI VOWELS
Gharavian, D. / Ahadi, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.14: SCALING OF WAVEFORM SEGMENTS ALONG THE TIME AXIS FOR CONCATENATIVE SPEECH SYNTHESIS
Nishizawa, N. / Kawai, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.8: CROSS-DIALECTAL ACOUSTIC DATA SHARING FOR ARABIC SPEECH RECOGNITION
Kirchhoff, K. / Vergyri, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.3: SEGMENTAL TONAL MODELING FOR PHONE SET DESIGN IN MANDARIN LVCSR
Huang, C. / Shi, Y. / Zhou, J.-L. / Chu, M. / Wang, T. / Chang, E. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.4: DECISION TREE BASED TONE MODELING FOR CHINESE SPEECH RECOGNITION
Wong, P.-F. / Siu, M.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Non-parallel training for voice conversion by maximum likelihood constrained adaptation
Mouchtaris, A. / Van der Spiegel, J. / Mueller, P. et al. | 2004
Elektronische Ausgabe
I: Parameter sharing and minimum classification error training of mixtures of factor analyzers for speaker identification
Yamamoto, H. / Nankaku, Y. / Miyajima, C. / Tokuda, K. / Kitamura, T. et al. | 2004
Elektronische Ausgabe
I: Generalized locally recurrent probabilistic neural networks for text-independent speaker verification
Ganchev, T. / Fakotakis, N. / Tasoulis, D.K. / Vrahatis, M.N. et al. | 2004
Elektronische Ausgabe
I: Robust speech recognition techniques evaluation for telephony server based in-car applications
Delphin-Poulat, L. et al. | 2004
Elektronische Ausgabe
I: High-level speaker verification with support vector machines
Campbell, W.M. / Campbell, J.R. / Reynolds, D.A. / Jones, D.A. / Leek, T.R. et al. | 2004
Elektronische Ausgabe
I: Weighted autocorrelation-based F0 estimation for distant-talking interaction with a distributed microphone network
Armani, L. / Omologo, M. et al. | 2004
Elektronische Ausgabe
I: Product of power spectrum and group delay function for speech recognition
Donglai Zhu, / Paliwal, K.K. et al. | 2004
Elektronische Ausgabe
I: Low-complexity predictive trellis coded quantization of wideband speech LSF parameters
Yongwon Shin, / Sangwon Kang, / Fischer, T.R. / Changyong Son, / Yongbeom Lee, et al. | 2004
Elektronische Ausgabe
I: Variable-dimension quantization of sinusoidal amplitudes using Gaussian mixture models
Lindblom, J. / Hedelin, P. et al. | 2004
Elektronische Ausgabe
I: Robust speech recognition using cepstral domain missing data techniques and noisy masks
Van Hamme, H. et al. | 2004
Elektronische Ausgabe
I: Noise suppression for automotive applications based on directional information
Fuchs, M. / Haulick, T. / Schmidt, G. et al. | 2004
Elektronische Ausgabe
I: Vocabulary-independent search in spontaneous speech
Seide, F. / Peng Yu, / Chengyuan Ma, / Chang, E. et al. | 2004
Elektronische Ausgabe
I: Robust adaptive Kalman filtering-based speech enhancement algorithm
Gabrea, M. et al. | 2004
Elektronische Ausgabe
I: Language boundary detection and identification of mixed-language speech based on MAP estimation
Chi-Jiun Shia, / Yu-Hsien Chiu, / Jia-Hsin Hsieh, / Chung-Hsien Wu, et al. | 2004
Elektronische Ausgabe
I: Language identification using parallel syllable-like unit recognition
Nagarajan, T. / Murthy, H.A. et al. | 2004
Elektronische Ausgabe
I: A multi-pass linear fold algorithm for sentence boundary detection using prosodic cues
Dagen Wang, / Narayanan, S.S. et al. | 2004
Elektronische Ausgabe
I: An evaluation of automatic phone segmentation for concatenative speech synthesis
Kawai, H. / Toda, T. et al. | 2004
Elektronische Ausgabe
I: Estimation of short-term predictor parameters for coding and enhancement of noisy speech
Srinivasan, S. / Samuelsson, J. / Kleijn, W.B. et al. | 2004
Elektronische Ausgabe
I: HMM-based frequency bandwidth extension for speech enhancement using line spectral frequencies
Chen, G. / Parsa, V. et al. | 2004
Elektronische Ausgabe
I: Optimizing acoustic models for commercial speech recognition using foreground scores and data weighting
Boies, D. / Strope, B. / Weintraub, M. / Su-Lin Wu, et al. | 2004
Elektronische Ausgabe
I: Hidden spectral peak trajectory model for phone classification
Yiu-Pong LAI, / Man-Hung SIU, et al. | 2004
Elektronische Ausgabe
I: SP-L1.5: VOICE CHARACTERISTICS CONVERSION FOR TTS USING REVERSE VTLN
Eichner, M. / Wolff, M. / Hoffmann, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L3.4: A COMPLEXITY REDUCTION OF ETSI ADVANCED FRONT-END FOR DSR
Li, J.-Y. / Liu, B. / Wang, R.-H. / Dai, L.-R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L4.5: SPEAKER IDENTIFICATION USING SUPRA-SEGMENTAL PITCH PATTERN DYNAMICS
Farahani, F. / Georgiou, P. / Narayanan, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L6.2: PRODUCT OF POWER SPECTRUM AND GROUP DELAY FUNCTION FOR SPEECH RECOGNITION
Zhu, D. / Paliwal, K. K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.4: A LOCALLY, WEIGHTED DISTANCE MEASURE FOR EXAMPLE BASED SPEECH RECOGNITION
De Wachter, M. / Demuynck, K. / Wambacq, P. / Van Compernolle, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L9.6: ROBUST SPEECH RECOGNITION USING CEPSTRAL DOMAIN MISSING DATA TECHNIQUES AND NOISY MASKS
Van hamme, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L9.5: CEPSTRAL GAIN NORMALIZATION FOR NOISE ROBUST SPEECH RECOGNITION
Yoshizawa, S. / Hayasaka, N. / Wada, N. / Miyanaga, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.5: AUTOMATIC LEARNING OF INTERPRETATION STRATEGIES FOR SPOKEN DIALOGUE SYSTEMS
Raymond, C. / Bechet, F. / De Mori, R. / Damnati, G. / Esteve, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.6: UNSUPERVISED AND ACTIVE LEARNING IN AUTOMATIC SPEECH RECOGNITION FOR CALL CLASSIFICATION
Hakkani-Tur, D. / Tur, G. / Rahim, M. / Riccardi, G. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.12: SPEECH-ACTIVATED TEXT RETRIEVAL SYSTEM FOR MULTIMODAL CELLULAR PHONES
Ishikawa, S.-y. / Ikeda, T. / Miki, K. / Adachi, F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.8: ENHANCED STANDARD COMPLIANT DISTRIBUTED SPEECH RECOGNITION (AURORA ENCODER) USING RATE ALLOCATION
Srinivasamurthy, N. / Ortega, A. / Narayanan, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.9: TRAPPING CONVERSATIONAL SPEECH: EXTENDING TRAP/TANDEM APPROACHES TO CONVERSATIONAL TELEPHONE SPEECH RECOGNITION
Morgan, N. / Chen, B. / Zhu, Q. / Stolcke, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.3: AN ESTIMATE OF PHYSICAL SCALE FROM SPEECH
Smith, L. / Nelson, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.2: WATERMARKING OF SPEECH SIGNALS USING THE SINUSOIDAL MODEL AND FREQUENCY MODULATION OF THE PARTIALS
Girin, L. / Marchand, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.5: A LOW-BAND SPECTRUM ENVELOPE MODELING FOR HIGH QUALITY PITCH MODIFICATION
Mochizuki, R. / Kobayashi, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.8: OPTIMIZING SUB-COST FUNCTIONS FOR SEGMENT SELECTION BASED ON PERCEPTUAL EVALUATIONS IN CONCATENATIVE SPEECH SYNTHESIS
Toda, T. / Kawai, H. / Tsuzaki, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.9: SPEECH ENHANCEMENT USING ROBUST WEIGHTING FACTORS FOR CRITICAL-BAND-WAVELET-PACKET TRANSFORM
Lu, C.-T. / Wang, H.-C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.4: CORRECTIVE LANGUAGE MODELING FOR LARGE VOCABULARY ASR WITH THE PERCEPTRON ALGORITHM
Roark, B. / Saraclar, M. / Collins, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.7: A GENERALIZED CONSTRUCTION OF INTEGRATED SPEECH RECOGNITION TRANSDUCERS
Allauzen, C. / Mohri, M. / Riley, M. / Roark, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.3: AUTOMATIC GENERATION OF NON-UNIFORM HMM STRUCTURES BASED ON VARIATIONAL BAYESIAN APPROACH
Jitsuhiro, T. / Nakamura, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.6: INVESTIGATIONS INTO THE RELATIONSHIP BETWEEN MEASURABLE SPEECH QUALITY AND SPEECH RECOGNITION RATE FOR TELEPHONY SPEECH
Sun, H. / Shue, L. / Chen, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.11: FUSION BASED SPEECH SEGMENTATION IN DARPA SPINE2 TASK
Zheng, C. / Yan, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.6: A STUDY ON ROBUST SEGMENTATION AND LOCATION OF TONE NUCLEI IN CHINESE CONTINUOUS SPEECH
Zhang, J. / Hirose, K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.1: ROBUST SPEECH RECOGNITION IN ADDITIVE AND CHANNEL NOISE ENVIRONMENTS USING GMM AND EM ALGORITHM
Fujimoto, M. / Ariki, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.8: COMBINING FEATURE COMPENSATION AND WEIGHTED VITERBI DECODING FOR NOISE ROBUST SPEECH RECOGNITION WITH LIMITED ADAPTATION DATA
Cui, X. / Alwan, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.11: A TREE-STRUCTURED CLUSTERING METHOD INTEGRATING NOISE AND SNR FOR PIECEWISE LINEAR-TRANSFORMATION-BASED NOISE ADAPTATION
Zhang, Z. / Sugimura, T. / Furui, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Discrimination power weighted subword-based speaker verification
Siu-Man Chan, / Man-Hung Siu, et al. | 2004
Elektronische Ausgabe
I: Applying articulatory features to telephone-based speaker verification
Ka-Yee Leung, / Man-Wai Mak, / Sun-Yuan Kung, et al. | 2004
Elektronische Ausgabe
I: Pitch prediction from MFCC vectors for speech reconstruction
Xu Shao, / Milner, B. et al. | 2004
Elektronische Ausgabe
I: Joint decoding for phoneme-grapheme continuous speech recognition
Magimai-Doss, M. / Bengio, S. / Bourlard, H. et al. | 2004
Elektronische Ausgabe
I: Spectral entropy based feature for robust ASR
Misra, H. / Ikbal, S. / Bourlard, H. / Hermansky, H. et al. | 2004
Elektronische Ausgabe
I: A multiple description speech coder based on AMR-WB for mobile ad hoc networks
Dong, H. / Gersho, A. / Gibson, J.D. / Cuperman, V. et al. | 2004
Elektronische Ausgabe
I: A bit-rate/bandwidth scalable speech coder based on ITU-T G.723.1 standard
Sung-Kyo Jung, / Kyung-Tae Kini, / Hong-Goo Kang, et al. | 2004
Elektronische Ausgabe
I: Employing Laplacian-Gaussian densities for speech enhancement
Gazor, S. et al. | 2004
Elektronische Ausgabe
I: Online speaker clustering
Lilt, D. / Kubala, F. et al. | 2004
Elektronische Ausgabe
I: Robust multimodal understanding
Bangalore, S. / Johnston, M. et al. | 2004
Elektronische Ausgabe
I: A distributed framework for enterprise level speech recognition services
Arizmendi, I. / Rose, R.C. et al. | 2004
Elektronische Ausgabe
I: Speech-activated text retrieval system for multimodal cellular phones
Ishikawa, S.Y. / Ikeda, T. / Miki, K. / Adachi, F. / Isotani, R. / Iso, K.I. / Okumura, A. et al. | 2004
Elektronische Ausgabe
I: Enhanced standard compliant distributed speech recognition (Aurora encoder) using rate allocation
Srinivasamurthy, N. / Ortega, A. / Narayanan, S. et al. | 2004
Elektronische Ausgabe
I: Variational Bayesian feature selection for Gaussian mixture models
Valente, F. / Wellekens, C. et al. | 2004
Elektronische Ausgabe
I: Joint frequency domain and reconstructed phase space features for speech recognition
Lindgren, A.C. / T Johnson, M. / Povinelli, R.J. et al. | 2004
Elektronische Ausgabe
I: Refining segmental boundaries for TTS database using fine contextual-dependent boundary models
Luuan Wang, / Yong Zhao, / Min Chu, / Jianlai Zhou, / Zhigang Cao, et al. | 2004
Elektronische Ausgabe
I: Evaluation of the effect of stress on formants in Farsi vowels
Gharavian, D. / Ahadi, S.M. et al. | 2004
Elektronische Ausgabe
I: Improving broadcast news transcription by lightly supervised discriminative training
Chan, H.Y. / Woodland, P. et al. | 2004
Elektronische Ausgabe
I: The 2003 ISL rich transcription system for conversational telephony speech
Soltau, H. / Hua Yu, / Metze, F. / Fugen, C. / Qin Jin, / Szu-Chen Jou, et al. | 2004
Elektronische Ausgabe
I: A tree-structured clustering method integrating noise and SNR for piecewise linear-transformation-based noise adaptation
Zhang, Z. / Sugimura, T. / Furui, S. et al. | 2004
Elektronische Ausgabe
I: Spatio-temporal processing for distant speech recognition
Siow Yong Low, / Togneri, R. / Nordholm, S. et al. | 2004
Elektronische Ausgabe
I: Sensitivity analysis of noise robustness methods
Brayda, L. / Rigazio, L. / Boman, R. / Junqua, J.C. et al. | 2004
Elektronische Ausgabe
I: Can back-ends be more robust than front-ends? Investigation over the Aurora-2 database
Bernard, A. / Yifan Gong, / Xiaodong Cui, et al. | 2004
Elektronische Ausgabe
I: SP-L2.4: DISENTANGLING SPEAKER AND CHANNEL EFFECTS IN SPEAKER VERIFICATION
Kenny, P. / Dumouchel, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L3.2: THE ETSI EXTENDED DISTRIBUTED SPEECH RECOGNITION (DSR) STANDARDS: SERVER-SIDE SPEECH RECONSTRUCTION
Ramabadran, T. / Sorin, A. / McLaughlin, M. / Chazan, D. / Pearce, D. / Hoory, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L5.2: ALGORITHM FOR AUTOMATIC GLOTTAL WAVEFORM ESTIMATION WITHOUT THE RELIANCE ON PRECISE GLOTTAL CLOSURE INFORMATION
Moore, E. / Clements, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.3: VARIABLE-DIMENSION QUANTIZATION OF SINUSOIDAL AMPLITUDES USING GAUSSIAN MIXTURE MODELS
Lindblom, J. / Hedelin, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.6: WAVEFORM QUANTIZATION OF SPEECH USING GAUSSIAN MIXTURE MODELS
Samuelsson, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L9.1: SPECTRAL ENTROPY BASED FEATURE FOR ROBUST ASR
Misra, H. / Ikbal, S. / Bourlard, H. / Hermansky, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.3: A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY
Kovesi, B. / Massaloux, D. / Sollaud, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.6: A BIT-RATE/BANDWIDTH SCALABLE SPEECH CODER BASED ON ITU-T G.723.1 STANDARD
Jung, S.-K. / Kim, K.-T. / Kang, H.-G. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.1: PARAMETERIZATION OF THE SCORE THRESHOLD FOR A TEXT-DEPENDENT ADAPTIVE SPEAKER VERIFICATION SYSTEM
Mirghafori, N. / Hebert, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.4: THE ELISA CONSORTIUM APPROACHES IN BROADCAST NEWS SPEAKER SEGMENTATION DURING THE NIST 2003 RICH TRANSCRIPTION EVALUATION
Moraru, D. / Meignier, S. / Fredouille, C. / Besacier, L. / Bonastre, J.-F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.11: LANGUAGE IDENTIFICATION USING PARALLEL SYLLABLE-LIKE UNIT RECOGNITION
Thangavelu, N. / Murthy, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.4: A DISTRIBUTED FRAMEWORK FOR ENTERPRISE LEVEL SPEECH RECOGNITION SERVICES
Arizmendi, I. / Rose, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.6: A MULTI-PASS LINEAR FOLD ALGORITHM FOR SENTENCE BOUNDARY DETECTION USING PROSODIC CUES
Wang, D. / Narayanan, S. S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.9: YET ANOTHER ACOUSTIC REPRESENTATION OF SPEECH SOUNDS
Minematsu, N. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.10: ESTIMATING VOCAL-TRACT AREA FUNCTIONS FROM VOWEL SOUND SIGNALS OVER CLOSED GLOTTAL PHASES
Deng, H. / Ward, R. K. / Beddoes, M. / Hodgson, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.8: A VOICE ACTIVITY DETECTOR USING THE CHI-SQUARE TEST
Ahmed, B. / Holmes, W. H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.9: ADVANCES IN THE AUTOMATIC TRANSCRIPTION OF LECTURES
Cettolo, M. / Brugnara, F. / Federico, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.9: PHONE DURATION MODELING FOR LVCSR
Povey, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.1: INTEGRATING THUMBNAIL FEATURES FOR SPEECH RECOGNITION USING CONDITIONAL EXPONENTIAL MODELS
Yu, H. / Waibel, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.2: DISCRIMINATIVE FEATURE TRANSFORMATION BY GUIDED DISCRIMINATIVE TRAINING
Hsiao, R. / Mak, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.5: HIDDEN SPECTRAL PEAK TRAJECTORY MODEL FOR PHONE CLASSIFICATION
Lai, Y.-P. / Siu, M.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.12: MINIMUM CLASSIFICATION ERROR TRAINING OF LANDMARK MODELS FOR REAL-TIME CONTINUOUS SPEECH RECOGNITION
McDermott, E. / Hazen, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.6: MULTI-ENVIRONMENT MODELS BASED LINEAR NORMALIZATION FOR SPEECH RECOGNITION IN CAR CONDITIONS
Buera, L. / Lleida, E. / Miguel, A. / Ortega, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.9: CAN BACK-ENDS BE MORE ROBUST THAN FRONT-ENDS? INVESTIGATION OVER THE AURORA-2 DATABASE
Bernard, A. / Gong, Y. / Cui, X. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Algorithm amalgam: morphing waveform based methods, sinusoidal models and STRAIGHT
Kawahara, H. / Banno, H. / Irino, T. / Zolfaghari, P. et al. | 2004
Elektronische Ausgabe
I: Algorithm for automatic glottal waveform estimation without the reliance on precise glottal closure information
Moore, E. / Clements, M. et al. | 2004
Elektronische Ausgabe
I: Waveform quantization of speech using Gaussian mixture models
Samuelsson, J. et al. | 2004
Elektronische Ausgabe
I: Confidence measures in multiple pronunciations modeling for speaker verification
BenZeghiba, M.F. / Bourlard, H. et al. | 2004
Elektronische Ausgabe
I: Entropy-based variable frame rate analysis of speech signals and its application to ASR
You, H. / Zhu, Q. / Alwan, A. et al. | 2004
Elektronische Ausgabe
I: A structured speech model with continuous hidden dynamics and prediction-residual training for tracking vocal tract resonances
Li Deng, / Lee, L.J. / Attias, H. / Acero, A. et al. | 2004
Elektronische Ausgabe
I: An improved correction formula for the estimation of harmonic magnitudes and its application to open quotient estimation
Iseli, M. / Alwan, A. et al. | 2004
Elektronische Ausgabe
I: Advances in unsupervised audio segmentation for the broadcast news and NGSW corpora
Huang, R. / Hansen, J.H.L. et al. | 2004
Elektronische Ausgabe
I: Lightly supervised and data-driven approaches to Mandarin broadcast news transcription
Berlin Chen, / Jen-Wei Kuo, / Wen-Hung Tsai, et al. | 2004
Elektronische Ausgabe
I: Investigations into the relationship between measurable speech quality and speech recognition rate for telephony speech
Hanwu Sun, / Shue, L. / Jianfeng Chen, et al. | 2004
Elektronische Ausgabe
I: A study on robust segmentation and location of tone nuclei in Chinese continuous speech
Jin-Song Zhang, / Keikichi Hirose, et al. | 2004
Elektronische Ausgabe
I: Tone variation modeling for fluent Mandarin tone recognition based on clustering
Wan-Yi Lin, et al. | 2004
Elektronische Ausgabe
I: A modified Ephraim-Malah noise suppression rule for automatic speech recognition
Gemello, R. / Mana, F. / De Mori, R. et al. | 2004
Elektronische Ausgabe
I: SNR-dependent non-uniform spectral compression for noisy speech recognition
Chu, K.K. / Leung, S.H. et al. | 2004
Elektronische Ausgabe
I: Multi-environment models based linear normalization for speech recognition in car conditions
Buera, L. / Lleida, E. / Miguel, A. / Ortega, A. et al. | 2004
Elektronische Ausgabe
I: Minimum Kullback-Leibler distance based multivariate Gaussian feature adaptation for distant-talking speech recognition
Yue Pan, / Waibel, A. et al. | 2004
Elektronische Ausgabe
I: SP-L4.4: APPLYING ARTICULATORY FEATURES TO TELEPHONE-BASED SPEAKER VERIFICATION
Leung, K.-Y. / Mak, M.-W. / Kung, S.-Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.4: ON SPLIT QUANTIZATION OF LSF PARAMETERS
Norden, F. / Eriksson, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.2: COMBINATION OF HIDDEN MARKOV MODELS WITH DYNAMIC TIME WARPING FOR SPEECH RECOGNITION
Axelrod, S. / Maison, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.3: JOINT DECODING FOR PHONEME-GRAPHEME CONTINUOUS SPEECH RECOGNITION
Magimai-Doss, M. / Bengio, S. / Bourlard, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.5: LIGHT SUPERVISION IN ACOUSTIC MODEL TRAINING
Nguyen, L. / Xiang, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L11.2: EXACT TRAINING OF A NEURAL SYNTACTIC LANGUAGE MODEL
Emami, A. / Jelinek, F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.8: ON THE DECISION-DIRECTED ESTIMATION APPROACH OF EPHRAIM AND MALAH
Cohen, I. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.5: FEATURE SPACE GAUSSIANIZATION
Saon, G. / Dharanipragada, S. / Povey, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.12: EIGENSPACE-BASED MLLR WITH SPEAKER ADAPTIVE TRAINING IN LARGE VOCABULARY CONVERSATIONAL SPEECH RECOGNITION
Doumpiotis, V. / Deng, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.4: COMBINED ESTIMATION/CODING OF HIGHBAND SPECTRAL ENVELOPES FOR SPEECH SPECTRUM EXPANSION
Agiomyrgiannakis, Y. / Stylianou, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.5: AUTOMATICALLY DERIVED UNITS FOR SEGMENT VOCODERS
Ramasubramanian, V. / Sreenivas, T. V. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.1: BAYESIAN MODELLING OF THE SPEECH SPECTRUM USING MIXTURE OF GAUSSIANS
Zolfaghari, P. / Watanabe, S. / Nakamura, A. / Katagiri, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.4: FORMANT TRACKING BY MIXTURE STATE PARTICLE FILTER
Zheng, Y. / Hasegawa-Johnson, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.4: REFINING SEGMENTAL BOUNDARIES FOR TTS DATABASE USING FINE CONTEXTUAL-DEPENDENT BOUNDARY MODELS
Wang, L. / Zhao, Y. / Chu, M. / Zhou, J.-L. / Cao, Z. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.13: AN EVALUATION OF AUTOMATIC PHONE SEGMENTATION FOR CONCATENATIVE SPEECH SYNTHESIS
Kawai, H. / Toda, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.1: SPHERICAL HARMONIC ANALYSIS OF EQUALIZATION IN A REVERBERANT ROOM
Betlehem, T. / Abhayapala, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.4: AUTOMATED LIP-READING FOR IMPROVED SPEECH INTELLIGIBILITY
McClain, M. / Brady, K. / Brandstein, M. / Quatieri, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.14: IMPROVED NAME RECOGNITION WITH META-DATA DEPENDENT NAME NETWORKS
Maskey, S. / Bacchiani, M. / Roark, B. / Sproat, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.11: LIGHTLY SUPERVISED AND DATA-DRIVEN APPROACHES TO MANDARIN BROADCAST NEWS TRANSCRIPTION
Chen, B. / Kuo, J.-W. / Tsai, W.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.8: VOICING FEATURE INTEGRATION IN SRI'S DECIPHER LVCSR SYSTEM
Graciarena, M. / Franco, H. / Zheng, J. / Vergyri, D. / Stolcke, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.11: TONE VARIATION MODELING FOR FLUENT MANDARIN TONE RECOGNITION BASED ON CLUSTERING
Lin, W.-Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.9: PARSING SPEECH INTO ARTICULATORY EVENTS
Hacioglu, K. / Pellom, B. / Ward, W. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.2: ASSESSMENT OF SIGNAL SUBSPACE BASED SPEECH ENHANCEMENT FOR NOISE ROBUST SPEECH RECOGNITION
Hermus, K. / Wambacq, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.7: MODELING SUB-BAND CORRELATION FOR NOISE-ROBUST SPEECH RECOGNITION
McAuley, J. / Ming, J. / Hanna, P. / Stewart, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.4: BAYESIAN DURATION MODELING AND LEARNING FOR SPEECH RECOGNITION
Chien, J.-T. / Huang, C.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: High quality voice morphing
Hui Ye, / Young, S. et al. | 2004
Elektronische Ausgabe
I: Voice characteristics conversion for TTS using reverse VTLN
Eichner, M. / Wolff, M. / Hoffmann, R. et al. | 2004
Elektronische Ausgabe
I: Discovering relations among discriminative training objectives [speak recognition applications]
Qi Li, et al. | 2004
Elektronische Ausgabe
I: Disentangling speaker and channel effects in speaker verification
Kenny, P. / Dumouchel, P. et al. | 2004
Elektronische Ausgabe
I: The ETSI extended distributed speech recognition (DSR) standards: server-side speech reconstruction
Ramabadran, T. / Sorin, A. / McLaughlin, M. / Chazan, D. / Pearce, D. / Hoory, R. et al. | 2004
Elektronische Ausgabe
I: Using Haar transformed vocal source information for automatic speaker recognition
Nengheng Zheng, / Ching, P.C. et al. | 2004
Elektronische Ausgabe
I: Multiple frame block quantisation of line spectral frequencies using Gaussian mixture models
Paliwal, K.K. / So, S. et al. | 2004
Elektronische Ausgabe
I: On split quantization of LSF parameters
Nordin, F. / Eriksson, T. et al. | 2004
Elektronische Ausgabe
I: On the decision-directed estimation approach of Ephraim and Malah
Cohen, I. et al. | 2004
Elektronische Ausgabe
I: Adaptive time-segmentation for speech coding with limited delay
Rodbro, C.A. / Jensen, J. / Heusdens, R. et al. | 2004
Elektronische Ausgabe
I: Closed-form estimation of the amplitude commands in the automatic extraction of the Fujisaki's model
Silva, S.D.S. / Netto, S.L. et al. | 2004
Elektronische Ausgabe
I: A real-time Cantonese text-to-audiovisual speech synthesizer
Jian-Qing Wang, / Ka-Ho Wong, / Pheng-Ann Pheng, / Meng, H.M. / Tien-Tsin Wong, et al. | 2004
Elektronische Ausgabe
I: Modeling pronunciation variation for spontaneous speech synthesis
Werner, S. / Wolff, M. / Eichner, M. / Hoffinann, R. et al. | 2004
Elektronische Ausgabe
I: Basis superposition precision matrix modelling for large vocabulary continuous speech recognition
Sim, K.C. / Gales, M.J.F. et al. | 2004
Elektronische Ausgabe
I: Voicing feature integration in SRI's decipher LVCSR system
Graciarena, M. / Franco, H. / Jing Zheng, / Vergyri, D. / Stolcke, A. et al. | 2004
Elektronische Ausgabe
I: Chinese-English bilingual phone modeling for cross-language speech recognition
Shengmin Yu, / Shitwu Zhang, / Bo Xu, et al. | 2004
Elektronische Ausgabe
I: Prosody-based recognition of spoken German varieties
Dizdarevic, V. / Hagmuller, M. / Kubin, G. / Pernkopf, E. / Baum, M. et al. | 2004
Elektronische Ausgabe
I: Assessment of signal subspace based speech enhancement for noise robust speech recognition
Hermus, K. / Wambacq, P. et al. | 2004
Elektronische Ausgabe
I: DBN based multi-stream models for audio-visual speech recognition
Gowdy, J.N. / Subramanya, A. / Bartels, C. / Bilmes, J. et al. | 2004
Elektronische Ausgabe
I: Modeling sub-band correlation for noise-robust speech recognition
Mcauley, J. / Ji Ming, / Hanna, P. / Stewart, D. et al. | 2004
Elektronische Ausgabe
I: SP-L9.3: ROBUSTNESS OF SPEECH RECOGNITION USING GENETIC ALGORITHMS AND A MEL-CEPSTRAL SUBSPACE APPROACH
Selouani, S.-A. / O Shaughnessy, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L10.1: OPTIMAL BLIND SEPARATION OF CONVOLUTIVE AUDIO MIXTURES WITHOUT TEMPORAL CONSTRAINTS
Kokkinakis, K. / Nandi, A. K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.5: ON THE ARCHITECTURE OF THE CDMA2000® VARIABLE-RATE MULTIMODE WIDEBAND (VMR-WB) SPEECH CODING STANDARD
Jelinek, M. / Salami, R. / Ahmadi, S. / Bessette, B. / Gournay, P. / Laflamme, C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.7: A TWO-STEP NOISE REDUCTION TECHNIQUE
Plapous, C. / Marro, C. / Mauuary, L. / Scalart, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.11: A NOISE ESTIMATION ALGORITHM WITH RAPID ADAPTATION FOR HIGHLY NON-STATIONARY ENVIRONMENTS
Rangachari, S. / Loizou, P. / Hu, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.1: PERFORMANCE COMPARISONS OF ALL-PASS TRANSFORM ADAPTATION WITH MAXIMUM LIKELIHOOD LINEAR REGRESSION
McDonough, J. / Waibel, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.9: IDENTIFYING IN-SET AND OUT-OF-SET SPEAKERS USING NEIGHBORHOOD INFORMATION
Angkititrakul, P. / Hansen, J. H. L. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.8: EXTENDING BOOSTING FOR CALL CLASSIFICATION USING WORD CONFUSION NETWORKS
Tur, G. / Hakkani-Tur, D. / Riccardi, G. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.2: A DATA MINING APPROACH TO OBJECTIVE SPEECH QUALITY MEASUREMENT
Zha, W. / Chan, W.-Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.1: A MODEL-BASED TONE LABELING METHOD FOR MIN-NAN/TAIWANESE SPEECH
Kuo, W.-C. / Wang, Y.-R. / Chen, S.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.2: AN AUTOMATIC PROSODY LABELING SYSTEM USING ANN-BASED SYNTACTIC-PROSODIC MODEL AND GMM-BASED ACOUSTIC-PROSODIC MODEL
Chen, K. / Hasegawa-Johnson, M. / Cohen, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.3: VARIATIONAL BAYESIAN FEATURE SELECTION FOR GAUSSIAN MIXTURE MODELS
Valente, F. / Wellekens, C. J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.3: CLUSTERING AND SEGMENTING SPEAKERS AND THEIR LOCATIONS IN MEETINGS
Ajmera, J. / McCowan, I. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.6: OPTIMIZING ACOUSTIC MODELS FOR COMMERCIAL SPEECH RECOGNITION USING FOREGROUND SCORES AND DATA WEIGHTING
Boies, D. / Strope, B. / Weintraub, M. / Wu, S.-L. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.5: AUTOMATIC DETERMINATION OF ACOUSTIC MODEL TOPOLOGY USING VARIATIONAL BAYESIAN ESTIMATION AND CLUSTERING
Watanabe, S. / Sako, A. / Nakamura, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.1: CODEBOOK DESIGN FOR ASR SYSTEMS USING CUSTOM ARITHMETIC UNITS
Li, X. / Malkin, J. / Bilmes, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.10: PROSODY-BASED RECOGNITION OF SPOKEN GERMAN VARIETIES
Dizdarevic, V. / Hagmuller, M. / Kubin, G. / Pernkopf, F. / Baum, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.4: NOISE ROBUST SPEECH RECOGNITION WITH A SWITCHING LINEAR DYNAMIC MODEL
Droppo, J. / Acero, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.10: MINIMUM MEAN SQUARE ERROR FILTERING OF NOISY CEPSTRAL COEFFICIENTS WITH APPLICATIONS TO ASR
Myrvoll, T. A. / Nakamura, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Robust speech feature extraction by growth transformation in reproducing kernel Hilbert space
Chakrabartty, S. / Yunbin Deng, / Cauwenberghs, G. et al. | 2004
Elektronische Ausgabe
I: Phase autocorrelation (PAC) features in entropy based multi-stream for robust speech recognition
Ikbal, S. / Misra, H. / Bourlard, H. / Hermansky, H. et al. | 2004
Elektronische Ausgabe
I: Multiple-microphone time-varying filters for robust speech recognition
Calvin Yiu-Kit Lai, / Aarabi, P. et al. | 2004
Elektronische Ausgabe
I: A scalable speech and audio coding scheme with continuous bitrate flexibility
Kovesi, B. / Massaloux, D. / Sollaud, A. et al. | 2004
Elektronische Ausgabe
I: A study of various composite kernels for kernel eigenvoice speaker adaptation
Mak, B. / Kwok, J.T. / Ho, S. et al. | 2004
Elektronische Ausgabe
I: Eigen-MLLRs applied to unsupervised speaker enrollment for large vocabulary continuous speech recognition
Aubert, X.L. et al. | 2004
Elektronische Ausgabe
I: Unsupervised and active learning in automatic speech recognition for call classification
Hakkani-Tur, D. / Tur, G. / Rahim, M. / Riccardi, G. et al. | 2004
Elektronische Ausgabe
I: A model-based tone labeling method for Min-Nan/Taiwanese speech
Wei-Chih Kuo, / Yih-Ru Wang, / Sin-Horng Chen, et al. | 2004
Elektronische Ausgabe
I: Feature generation based on maximum normalized acoustic likelihood for improved speech recognition
Xiang Li, / Stern, R.M. et al. | 2004
Elektronische Ausgabe
I: Acoustic analysis of friendly speech
Fangxin Chen, / Aijun Li, / Haibo Wang, / Tianqing Wang, / Qiang Fang, et al. | 2004
Elektronische Ausgabe
I: Yet another acoustic representation of speech sounds
Minematsu, N. et al. | 2004
Elektronische Ausgabe
I: Estimating vocal-tract area functions from vowel sound signals over closed glottal phases
Huiqun Deng, / Ward, R.K. / Beddoes, M.P. / Hodgson, M. et al. | 2004
Elektronische Ausgabe
I: A voice activity detector using the chi-square test
Ahmed, B. / Holmes, P.H. et al. | 2004
Elektronische Ausgabe
I: Perceptual Kalman filtering for speech enhancement in colored noise
Ning Ma, / Bouchard, M. / Goubran, R.A. et al. | 2004
Elektronische Ausgabe
I: New speech harmonic structure measure and it application to post speech enhancement
An-Tze Yu, / Hsiao-chuan Wang, et al. | 2004
Elektronische Ausgabe
I: Model complexity control and compression using discriminative growth functions
Liu, X. / Gales, M.J.F. et al. | 2004
Elektronische Ausgabe
I: Robust speech recognition in additive and channel noise environments using GMM and EM algorithm
Fujimoto, M. / Riki, Y.A. et al. | 2004
Elektronische Ausgabe
I: Combining feature compensation and weighted Viterbi decoding for noise robust speech recognition with limited adaptation data
Xiaodong Cui, / Alwan, A. et al. | 2004
Elektronische Ausgabe
I: SP-L1.1: NON-PARALLEL TRAINING FOR VOICE CONVERSION BY MAXIMUM LIKELIHOOD CONSTRAINED ADAPTATION
Mouchtaris, A. / Van der Spiegel, J. / Mueller, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L2.2: PARAMETER SHARING AND MINIMUM CLASSIFICATION ERROR TRAINING OF MIXTURES OF FACTOR ANALYZERS FOR SPEAKER IDENTIFICATION
Yamamoto, H. / Nankaku, Y. / Miyajima, C. / Tokuda, K. / Kitamura, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L2.3: DISCOVERING RELATIONS AMONG DISCRIMINATIVE TRAINING OBJECTIVES
Li, Q. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L6.5: DIMENSIONALITY REDUCTION USING MCE-OPTIMIZED LDA TRANSFORMATION
Li, X.-B. / Li, J.-Y. / Wang, R.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L11.6: THE USE OF A LINGUISTICALLY MOTIVATED LANGUAGE MODEL IN CONVERSATIONAL SPEECH RECOGNITION
Wang, W. / Stolcke, A. / Harper, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.4: A MULTIPLE DESCRIPTION SPEECH CODER BASED ON AMR-WB FOR MOBILE AD HOC NETWORKS
Dong, H. / Gersho, A. / Gibson, J. / Cuperman, V. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.8: CONFIDENCE MEASURES IN MULTIPLE PRONUNCIATIONS MODELING FOR SPEAKER VERIFICATION
BenZeghiba, M. F. / Bourlard, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.10: BENEFITS OF PRIOR ACOUSTIC SEGMENTATION FOR AUTOMATIC SPEAKER SEGMENTATION
Meignier, S. / Moraru, D. / Fredouille, C. / Besacier, L. / Bonastre, J.-F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.11: NOISE REDUCTION ON SPEECH CODEC PARAMETERS
Taddei, H. / Beaugeant, C. / de Meuleneire, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.10: PREDICTING FOREGROUND SH, SL AND BNH DAM SCORES FOR MULTIDIMENSIONAL OBJECTIVE MEASURE OF SPEECH QUALITY
Sen, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.4: APPLICATION OF THE MODIFIED GROUP DELAY FUNCTION TO SPEAKER IDENTIFICATION AND DISCRIMINATION
Hegde, R. / Murthy, H. / Gadde, V. R. R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.5: ACOUSTIC ANALYSIS OF FRIENDLY SPEECH
Chen, F. / Li, A. / Wang, H. / Wang, T. / Fang, Q. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.12: MODELING PRONUNCIATION VARIATION FOR SPONTANEOUS SPEECH SYNTHESIS
Werner, S. / Wolff, M. / Eichner, M. / Hoffmann, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.15: REAL-TIME WORD CONFIDENCE SCORING USING LOCAL POSTERIOR PROBABILITIES ON TREE TRELLIS SEARCH
Lee, A. / Shikano, K. / Kawahara, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.8: EXPERIMENTS IN KEYPAD-AIDED SPELLING RECOGNITION
Parthasarathy, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.5: A MODIFIED EPHRAIM-MALAH NOISE SUPPRESSION RULE FOR AUTOMATIC SPEECH RECOGNITION
Gemello, R. / Mana, F. / De Mori, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.13: PCMM-BASED FEATURE COMPENSATION SCHEMES USING MODEL INTERPOLATION AND MIXTURE SHARING
Kim, W. / Kwon, O. / Ko, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Speaker identification using supra-segmental pitch pattern dynamics
Farahani, F. / Georgiou, P.G. / Narayanan, S.S. et al. | 2004
Elektronische Ausgabe
I: Robustness of speech recognition using genetic algorithms and a Mel-cepstral subspace approach
Selouani, S.A. / O'Shaughnessy, D. et al. | 2004
Elektronische Ausgabe
I: Cepstral gain normalization for noise robust speech recognition
Yoshizawa, S. / Hayasaka, N. / Wada, N. / Miyanaga, Y. et al. | 2004
Elektronische Ausgabe
I: Development of the 2003 CU-HTK conversational telephone speech transcription system
Evermann, G. / Chan, H.Y. / Gales, M.J.F. / Hain, T. / Liu, X. / Mrva, D. / Wang, L. / Woodland, P.C. et al. | 2004
Elektronische Ausgabe
I: On the architecture of the cdma2000/spl reg/ variable-rate multimode wideband (VMR-WB) speech coding standard
Jelinek, M. / Salami, R. / Ahmadi, S. / Bessetle, B. / Gournay, P. / Laflamme, C. et al. | 2004
Elektronische Ausgabe
I: An investigation into front-end signal processing for speaker normalization
Umesh, S. / Sinha, R. / Kumar, S.V.B. et al. | 2004
Elektronische Ausgabe
I: Eigenspace-based MLLR with speaker adaptive training in large vocabulary conversational speech recognition
Dounipiotis, V. / Yonggang Deng, et al. | 2004
Elektronische Ausgabe
I: Bootstrap estimates for confidence intervals in ASR performance evaluation
Bisani, M. / Ney, H. et al. | 2004
Elektronische Ausgabe
I: Noise-dependent postfiltering
Grancharov, V. / Samuelsson, J. / Kleijn, W.B. et al. | 2004
Elektronische Ausgabe
I: Combined estimation/coding of highband spectral envelopes for speech spectrum expansion
Agiomyrgiannakis, Y. / Stylianou, Y. et al. | 2004
Elektronische Ausgabe
I: Multisensor MELPe using parameter substitution
Brady, K. / Quatieri, T.F. / Campbell, J.P. / Campbell, W.M. / Brandstein, M. / Weinstein, C.J. et al. | 2004
Elektronische Ausgabe
I: Noise reduction on speech codec parameters
Taddei, H. / Beaugeant, C. / de Meuleneire, M. et al. | 2004
Elektronische Ausgabe
I: Sound feature detection using leaky integrate-and-fire neurons
Smith, L.S. / Fraser, D.S. et al. | 2004
Elektronische Ausgabe
I: Minimum segmentation error based discriminative training for speech synthesis application
Yi-Jian Wu, / Hisashi Kawai, / Jinfu Ni, / Ren-Hua Wang, et al. | 2004
Elektronische Ausgabe
I: Probability based prosody model for unit selection
Xijun Ma, / Wei Zhang, / Weibin Zhu, / Qin Shi, / Ling Jin, et al. | 2004
Elektronische Ausgabe
I: A strategy to solve data scarcity problems in corpus based intonation modelling
Cardenoso, V. / Escudero, D. et al. | 2004
Elektronische Ausgabe
I: Speech synthesis from real time ultrasound images of the tongue
Denby, B. / Stone, M. et al. | 2004
Elektronische Ausgabe
I: Speech enhancement by perceptual filter with sequential noise parameter estimation
Te-Won Lee, / Kaisheng Yao, et al. | 2004
Elektronische Ausgabe
I: Speech enhancement with missing data techniques using recurrent neural networks
Parveen, S. / Green, P. et al. | 2004
Elektronische Ausgabe
I: A generalized construction of integrated speech recognition transducers
Allauzen, C. / Mohri, M. / Riley, M. / Roark, B. et al. | 2004
Elektronische Ausgabe
I: A stream-weight optimization method for audio-visual speech recognition using multi-stream HMMs
Tamura, S. / Iwano, K. / Furui, S. et al. | 2004
Elektronische Ausgabe
I: Speech enhancement based on multiple directivity patterns using a microphone array
Sekiya, T. / Kobayashi, T. et al. | 2004
Elektronische Ausgabe
I: Noise robust speech recognition with a switching linear dynamic model
Droppo, J. / Acero, A. et al. | 2004
Elektronische Ausgabe
I: Minimum mean square error filtering of noisy cepstral coefficients with applications to ASR
Myrvoll, T.A. / Nakamura, S. et al. | 2004
Elektronische Ausgabe
I: Combination of hidden Markov models with dynamic time warping for speech recognition
Axelrod, S. / Maison, B. et al. | 2004
Elektronische Ausgabe
I: Exact training of a neural syntactic language model
Emami, A. / Jelinek, F. et al. | 2004
Elektronische Ausgabe
I: A two-step noise reduction technique
Plapous, C. / Marro, C. / Mauuary, L. / Scalart, P. et al. | 2004
Elektronische Ausgabe
I: Enrollment in low-resource speech recognition systems
Deligne, S. / Dharanipragada, S. et al. | 2004
Elektronische Ausgabe
I: A multimedia approach for audio segmentation in TV broadcast news
Perez-Freire, L. / Garcia-Mateo, C. et al. | 2004
Elektronische Ausgabe
I: The ELISA consortium approaches in broadcast news speaker segmentation during the NIST 2003 rich transcription evaluation
Moraru, D. / Meignier, S. / Fredouille, C. / Besacier, L. / Bonastre, J.F. et al. | 2004
Elektronische Ausgabe
I: Fusing language identification systems using performance confidence indexes
Gutierrez, J. / Rouas, J.L. / Andre-Obrecht, R. et al. | 2004
Elektronische Ausgabe
I: Enhancement of mismatched conditions in speaker recognition for multimedia applications
Fakhr, W. / Abdelsalam, A. / Hamdy, N. et al. | 2004
Elektronische Ausgabe
I: A detection based approach to robust speech understanding
Kuansan Wang, et al. | 2004
Elektronische Ausgabe
I: Automatic learning of interpretation strategies for spoken dialogue systems
Raymond, C. / Bechet, F. / De Mori, R. / Damnati, G. / Esteve, Y. et al. | 2004
Elektronische Ausgabe
I: Automatically derived units for segment vocoders
Ramasubramanian, V. / Sreenivas, T.V. et al. | 2004
Elektronische Ausgabe
I: Speech emotion recognition combining acoustic features and linguistic information in a hybrid support vector machine-belief network architecture
Schuller, B. / Rigoll, G. / Lang, M. et al. | 2004
Elektronische Ausgabe
I: Clustering and segmenting speakers and their locations in meetings
Ajmera, J. / Lathoud, G. / McCowan, L. et al. | 2004
Elektronische Ausgabe
I: Analysis by synthesis of acoustic correlates of British, Australian and American accents
Qin Yan, / Vaseghi, S. / Rentzos, D. / Ching-Hsiang Ho, et al. | 2004
Elektronische Ausgabe
I: A low-band spectrum envelope modeling for high quality pitch modification
Mochizuki, R. / Kobayashi, A. et al. | 2004
Elektronische Ausgabe
I: Optimizing sub-cost functions for segment selection based on perceptual evaluations in concatenative speech synthesis
Toda, T. / Kawai, H. / Tsuzaki, M. et al. | 2004
Elektronische Ausgabe
I: Corrective language modeling for large vocabulary ASR with the perceptron algorithm
Roark, B. / Saraclar, M. / Collins, M. et al. | 2004
Elektronische Ausgabe
I: Improved name recognition with meta-data dependent name networks
Maskey, S.R. / Bacchiani, M. / Roark, B. / Sproat, R. et al. | 2004
Elektronische Ausgabe
I: A new voice activity detector using subband order-statistics filters for robust speech recognition
Ramirez, J. / Segura, J.C. / Benirez, C. / de la Torre, A. / Rubio, A. et al. | 2004
Elektronische Ausgabe
I: Fusion based speech segmentation in DARPA SPINE2 task
Chengyi Zheng, / Yonghong Yan, et al. | 2004
Elektronische Ausgabe
I: Discriminative feature transformation by guided discriminative training
Hsiao, R. / Mak, B. et al. | 2004
Elektronische Ausgabe
I: Decision tree based tone modeling for Chinese speech recognition
Pui-Fung WONG, / Man-Hung SIU, et al. | 2004
Elektronische Ausgabe
I: Joint removal of additive and convolutional noise with model-based feature enhancement
Stouten, V. / Van Hamme, H. / Wambacq, P. et al. | 2004
Elektronische Ausgabe
I: Minimum classification error training of landmark models for real-time continuous speech recognition
McDermott, E. / Hazen, T.J. et al. | 2004
Elektronische Ausgabe
I: Universal compensation -- an approach to noisy speech recognition assuming no knowledge of noise
Ji Ming, et al. | 2004
Elektronische Ausgabe
I: SP-L2.1: DISCRIMINATIVE TRAINING FOR SPEAKER IDENTIFICATION BASED ON MAXIMUM MODEL DISTANCE ALGORITHM
Hong, Q. Y. / Kwong, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L1.6: VOICE CONVERSION THROUGH TRANSFORMATION OF SPECTRAL AND INTONATION FEATURES
Rentzos, D. / Vaseghi, S. / Yan, Q. / Ho, C.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L3.3: A SUBVECTOR-BASED ERROR CONCEALMENT ALGORITHM FOR SPEECH RECOGNITION OVER MOBILE NETWORKS
Tan, Z.-H. / Dalsgaard, P. / Lindberg, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L3.6: EFFICIENT AND ROBUST DISTRIBUTED SPEECH RECOGNITION (DSR) OVER WIRELESS FADING CHANNELS: 2D-DCT COMPRESSION, ITERATIVE BIT ALLOCATION, SHORT BCH CODE AND INTERLEAVING
Hsu, W.-h. / Lee, L.-s. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L4.3: TEXT-INDEPENDENT SPEAKER RECOGNITION BY COMBINING SPEAKER-SPECIFIC GMM WITH SPEAKER ADAPTED SYLLABLE-BASED HMM
Nakagawa, S. / Zhang, W. / Takahashi, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L4.1: HIGH-LEVEL SPEAKER VERIFICATION USING SUPPORT VECTOR MACHINES
Campbell, W. / Campbell, J. / Reynolds, D. / Jones, D. / Leek, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L5.5: WEIGHTED AUTOCORRELATION-BASED F0 ESTIMATION FOR DISTANT-TALKING INTERACTION WITH A DISTRIBUTED MICROPHONE NETWORK
Armani, L. / Omologo, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L6.6: SPEECH FEATURE EXTRACTION METHOD REPRESENTING PERIODICITY AND APERIODICITY IN SUB BANDS FOR ROBUST SPEECH RECOGNITION
Ishizuka, K. / Miyazaki, N. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.5: IMPROVED QUANTIZATION STRUCTURES USING GENERALIZED HMM MODELLING WITH APPLICATION TO WIDEBAND SPEECH CODING
Duni, E. / Subramaniam, A. / Rao, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L10.3: OVERDETERMINED BLIND SEPARATION FOR CONVOLUTIVE MIXTURES OF SPEECH BASED ON MULTISTAGE ICA USING SUBARRAY PROCESSING
Nishikawa, T. / Abe, H. / Saruwatari, H. / Shikano, K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L10.5: MULTIPLE-MICROPHONE TIME-VARYING FILTERS FOR ROBUST SPEECH RECOGNITION
Lai, C. / Aarabi, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L11.5: CROSS-LINGUAL LATENT SEMANTIC ANALYSIS FOR LANGUAGE MODELING
Kim, W. / Khudanpur, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.11: SPEAKER INDEXING AND ADAPTATION USING SPEAKER CLUSTERING BASED ON STATISTICAL MODEL SELECTION
Nishida, M. / Kawahara, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.6: LANGUAGE BOUNDARY DETECTION AND INDENTIFICATION OF MIXED-LANGUAGE SPEECH BASED ON MAP ESTIMATION
Shia, C.-J. / Chiu, Y.-H. / Hsieh, J.-H. / Wu, C.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.6: MULTISENSOR MELPE USING PARAMETER SUBSTITUTION
Brady, K. / Quatieri, T. / Campbell, J. / Campbell, W. / Brandstein, M. / Weinstein, C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.11: AN IMPROVED CORRECTION FORMULA FOR THE ESTIMATION OF HARMONIC MAGNITUDES AND ITS APPLICATION TO OPEN QUOTIENT ESTIMATION
Iseli, M. / Alwan, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.6: HMM-BASED FREQUENCY BANDWIDTH EXTENSION FOR SPEECH ENHANCEMENT USING LINE SPECTRAL FREQUENCIES
Chen, G. / Parsa, V. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.8: PERCEPTUAL KALMAN FILTERING FOR SPEECH ENHANCEMENT IN COLORED NOISE
Ma, N. / Bouchard, M. / Goubran, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.10: AN MMSE SPEECH ENHANCEMENT APPROACH INCORPORATING MASKING PROPERTIES
You, C. h. / Koh, S. n. / Rahardja, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.1: IMPROVING BROADCAST NEWS TRANSCRIPTION BY LIGHTLY SUPERVISED DISCRIMINATIVE TRAINING
Chan, H. Y. / Woodland, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.10: SEQUENTIAL CLUSTERING ALGORITHM FOR GAUSSIAN MIXTURE INITIALIZATION
Messina, R. / Jouvet, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.2: A NEW VOICE ACTIVITY DETECTOR USING SUBBAND ORDER-STATISTICS FILTERS FOR ROBUST SPEECH RECOGNITION
Ramirez, J. / Segura, J. C. / Benitez, C. / de la Torre, A. / Rubio, A. J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.4: A STREAM-WEIGHT OPTIMIZATION METHOD FOR AUDIO-VISUAL SPEECH RECOGNITION USING MULTI-STREAM HMMS
Tamura, S. / Iwano, K. / Furui, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.5: A FACTORIAL HMM APPROACH TO SIMULTANEOUS RECOGNITION OF ISOLATED DIGITS SPOKEN BY MULTIPLE TALKERS ON ONE AUDIO CHANNEL
Deoras, A. / Hasegawa-Johnson, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.10: PARAMETER SHARING IN SUBBAND LIKELIHOOD-MAXIMIZING BEAMFORMING FOR SPEECH RECOGNITION USING MICROPHONE ARRAYS
Seltzer, M. / Stern, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P14.7: CHINESE-ENGLISH BILINGUAL PHONE MODELING FOR CROSS-LANGUAGE SPEECH RECOGNITION
Yu, S. / Zhang, S. / Xu, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.10: MINIMUM KULLBACK-LEIBLER DISTANCE BASED MULTIVARIATE GAUSSIAN FEATURE ADAPTATION FOR DISTANT-TALKING SPEECH RECOGNITION
Pan, Y. / Waibel, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Lightly supervised acoustic model training using consensus networks
Langzhou Chen, / Lamel, L. / Gauvain, J.L. et al. | 2004
Elektronische Ausgabe
I: Performance comparisons of all-pass transform adaptation with maximum likelihood linear regression
McDonough, J. / Waibel, A. et al. | 2004
Elektronische Ausgabe
I: Prior knowledge guided MEL based model selection and adaptation for nonnative speech recognition
Xiaodong He, / Yunxin Zhao, et al. | 2004
Elektronische Ausgabe
I: Identifying in-set and out-of-set speakers using neighborhood information
Angkititrakul, P. / Hansen, J.H.L. et al. | 2004
Elektronische Ausgabe
I: A data mining approach to objective speech quality measurement
Wei Zha, / Wai-Yip Chan, et al. | 2004
Elektronische Ausgabe
I: Efficient spectrum coding for super-wideband speech and its application to 7/10/15 kHz bandwidth scalable coders
Oshikiri, M. / Ehara, H. / Yoshida, K. et al. | 2004
Elektronische Ausgabe
I: Towards multilingual speech recognition using data driven source/target acoustical units association
Bayeh, R. / Lin, S. / Chollet, G. / Mokbel, C. et al. | 2004
Elektronische Ausgabe
I: Formant frequency estimation in noise
Bin Chen, / Loizou, P.C. et al. | 2004
Elektronische Ausgabe
I: Watermarking of speech signals using the sinusoidal model and frequency modulation of the partials
Girin, L. / Marchand, S. et al. | 2004
Elektronische Ausgabe
I: Automated lip-reading for improved speech intelligibility
McClain, M. / Brady, K. / Brandstein, M. / Quatieri, T. et al. | 2004
Elektronische Ausgabe
I: Out-of-domain detection based on confidence measures from multiple topic classification
Lane, L.R. / Kawahara, T. / Matsui, T. / Nakamura, S. et al. | 2004
Elektronische Ausgabe
I: Cross-dialectal acoustic data sharing for Arabic speech recognition
Kirchhoff, K. / Vergyri, D. et al. | 2004
Elektronische Ausgabe
I: Filler model based confidence measures for spoken dialogue systems: a case study for Turkish
Akyol, A. / Erdogan, H. et al. | 2004
Elektronische Ausgabe
I: Rao-Blackwellised Gibbs sampling for switching linear dynamical systems
Rosti, A.V.I. / Gales, M.J.F. et al. | 2004
Elektronische Ausgabe
I: Training for polynomial segment model using the expectation maximization algorithm
Chak-Fai Li, / Man-Hung Siu, et al. | 2004
Elektronische Ausgabe
I: Acoustic model adaptation using first order prediction for reverberant speech
Takiguchi, T. / Nishimura, M. et al. | 2004
Elektronische Ausgabe
I: On tracking noise with linear dynamical system models
Raj, B. / Singh, R. / Stern, R. et al. | 2004
Elektronische Ausgabe
I: Nonlinear noise compensation in feature domain for speech recognition with numerical methods
Hui Jiang, / Qi Wang, et al. | 2004
Elektronische Ausgabe
I: Tone articulation modeling for Mandarin spontaneous speech recognition
Jian-lai Zhou, / Ye Tian, / Yu Shi, / Chao Huang, / Chang, E. et al. | 2004
Elektronische Ausgabe
I: SP-L1.4: ALGORITHM AMALGAM: MORPHING WAVEFORM BASED METHODS, SINUISOIDAL MODELS AND STRAIGHT
Kawahara, H. / Banno, H. / Irino, T. / Zolfaghari, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L2.5: GENERALIZED LOCALLY RECURRENT PROBABILISTIC NEURAL NETWORKS FOR TEXT-INDEPENDENT SPEAKER VERIFICATION
Ganchev, T. / Fakotakis, N. / Tasoulis, D. / Vrahatis, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L2.6: DISCRIMINATION POWER WEIGHTED SUBWORD-BASED SPEAKER VERIFICATION
Chan, S.-M. / Si, M.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L3.1: SOFT DECODING STRATEGIES FOR DISTRIBUTED SPEECH RECOGNITION OVER IP NETWORKS
Cardenal-Lopez, A. / Docio-Fernandez, L. / Garcia-Mateo, C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L5.6: A NOVEL METHOD FOR COMPUTATION OF PERIODICITY, APERIODICITY AND PITCH OF SPEECH SIGNALS
Deshmukh, O. / Singh, J. / Espy-Wilson, C. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.1: LOW-COMPLEXITY PREDICTIVE TRELLIS CODED QUANTIZATION OF WIDEBAND SPEECH LSF PARAMETERS
Shin, Y. / Kang, S. / Fischer, T. R. / Son, C. / Lee, Y. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L10.4: SPEECH ENHANCEMENT BASED ON A COMBINED MULTI-CHANNEL ARRAY WITH CONSTRAINED INTERATIVE AND AUDITORY MASKED PROCESSING
Zhang, X. / Hansen, J. H. L. / Arehart, K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.5: ENHANCEMENT OF MISMATCHED CONDITIONS IN SPEAKER RECOGNITION FOR MULTIMEDIA APPLICATIONS
Fakhr, W. / Abdelsalam, A. / Hamdy, N. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.12: A PITCH SYNCHRONOUS FEATURE EXTRACTION METHOD FOR SPEAKER RECOGNITION
Kim, S. / Eriksson, T. / Kang, H.-G. / Youn, D. H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.3: ROBUST MULTIMODAL UNDERSTANDING
Bangalore, S. / Johnston, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P5.9: WIDEBAND AUDIO OVER NARROWBAND LOW-RESOLUTION MEDIA
Ding, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.12: ENTROPY-BASED VARIABLE FRAME RATE ANALYSIS OF SPEECH SIGNALS AND ITS APPLICATION TO ASR
You, H. / Zhu, Q. / Alwan, A. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.6: IMPORTANCE OFWINDOWSHAPE FOR PHASE-ONLY RECONSTRUCTION OF SPEECH
Alsteris, L. / Paliwal, K. K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.7: CLOSED-FORM ESTIMATION OF THE AMPLITUDE COMMANDS IN THE AUTOMATIC EXTRACTION OF FUJISAKI'S MODEL
Silva, S. / Netto, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.5: ESTIMATION OF SHORT-TERM PREDICTOR PARAMETERS FOR CODING AND ENHANCEMENT OF NOISY SPEECH
Srinivasan, S. / Samuelsson, J. / Kleijn, W. B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P10.12: SPEECH ENHANCEMENT WITH MISSING DATA TECHNIQUES USING RECURRENT NEURAL NETWORKS
Parveen, S. / Green, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.5: GENERATING AND EVALUATING SEGMENTATIONS FOR AUTOMATIC SPEECH RECOGNITION OF CONVERSATIONAL TELEPHONE SPEECH
Tranter, S. / Yu, K. / Evermann, G. / Woodland, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.12: TRAINING FOR POLYNOMIAL SEGMENT MODEL USING THE EXPECTATION MAXIMIZATION ALGORITHM
Li, C.-F. / Siu, M.-H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.6: UNIVERSAL COMPENSATION - AN APPROACH TO NOISY SPEECH RECOGNITION ASSUMING NO KNOWLEDGE OF NOISE
Ming, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.9: SNR-DEPENDENT NON-UNIFORM SPECTRAL COMPRESSION FOR NOISY SPEECH RECOGNITION
Chu, K.-k. / Leung, S. H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.2: TONE ARTICULATION MODELING FOR MANDARIN SPONTANEOUS SPEECH RECOGNITION
Zhou, J.-L. / Tian, Y. / Shi, Y. / Huang, C. / Chang, E. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.3: SPATIO-TEMPORAL PROCESSING FOR DISTANT SPEECH RECOGNITION
Low, S. Y. / Togneri, R. / Nordholm, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L7.2: MULTIPLE FRAME BLOCK QUANTISATION OF LINE SPECTRAL FREQUENCIES USING GAUSSIAN MIXTURE MODELS
Paliwal, K. K. / So, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.1: EFFECTS OF TRANSCRIPTION ERRORS ON SUPERVISED LEARNING IN SPEECH RECOGNITION
Sundaram, R. / Picone, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.3: MPE-BASED DISCRIMINATIVE LINEAR TRANSFORM FOR SPEAKER ADAPTATION
Wang, L. / Woodland, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.4: A STUDY OF VARIOUS COMPOSITE KERNELS FOR KERNEL EIGENVOICE SPEAKER ADAPTATION
Mak, B. / Kwok, J. / Ho, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.2: A DETECTION BASED APPROACH TO ROBUST SPEECH UNDERSTANDING
Wang, K. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.8: JOINT FREQUENCY DOMAIN AND RECONSTRUCTED PHASE SPACE FEATURES FOR SPEECH RECOGNITION
Lindgren, A. / Johnson, M. / Povinelli, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P7.8: FORMANT FREQUENCY ESTIMATION IN NOISE
Chen, B. / Loizou, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.2: SPEECH DISCRIMINATION BASED ON MULTISCALE SPECTRO-TEMPORAL MODULATIONS
Mesgarani, N. / Shamma, S. / Slaney, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.4: VOICE ACTIVITY DETECTION USING VISUAL INFORMATION
Liu, P. / Wang, Z. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.5: SPEECH MODELING AND VOICED/UNVOICED/MIXED/SILENCE SPEECH SEGMENTATION WITH FRACTIONALLY GAUSSIAN NOISE BASED MODELS
Oveisgharan, S. / Shamsollahi, M. B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P8.6: SOUND FEATURE DETECTION USING LEAKY INTEGRATE-AND-FIRE NEURONS
Smith, L. / Fraser, D. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.7: A REAL-TIME CANTONESE TEXT-TO-AUDIOVISUAL SPEECH SYNTHESIZER
Wang, J.-Q. / Wong, K.-H. / Heng, P.-A. / Meng, H. M.-L. / Wong, T.-T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.15: SPEECH SYNTHESIS FROM REAL TIME ULTRASOUND IMAGES OF THE TONGUE
Denby, B. / Stone, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.12: FILLER MODEL BASED CONFIDENCE MEASURES FOR SPOKEN DIALOGUE SYSTEMS: A CASE STUDY FOR TURKISH
Akyol, A. / Erdogan, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.2: BASIS SUPERPOSITION PRECISION MATRIX MODELLING FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION
Sim, K. C. / Gales, M. J. F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.3: JOINT REMOVAL OF ADDITIVE AND CONVOLUTIONAL NOISE WITH MODEL-BASED FEATURE ENHANCEMENT
Stouten, V. / Van hamme, H. / Wambacq, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P15.7: ON TRACKING NOISE WITH LINEAR DYNAMICAL SYSTEM MODELS
Raj, B. / Singh, R. / Stern, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P16.8: MITIGATION OF CHANNEL ERRORS IN EFR-BASED SPEECH RECOGNITION
Gomez, A. M. / Peinado, A. M. / Sanchez, V. E. / Perez-Cordoba, J. L. / Rubio, A. J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Improvement of speaker recognition by combining residual and prosodic features with acoustic features
Shi-Han Chen, / Hsiao-Chuan Wang, et al. | 2004
Elektronische Ausgabe
I: Dimensionality reduction using MCE-optimized LDA transformation
Xiao-Bing Li, / Jin-Yu Li, / Ren-Hua Wang, et al. | 2004
Elektronische Ausgabe
I: Light supervision in acoustic model training
Long Nguyen, / Bing Xiang, et al. | 2004
Elektronische Ausgabe
I: Overdetermined blind separation for convolutive mixtures of speech based on multistage ICA using subarray processing
Nishikawa, T. / Abe, H. / Saruwatari, H. / Shikano, K. et al. | 2004
Elektronische Ausgabe
I: A study of design compromises for speech coders in packet networks
Lefebvre, R. / Philippe, G.T. / Salami, R. et al. | 2004
Elektronische Ausgabe
I: Improvement issues on transcoding algorithms: for the flexible usage to the various pairs of speech codec
Jin-Kyu Choi, / Chang-Heon Lee, / Hong-Goo, K. / Young-Cheol Park, / Dae Hee Youn, et al. | 2004
Elektronische Ausgabe
I: Parameterization of the score threshold for a text-dependent adaptive speaker verification system
Mirghafori, N. / Hebert, M. et al. | 2004
Elektronische Ausgabe
I: Wideband audio over narrowband low-resolution media
Heping Ding, et al. | 2004
Elektronische Ausgabe
I: A differential spectral voice activity detector
Garner, P.N. / Fukada, T. / Komori, Y. et al. | 2004
Elektronische Ausgabe
I: Scaling of waveform segments along the time axis for concatenative speech synthesis
Nishizawa, N. / Kawai, H. et al. | 2004
Elektronische Ausgabe
I: Sequential clustering algorithm for Gaussian mixture initialization
Messina, R. / Jouvet, D. et al. | 2004
Elektronische Ausgabe
I: An analysis of interleavers for robust speech recognition in burst-like packet loss
James, A.B. / Milner, B.P. et al. | 2004
Elektronische Ausgabe
I: A factorial HMM approach to simultaneous recognition of isolated digits spoken by multiple talkers on one audio channel
Deoras, A.N. / Hasegawa-Johnson, A. et al. | 2004
Elektronische Ausgabe
I: PCMM-based feature compensation schemes using model interpolation and mixture sharing
Wooil Kim, / Ohil Kwon, / Hanseok Ko, et al. | 2004
Elektronische Ausgabe
I: Asynchronous HMM with applications to speech recognition
Garg, A. / Balakrishnan, S. / Vaithyanathan, S. et al. | 2004
Elektronische Ausgabe
I: SP-L6.1: NON-UNIFORM SPEAKER NORMALIZATION USING AFFINE-TRANSFORMATION
Bharath Kumar, S. V. / Umesh, S. / Sinha, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L6.4: ROBUST SPEECH FEATURE EXTRACTION BY GROWTH TRANSFORMATION IN REPRODUCING KERNEL HILBERT SPACE
Chakrabartty, S. / Deng, Y. / Cauwenberghs, G. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L8.6: LIGHTLY SUPERVISED ACOUSTIC MODEL TRAINING USING CONSENSUS NETWORKS
Chen, L. / Lamel, L. / Gauvain, J.-L. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L10.2: MICROPHONE ARRAY POST-FILTER FOR SEPARATION OF SIMULTANEOUS NON-STATIONARY SOURCES
Valin, J.-M. / Rouat, J. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L11.1: META-DATA CONDITIONAL LANGUAGE MODELING
Bacchiani, M. / Roark, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-L11.3: DEVELOPMENT OF THE 2003 CU-HTK CONVERSATIONAL TELEPHONE SPEECH TRANSCRIPTION SYSTEM
Evermann, G. / Chan, H. Y. / Gales, M. J. F. / Hain, T. / Liu, X. / Mrva, D. / Wang, L. / Woodland, P. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.1: A STUDY OF DESIGN COMPROMISES FOR SPEECH CODERS IN PACKET NETWORKS
Lefebvre, R. / Gournay, P. / Salami, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P1.2: IMPROVEMENT ISSUES ON TRANSCODING ALGORITHMS: FOR THE FLEXIBLE USAGE TO THE VARIOUS PAIRS OF SPEECH CODEC
Choi, J.-K. / Lee, C.-H. / Kang, H.-G. / Park, Y.-C. / Youn, D. H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P2.6: ONLINE SPEAKER CLUSTERING
Liu, D. / Kubala, F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P3.7: FUSING LANGUAGE IDENTIFICATION SYSTEMS USING PERFORMANCE CONFIDENCE INDEXES
Gutierrez, J. / Rouas, J.-L. / Andre-Obrecht, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P4.1: BOOTSTRAP ESTIMATES FOR CONFIDENCE INTERVALS IN ASR PERFORMANCE EVALUATION
Bisani, M. / Ney, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.10: ON USE OF TASK INDEPENDENT TRAINING DATA IN TANDEM FEATURE EXTRACTION
Sivadas, S. / Hermansky, H. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P6.11: FEATURE GENERATION BASED ON MAXIMUM NORMALIZED ACOUSTIC LIKELIHOOD FOR IMPROVED SPEECH RECOGNITION
Li, X. / Stern, R. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P9.6: PROBABILITY BASED PROSODY MODEL FOR UNIT SELECTION
Ma, X. J. / Zhang, W. / Zhu, W. B. / Shi, Q. / Jin, L. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.3: HYBRID LANGUAGE MODELS FOR OUT OF VOCABULARY WORD DETECTION IN LARGE VOCABULARY CONVERSATIONAL SPEECH RECOGNITION
Yazgan, A. / Saraclar, M. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P11.6: OUT-OF-DOMAIN DETECTION BASED ON CONFIDENCE MEASURES FROM MULTIPLE TOPIC CLASSIFICATION
Lane, I. / Kawahara, T. / Matsui, T. / Nakamura, S. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.1: MODEL COMPLEXITY CONTROL AND COMPRESSION USING DISCRIMINATIVE GROWTH FUNCTIONS
Liu, X. / Gales, M. J. F. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P12.11: A VITERBI ALGORITHM FOR A TRAJECTORY MODEL DERIVED FROM HMM WITH EXPLICIT RELATIONSHIP BETWEEN STATIC AND DYNAMIC FEATURES
Zen, H. / Tokuda, K. / Kitamura, T. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: SP-P13.3: AN ANALYSIS OF INTERLEAVERS FOR ROBUST SPEECH RECOGNITION IN BURST-LIKE PACKET LOSS
James, A. / Milner, B. / IEEE Signal Processing Society et al. | 2004
Gedruckte Ausgabe
I: Voice conversion through transformation of spectral and intonation features
Rentzos, D. / Vaseghi, S. / Qin Yan, / Ching-Hsiang Ho, et al. | 2004
Elektronische Ausgabe
I: Discriminative training for speaker identification based on maximum model distance algorithm
Hong, Q.Y. / Kwong, S. et al. | 2004
Elektronische Ausgabe
I: Extraction of pitch in adverse conditions
Prasanna, S.R.M. / Yegnanarayana, B. et al. | 2004
Elektronische Ausgabe
I: A locally weighted distance measure for example based speech recognition
De Wachter, M. / Demuynck, K. / Wambacq, P. / Van Compernolle, D. et al. | 2004
Elektronische Ausgabe
I: A noise estimation algorithm with rapid adaptation for highly nonstationary environments
Rangachari, S. / Loizou, P.C. / Yi Hu, et al. | 2004
Elektronische Ausgabe
I: Feature space Gaussianization
Saon, G. / Dharanipragada, S. / Povey, D. et al. | 2004
Elektronische Ausgabe
I: Desperately seeking impostors: data-mining for competitive impostor testing in a text-dependent speaker verification system
Hebert, M. / Mirghafori, N. et al. | 2004
Elektronische Ausgabe
I: Low-complexity multi-rate lattice vector quantization with application to wideband TCX speech coding at 32 kbit/s
Ragot, S. / Bessette, B. / Lefebvre, R. et al. | 2004
Elektronische Ausgabe
I: Speech discrimination based on multiscale spectro-temporal modulations
Mesgarani, N. / Shamma, S. / Slaney, M. et al. | 2004
Elektronische Ausgabe
I: Voice activity detection using visual information
Peng Liu, / Zuoying Wang, et al. | 2004
Elektronische Ausgabe
I: Feature selection for improved bandwidth extension of speech signals
Jax, P. / Vary, P. et al. | 2004
Elektronische Ausgabe
I: Speech enhancement using robust weighting factors for critical-band-wavelet-packet transform
Ching-Ta Lu, / Hsiao-Chuan Wang, et al. | 2004
Elektronische Ausgabe
I: An MMSE speech enhancement approach incorporating masking properties
Chang Huai You, / Soo Ngee Koh, / Rahardja, S. et al. | 2004
Elektronische Ausgabe
I: Real-time word confidence scoring using local posterior probabilities on tree trellis search
Lee, A. / Shikano, K. / Kawahara, T. et al. | 2004
Elektronische Ausgabe

Wie erhalte ich diesen Titel?

TIB vor Ort

Nachweis Campus LUH

TIB-Dokumentlieferung Kostenpflichtig bestellen

Preisinformation

Schnellzugriff

Ausleihen & Bestellen

Schnellzugriff

Recherchieren & Entdecken

Schnellzugriff

Lernen & Arbeiten

Schnellzugriff

Publizieren & Archivieren

Schnellzugriff

Über die TIB

Schnellzugriff

Forschung & Entwicklung

SP-L2.2: PARAMETER SHARING AND MINIMUM CLASSIFICATION ERROR TRAINING OF MIXTURES OF FACTOR ANALYZERS FOR SPEAKER IDENTIFICATION (Englisch)

Wie erhalte ich diesen Titel?

Exportieren, teilen und zitieren

Mehr Angaben zu diesem Treffer

Inhaltsverzeichnis

Inhaltsverzeichnis Konferenzband

Ähnliche Titel

Wie erhalte ich diesen Titel?

Exportieren, teilen und zitieren