Test Your Samples Jointly: Pseudo-Reference for Image Quality Evaluation (English)

Tworski, Marcelin / Lathuiliere, Stephane

In: ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ; 1-5 ; 2023

ISBN:

978-1-7281-6327-7

ISSN:

2379-190X

Conference paper / Electronic Resource

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Export, share and cite

In this paper, we address the well-known image quality assessment problem but in contrast from existing approaches that predict image quality independently for every images, we propose to jointly model different images depicting the same content to improve the precision of quality estimation. This proposal is motivated by the idea that multiple distorted images can provide information to disambiguate image features related to content and quality. To this aim, we combine the feature representations from the different images to estimate a pseudo-reference that we use to enhance score prediction. Our experiments show that at test-time, our method successfully combines the features from multiple images depicting the same new content, improving estimation quality.

Title:

Test Your Samples Jointly: Pseudo-Reference for Image Quality Evaluation
Contributors:

Tworski, Marcelin ( author ) / Lathuiliere, Stephane ( author )
Published in:

ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ; 1-5
Publisher:

IEEE

Publication date:

2023-06-04
Size:

1116609 byte
ISBN:

978-1-7281-6327-7
ISSN:

2379-190X
DOI:

https://doi.org/10.1109/ICASSP49357.2023.10095174
Type of media:

Conference paper
Type of material:

Electronic Resource
Language:

English
Source:

IEEE

Table of contents conference proceedings

The tables of contents are generated automatically and are based on the data records of the individual contributions available in the index of the TIB portal. The display of the Tables of Contents may therefore be incomplete.

1: Learning ASR Pathways: A Sparse Multilingual ASR Model
Yang, Mu / Tjandra, Andros / Liu, Chunxi / Zhang, David / Le, Duc / Kalinli, Ozlem et al. | 2023
digital version
1: Real-Time Target Sound Extraction
Veluri, Bandhav / Chan, Justin / Itani, Malek / Chen, Tuochao / Yoshioka, Takuya / Gollakota, Shyamnath et al. | 2023
digital version
1: Multi-Scale Receptive Field Graph Model for Emotion Recognition in Conversations
Wei, Jie / Hu, Guanyu / Tuan, Luu Anh / Yang, Xinyu / Zhu, Wenjing et al. | 2023
digital version
1: Twitter Stance Detection via Neural Production Systems
Zhang, Bowen / Ding, Daijun / Xu, Guangning / Guo, Jinjin / Huang, Zhichao / Huang, Xu et al. | 2023
digital version
1: Lost In Translation: Generating Adversarial Examples Robust to Round-Trip Translation
Bhandari, Neel / Chen, Pin-Yu et al. | 2023
digital version
1: LDTSF: A Label-Decoupling Teacher-Student Framework for Semi-Supervised Echocardiography Segmentation
Zhang, Jiapeng / Wang, Yongxiong / Pan, Zhiqun / Tang, Zhenhui / Chen, Lijun / Liu, Jinlong et al. | 2023
digital version
1: SLBERT: A Novel Pre-Training Framework for Joint Speech and Language Modeling
Susladkar, Onkar / Gatti, Prajwal / Kumar Yadav, Santosh et al. | 2023
digital version
1: Iterative Shallow Fusion of Backward Language Model for End-To-End Speech Recognition
Ogawa, Atsunori / Moriya, Takafumi / Kamo, Naoyuki / Tawara, Naohiro / Delcroix, Marc et al. | 2023
digital version
1: Seri: Sketching-Reasoning-Integrating Progressive Workflow for Empathetic Response Generation
Bi, Guanqun / Cao, Yanan / Li, Piji / Xie, Yuqiang / Fang, Fang / Lin, Zheng et al. | 2023
digital version
1: Vitasd: Robust Vision Transformer Baselines for Autism Spectrum Disorder Facial Diagnosis
Cao, Xu / Ye, Wenqian / Sizikova, Elena / Bai, Xue / Coffee, Megan / Zeng, Hongwu / Cao, Jianguo et al. | 2023
digital version
1: The Role of Initial Entanglement in Adaptive Gibbs State Preparation on Quantum Computers
Economou, Sophia E. / Warren, Ada / Barnes, Edwin et al. | 2023
digital version
1: Multilevel FISTA for Image Restoration
Lauga, Guillaume / Riccietti, Elisa / Pustelnik, Nelly / Goncalves, Paulo et al. | 2023
digital version
1: JPEG Pleno Call for Proposals Responses Quality Assessment
Prazeres, Joao / Luo, Zhe / Pinheiro, Antonio M. G. / da Silva Cruz, Luis A. / Perry, Stuart et al. | 2023
digital version
1: Frame-Level Multi-Label Playing Technique Detection Using Multi-Scale Network and Self-Attention Mechanism
Li, Dichucheng / Che, Mingjin / Meng, Wenwu / Wu, Yulun / Yu, Yi / Xia, Fan / Li, Wei et al. | 2023
digital version
1: WITT: A Wireless Image Transmission Transformer for Semantic Communications
Yang, Ke / Wang, Sixian / Dai, Jincheng / Tan, Kailin / Niu, Kai / Zhang, Ping et al. | 2023
digital version
1: Kernel Estimation and Deconvolution for Blind Image Super-Resolution
Gong, Jiali / Gao, Hongfan / Chao, Jiahao / Zhou, Zhou / Yang, Zhengfeng / Zeng, Zhenbing et al. | 2023
digital version
1: Learned Video Coding with Motion Compensation Mixture Model
Dinh, Khanh Quoc / Pyo Choi, Kwang et al. | 2023
digital version
1: Improving Few-Shot Learning for Talking Face System with TTS Data Augmentation
Chen, Qi / Ma, Ziyang / Liu, Tao / Tan, Xu / Lu, Qu / Yu, Kai / Chen, Xie et al. | 2023
digital version
1: A Synthetic Corpus Generation Method for Neural Vocoder Training
Wang, Zilin / Liu, Peng / Chen, Jun / Li, Sipan / Bai, Jinfeng / He, Gang / Wu, Zhiyong / Meng, Helen et al. | 2023
digital version
1: HiSSNet: Sound Event Detection and Speaker Identification via Hierarchical Prototypical Networks for Low-Resource Headphones
Shashaank, N / Banar, Berker / Izadi, Mohammad Rasool / Kemmerer, Jeremy / Zhang, Shuo / Huang, Chuan-Che Jeff et al. | 2023
digital version
1: Robust Acoustic And Semantic Contextual Biasing In Neural Transducers For Speech Recognition
Fu, Xuandi / Sathyendra, Kanthashree Mysore / Gandhe, Ankur / Liu, Jing / Strimel, Grant P. / McGowan, Ross / Mouchtaris, Athanasios et al. | 2023
digital version
1: Multi-Task Bias-Variance Trade-Off Through Functional Constraints
Cervino, Juan / Bazerque, Juan Andres / Calvo-Fullana, Miguel / Ribeiro, Alejandro et al. | 2023
digital version
1: Towards a More Stable and General Subgraph Information Bottleneck
Liu, Hongzhi / Zheng, Kaizhong / Yu, Shujian / Chen, Badong et al. | 2023
digital version
1: Unsupervised Domain Adaptation via Subspace Interpolating Deep Dictionary Learning: A Case Study in Machine Inspection
Kumar, Kriti / Majumdar, Angshul / Kumar, A Anil / Girish Chandra, M et al. | 2023
digital version
1: Adaptive Filtering Algorithms For Set-Valued Observations-Symmetric Measurement Approach To Unlabeled And Anonymized Data
Krishnamurthy, Vikram et al. | 2023
digital version
1: Classification of Synthetic Facial Attributes by Means of Hybrid Classification/Localization Patch-Based Analysis
Wang, Jun / Tondi, Benedetta / Barni, Mauro et al. | 2023
digital version
1: A Point is A Wave: Point-Wave Network for Place Recognition
Li, Ge / Zhang, Ruonan et al. | 2023
digital version
1: Robust and Globally Sparse Pca via Majorization-Minimization and Variable Splitting
Brehier, Hugo / Breloy, Arnaud / El Korso, Mohammed Nabil / Kumar, Sandeep et al. | 2023
digital version
1: Zero-Shot Speech Emotion Recognition Using Generative Learning with Reconstructed Prototypes
Xu, Xinzhou / Deng, Jun / Zhang, Zixing / Yang, Zhen / Schuller, Bjorn W. et al. | 2023
digital version
1: Multi-Task Transformer with Relation-Attention and Type-Attention for Named Entity Recognition
Mo, Ying / Tang, Hongyin / Liu, Jiahao / Wang, Qifan / Xu, Zenglin / Wang, Jingang / Wu, Wei / Li, Zhoujun et al. | 2023
digital version
1: Self-Supervised Representations in Speech-Based Depression Detection
Wu, Wen / Zhang, Chao / Woodland, Philip C. et al. | 2023
digital version
1: A Simple Yet Effective Approach to Structured Knowledge Distillation
Lin, Wenye / Li, Yangming / Liu, Lemao / Shi, Shuming / Zheng, Hai-Tao et al. | 2023
digital version
1: Leveraging Neural Koopman Operators to Learn Continuous Representations of Dynamical Systems from Scarce Data
Frion, Anthony / Drumetz, Lucas / Mura, Mauro Dalla / Tochon, Guillaume / Aissa-El-Bey, Abdeldjalil et al. | 2023
digital version
1: WUDA: Unsupervised Domain Adaptation Based on Weak Source Domain Labels
Liu, Shengjie / Zhu, Chuang / Li, Yuan / Tang, Wenqi et al. | 2023
digital version
1: A Memory-Free Evolving Bipolar Neural Network for Efficient Multi-Label Stream Learning
Mishra, Sourav / Sundaram, Suresh et al. | 2023
digital version
1: Prototype Knowledge Distillation for Medical Segmentation with Missing Modality
Wang, Shuai / Yan, Zipei / Zhang, Daoan / Wei, Haining / Li, Zhongsen / Li, Rui et al. | 2023
digital version
1: A Novel Efficient Multi-View Traffic-Related Object Detection Framework
Yang, Kun / Liu, Jing / Yang, Dingkang / Wang, Hanqi / Sun, Peng / Zhang, Yanni / Liu, Yan / Song, Liang et al. | 2023
digital version
1: Learning with Multigraph Convolutional Filters
Butler, Landon / Parada-Mayorga, Alejandro / Ribeiro, Alejandro et al. | 2023
digital version
1: Self-Supervised Audio-Visual Speech Representations Learning by Multimodal Self-Distillation
Zhang, Jing-Xuan / Wan, Genshun / Ling, Zhen-Hua / Pan, Jia / Gao, Jianqing / Liu, Cong et al. | 2023
digital version
1: Exploring Wav2vec 2.0 Fine Tuning for Improved Speech Emotion Recognition
Chen, Li-Wei / Rudnicky, Alexander et al. | 2023
digital version
1: Reducing the GAP Between Streaming and Non-Streaming Transducer-Based ASR by Adaptive Two-Stage Knowledge Distillation
Tang, Haitao / Fu, Yu / Sun, Lei / Xue, Jiabin / Liu, Dan / Li, Yongchao / Ma, Zhiqiang / Wu, Minghui / Pan, Jia / Wan, Genshun et al. | 2023
digital version
1: Generalized Invariant Matching Property Via Lasso
Du, Kang / Xiang, Yu et al. | 2023
digital version
1: Efficient Feature Extraction for Non-Maximum Suppression in Visual Person Detection
Symeonidis, Charalampos / Mademlis, Ioannis / Pitas, Ioannis / Nikolaidis, Nikos et al. | 2023
digital version
1: Visual-Aware Text-to-Speech^*
Zhou, Mohan / Bai, Yalong / Zhang, Wei / Yao, Ting / Zhao, Tiejun / Mei, Tao et al. | 2023
digital version
1: Hindi as a Second Language: Improving Visually Grounded Speech with Semantically Similar Samples
Ryu, Hyeonggon / Senocak, Arda / So Kweon, In / Son Chung, Joon et al. | 2023
digital version
1: Front-End Adapter: Adapting Front-End Input of Speech Based Self-Supervised Learning for Speech Recognition
Chen, Xie / Ma, Ziyang / Tang, Changli / Wang, Yujin / Zheng, Zhisheng et al. | 2023
digital version
1: Do Prosody Transfer Models Transfer Prosodyƒ
Sigurgeirsson, Atli Thor / King, Simon et al. | 2023
digital version
1: Rate Splitting and Precoding Strategies for Multi-User MIMO Broadcast Channels with Common and Private Streams
Khamidullina, Liana / de Almeida, Andre L. F. / Haardt, Martin et al. | 2023
digital version
1: A Quantum Kernel Learning Approach to Acoustic Modeling for Spoken Command Recognition
Yang, Chao-Han Huck / Li, Bo / Zhang, Yu / Chen, Nanxin / Sainath, Tara N. / Marco Siniscalchi, Sabato / Lee, Chin-Hui et al. | 2023
digital version
1: Weight Averaging: A Simple Yet Effective Method to Overcome Catastrophic Forgetting in Automatic Speech Recognition
Vander Eeckt, Steven / Van Hamme, Hugo et al. | 2023
digital version
1: VPPT: Visual Pre-Trained Prompt Tuning Framework for Few-Shot Image Classification
Song, Zhao / Yang, Ke / Guan, Naiyang / Zhu, Junjie / Qiao, Peng / Hu, Qingyong et al. | 2023
digital version
1: Test Your Samples Jointly: Pseudo-Reference for Image Quality Evaluation
Tworski, Marcelin / Lathuiliere, Stephane et al. | 2023
digital version
1: Waveform Design to Improve the Estimation of Target Parameters Using the Fourier Transform Method in a MIMO OFDM DFRC System
Bhogavalli, Satwika / Grivel, Eric / Hari, K.V.S. / Corretja, Vincent et al. | 2023
digital version
1: Modify: Model-Driven Face Stylization Without Style Images
Ding, Yuhe / Liang, Jian / Cao, Jie / Zheng, Aihua / He, Ran et al. | 2023
digital version
1: TINYCOD: Tiny and Effective Model for Camouflaged Object Detection
Xing, Haozhe / Gao, Shuyong / Tang, Hao / Mok, Tsui Qin / Kang, Yanlan / Zhang, Wenqiang et al. | 2023
digital version
1: Automatic Segmentation of Nasopharyngeal Carcinoma in CT Images Using Dual Attention and Edge Detection
Wang, Qizhi / Huang, Wei / Zhang, Yuan / Li, Xuanya / Ye, Xiongjun / Hu, Kai et al. | 2023
digital version
1: Fast and Efficient Speech Enhancement with Variational Autoencoders
Sadeghi, Mostafa / Serizel, Romain et al. | 2023
digital version
1: Representation of Vocal Tract Length Transformation Based on Group Theory
Miyashita, Atsushi / Toda, Tomoki et al. | 2023
digital version
1: Sandformer: CNN and Transformer under Gated Fusion for Sand Dust Image Restoration
Shi, Jun / Wei, Bingcai / Zhou, Gang / Zhang, Liye et al. | 2023
digital version
1: Utility Polelocalization by Learning from Ambient Traces on Distributed Acoustic Sensing
Jiang, Zhuocheng / Tian, Yue / Ding, Yangmin / Ozharar, Sarper / Wang, Ting et al. | 2023
digital version
1: Multi-User Methods for Vibrational Radar Backscatter Communications
Centers, Jessica / Krolik, Jeffrey et al. | 2023
digital version
1: Target Sound Extraction with Variable Cross-Modality Clues
Li, Chenda / Qian, Yao / Chen, Zhuo / Wang, Dongmei / Yoshioka, Takuya / Liu, Shujie / Qian, Yanmin / Zeng, Michael et al. | 2023
digital version
1: Model-Free Learning of Optimal Beamformers for Passive IRS-Assisted Sumrate Maximization
Hashmi, Hassaan / Pougkakiotis, Spyridon / Kalogerias, Dionysios S. et al. | 2023
digital version
1: Strategies for Enhanced Signal Modulation Classifications Under Unknown Symbol Rates and Noise Conditions
Wang, Ruixuan / Qi, Yue / Vaezi, Mojtaba / Jiao, Xun / Amin, Moeness et al. | 2023
digital version
1: Target Velocity Estimation for Quantization-Based Cooperative MIMO Radar and Communications System
Wang, Zhen / Yan, Xuedan / He, Qian / Blum, Rick S. et al. | 2023
digital version
1: Margin-Mixup: A Method for Robust Speaker Verification In Multi-Speaker Audio
Thienpondt, Jenthe / Madhu, Nilesh / Demuynck, Kris et al. | 2023
digital version
1: Evopose: A Recursive Transformer for 3D Human Pose Estimation with Kinematic Structure Priors
Zhang, Yaqi / Lu, Yan / Liu, Bin / Zhao, Zhiwei / Chu, Qi / Yu, Nenghai et al. | 2023
digital version
1: Subspace-Based Detector For Distributed Mmwave Mimo Radar Sensors
Ahmadi, Moein / Alaee-Kerahroodi, Mohammad / M. R., Bhavani Shankar / Ottersten, Bjorn et al. | 2023
digital version
1: A Unitary Transform Based Generalized Approximate Message Passing
Zhu, Jiang / Meng, Xiangming / Lei, Xupeng / Guo, Qinghua et al. | 2023
digital version
1: Adaptive Data Augmentation for Contrastive Learning
Zhang, Yuhan / Zhu, He / Yu, Shan et al. | 2023
digital version
1: E2E Segmentation in a Two-Pass Cascaded Encoder ASR Model
Huang, W. Ronny / Chang, Shuo-Yiin / Sainath, Tara N. / He, Yanzhang / Rybach, David / David, Robert / Prabhavalkar, Rohit / Allauzen, Cyril / Peyser, Cal / Strohman, Trevor D. et al. | 2023
digital version
1: Binary Sequence Set Optimization for CDMA Applications via Mixed-Integer Quadratic Programming
Yang, Alan / Mina, Tara / Gao, Grace et al. | 2023
digital version
1: Blind Polynomial Regression
Natali, Alberto / Leus, Geert et al. | 2023
digital version
1: ERSAM: Neural Architecture Search for Energy-Efficient and Real-Time Social Ambiance Measurement
Li, Chaojian / Chen, Wenwan / Yuan, Jiayi / Lin, Yingyan Celine / Sabharwal, Ashutosh et al. | 2023
digital version
1: Statistical Analysis of Speech Disorder Specific Features to Characterise Dysarthria Severity Level
Joshy, Amlu Anna / Parameswaran, P. N. / Nair, Siddharth R. / Rajan, Rajeev et al. | 2023
digital version
1: Generalized Relative Harmonic Coefficients
Hu, Yonggang / Gannot, Sharon / Abhayapala, Thushara D. et al. | 2023
digital version
1: Perceptual–Neural–Physical Sound Matching
Han, Han / Lostanlen, Vincent / Lagrange, Mathieu et al. | 2023
digital version
1: Improved Training Of Mixture-Of-Experts Language GANs
Chai, Yekun / Yin, Qiyue / Zhang, Junge et al. | 2023
digital version
1: Spatial-Domain Object Detection Under Mimo-Fmcw Automotive Radar Interference
Jin, Sian / Wang, Pu / Boufounos, Petros / Takahashi, Ryuhei / Roy, Sumit et al. | 2023
digital version
1: I See What You Hear: A Vision-Inspired Method to Localize Words
Samragh, Mohammad / Kundu, Arnav / Hu, Ting-Yao / Chadha, Aman / Srivastava, Ashish / Cho, Minsik / Tuzel, Oncel / Naik, Devang et al. | 2023
digital version
1: Lightweight Fisher Vector Transfer Learning for Video Deduplication
Henry, Chris / Liao, Rijun / Lin, Ruiyuan / Zhang, Zhebin / Sun, Hongyu / Li, Zhu et al. | 2023
digital version
1: Difference Coarrays of Rational Arrays
Kulkarni, Pranav / Vaidyanathan, P. P. et al. | 2023
digital version
1: SIGVIC: Spatial Importance Guided Variable-Rate Image Compression
Liang, Jiaming / Liu, Meiqin / Yao, Chao / Lin, Chunyu / Zhao, Yao et al. | 2023
digital version
1: UCONV-Conformer: High Reduction of Input Sequence Length for End-to-End Speech Recognition
Andrusenko, Andrei / Nasretdinov, Rauf / Romanenko, Aleksei et al. | 2023
digital version
1: Unsupervised Noise Adaptation Using Data Simulation
Chen, Chen / Hu, Yuchen / Zou, Heqing / Sun, Linhui / Chng, Eng Siong et al. | 2023
digital version
1: Logo-Former: Local-Global Spatio-Temporal Transformer for Dynamic Facial Expression Recognition
Ma, Fuyan / Sun, Bin / Li, Shutao et al. | 2023
digital version
1: Adaptive Time-Scale Modification for Improving Speech Intelligibility Based On Phoneme Clustering For Streaming Services
Jang, Sohee / Kim, Jiye / Kim, Yeon-Ju / Chang, Joon-Hyuk et al. | 2023
digital version
1: Learning to Reconnect Interrupted Trajectories for Weakly Supervised Multi-Object Tracking
Li, Yu-Lei / Lu, Yang / Li, Jie / Wang, Hanzi et al. | 2023
digital version
1: Lego-Features: Exporting Modular Encoder Features for Streaming and Deliberation ASR
Botros, Rami / Prabhavalkar, Rohit / Schalkwyk, Johan / Chelba, Ciprian / Sainath, Tara N. / Beaufays, Francoise et al. | 2023
digital version
1: Deepspace: Dynamic Spatial and Source CUE Based Source Separation for Dialog Enhancement
Master, Aaron / Lu, Lie / Samuelsson, Jonas / Lehtonen, Heidi-Maria / Norcross, Scott / Swedlow, Nathan / Howard, Audrey et al. | 2023
digital version
1: Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution Detection
Chen, Xiongjie / Li, Yunpeng / Yang, Yongxin et al. | 2023
digital version
1: Cross-Lingual Alzheimer’s Disease Detection Based on Paralinguistic and Pre-Trained Features
Chen, Xuchu / Pu, Yu / Li, Jinpeng / Zhang, Wei-Qiang et al. | 2023
digital version
1: Multi-Carrier Wideband OCDM-Based THZ Automotive Radar
Bhattacharjee, Sangeeta / Mishra, Kumar Vijay / Annavajjala, Ramesh / Murthy, Chandra R. et al. | 2023
digital version
1: Low Precision Representations for High Dimensional Models
Saha, Rajarshi / Pilanci, Mert / Goldsmith, Andrea J. et al. | 2023
digital version
1: Hypernetwork-Based Adaptive Image Restoration
Aharon, Shai / Ben-Artzi, Gil et al. | 2023
digital version
1: Your Camera Improves Your Point Cloud Compression
Lin, Yuhuan / Xu, Tongda / Zhu, Ziyu / Li, Yanghao / Wang, Zhe / Wang, Yan et al. | 2023
digital version
1: Pseudo-Query Generation For Semi-Supervised Visual Grounding With Knowledge Distillation
Jin, Jianglin / Ye, Jiabo / Lin, Xin / He, Liang et al. | 2023
digital version
1: 2DSBG: A 2d Semi Bi-Gaussian Filter Adapted for Adjacent and Multi-Scale Line Feature Detection
Magnier, Baptiste / Shokouh, Ghulam Sakhi / Berthier, Louis / Pie, Marcel / Ruggiero, Adrien et al. | 2023
digital version
1: Estimation of High-Dimensional Differential Graphs from Multi-Attribute Data
Tugnait, Jitendra K. et al. | 2023
digital version
1: Joint Unsupervised and Supervised Learning for Context-Aware Language Identification
Park, Jinseok / Kim, Hyung Yong / Park, Jihwan / Kim, Byeong-Yeol / Choi, Shukjae / Lim, Yunkyu et al. | 2023
digital version
1: Improving Transformer-Based End-to-End Speaker Diarization by Assigning Auxiliary Losses to Attention Heads
Jeoung, Ye-Rin / Yang, Joon-Young / Choi, Jeong-Hwan / Chang, Joon-Hyuk et al. | 2023
digital version
1: On the Value of Stochastic Side Information in Online Learning
Jia, Junzhang / Wu, Xuetong / Evans, Jamie / Zhu, Jingge et al. | 2023
digital version
1: Learning Task-Aligned Mask Query for Instance Segmentation
Fu, Bin / He, Hongliang / Wei, Pengxu / Chen, Jie et al. | 2023
digital version
1: On The Primal and Dual Formulations Of The Discrete Mumford-Shah Functional
Pustelnik, Nelly et al. | 2023
digital version
1: Robust Angle Estimation for Hybrid mmWave Systems
Lin, Yuan-Pei / Yang, Ting-Ming et al. | 2023
digital version
1: On The Fairness of Multitask Representation Learning
Li, Yingcong / Oymak, Samet et al. | 2023
digital version
1: VF-Taco2: Towards Fast and Lightweight Synthesis for Autoregressive Models with Variation Autoencoder and Feature Distillation
Liu, Yuhao / Gong, Cheng / Wang, Longbiao / Wu, Xixin / Liu, Qiuyu / Dang, Jianwu et al. | 2023
digital version
1: Domain and Language Adaptation Using Heterogeneous Datasets for Wav2vec2.0-Based Speech Recognition of Low-Resource Language
Soky, Kak / Li, Sheng / Chu, Chenhui / Kawahara, Tatsuya et al. | 2023
digital version
1: Pop2Piano : Pop Audio-Based Piano Cover Generation
Choi, Jongho / Lee, Kyogu et al. | 2023
digital version
1: Multi-Lingual Pronunciation Assessment with Unified Phoneme Set and Language-Specific Embeddings
Lin, Binghuai / Wang, Liyuan et al. | 2023
digital version
1: Interpolation Filter Model For Ramanujan Subspace Signals
Kulkarni, Pranav / Vaidyanathan, P. P. et al. | 2023
digital version
1: Online Binaural Speech Separation Of Moving Speakers With A Wavesplit Network
Han, Cong / Mesgarani, Nima et al. | 2023
digital version
1: A Hybrid Deep Neural Network for Nonlinear Causality Analysis in Complex Industrial Control System
Feng, Tian / Chen, Qiming / Shi, Yao / Lang, Xun / Xie, Lei / Su, Hongye et al. | 2023
digital version
1: Autovocoder: Fast Waveform Generation from a Learned Speech Representation Using Differentiable Digital Signal Processing
Webber, Jacob J / Valentini-Botinhao, Cassia / Williams, Evelyn / Henter, Gustav Eje / King, Simon et al. | 2023
digital version
1: Self-Sufficient Framework for Continuous Sign Language Recognition
Jang, Youngjoon / Oh, Youngtaek / Cho, Jae Won / Kim, Myungchul / Kim, Dong-Jin / Kweon, In So / Son Chung, Joon et al. | 2023
digital version
1: Signal Processing On Product Spaces
Roddenberry, T. Mitchell / Grande, Vincent P. / Frantzen, Florian / Schaub, Michael T. / Segarra, Santiago et al. | 2023
digital version
1: On the Effectiveness of Monoaural Target Source Extraction for Distant end-to-end Automatic Speech Recognition
Zorila, Catalin / Doddipatla, Rama et al. | 2023
digital version
1: MAID: A Conditional Diffusion Model for Long Music Audio Inpainting
Liu, Kaiyang / Gan, Wendong / Yuan, Chenchen et al. | 2023
digital version
1: Semi-Federated Learning for Edge Intelligence with Imperfect SIC
Ni, Wanli / Zheng, Jingheng / Eldar, Yonina C. / You, Changsheng / Huang, Kaibin et al. | 2023
digital version
1: Dual Collaborative Visual-Semantic Mapping for Multi-Label Zero-Shot Image Recognition
Hu, Yunqing / Jin, Xuan / Chen, Xi / Zhang, Yin et al. | 2023
digital version
1: Topological Slepians: Maximally Localized Representations of Signals Over Simplicial Complexes
Battiloro, Claudio / Di Lorenzo, Paolo / Barbarossa, Sergio et al. | 2023
digital version
1: Efficient Feature Fusion for Learning-Based Photometric Stereo
Ju, Yakun / Lam, Kin-Man / Xiao, Jun / Zhang, Cong / Yang, Cuixin / Dong, Junyu et al. | 2023
digital version
1: Improving Scheduled Sampling for Neural Transducer-Based ASR
Moriya, Takafumi / Ashihara, Takanori / Sato, Hiroshi / Matsuura, Kohei / Tanaka, Tomohiro / Masumura, Ryo et al. | 2023
digital version
1: Unobtrusive Respiratory Monitoring System for Intensive Care
Tan, Xudong / Hu, Menghan / Zhai, Guangtao / Zhu, Yan / Li, Wenfang / Zhang, XiaoPing et al. | 2023
digital version
1: Integrating the Sensing and Radio Communications Channel Modelling From Radar Mutual Interference
Cardona, Narcis / Romero, J. Samuel / Yang, Wenfei / Li, Jian et al. | 2023
digital version
1: TDMA-Based Multi-User Binary Computation Offloading in the Finite-Block-Length Regime
Manouchehrpour, M. Amin / Lehal, Harvinder / Salmani, Mahsa / Davidson, Timothy N. et al. | 2023
digital version
1: Multispectral Image Fusion based on Super Pixel Segmentation
Ofir, Nati et al. | 2023
digital version
1: Optimal Transport with a Diversified Memory Bank for Cross-Domain Speaker Verification
Zhang, Ruiteng / Wei, Jianguo / Lu, Xugang / Lu, Wenhuan / Jin, Di / Zhang, Lin / Xu, Junhai et al. | 2023
digital version
1: Fast Low-Latency Convolution by Low-Rank Tensor Approximation
Jalmby, Martin / Elvander, Filip / van Waterschoot, Toon et al. | 2023
digital version
1: A Controllable Lifestyle Simulator for Use in Deep Reinforcement Learning Algorithms
Braz, Libio Goncalves / Susaiyah, Allmin et al. | 2023
digital version
1: BTS-E: Audio Deepfake Detection Using Breathing-Talking-Silence Encoder
Doan, Thien-Phuc / Nguyen-Vu, Long / Jung, Souhwan / Hong, Kihun et al. | 2023
digital version
1: Study of Manifold Geometry Using Multiscale Non-Negative Kernel Graphs
Hurtado, Carlos / Shekkizhar, Sarath / Ruiz-Hidalgo, Javier / Ortega, Antonio et al. | 2023
digital version
1: Learning Silhouettes with Group Sparse Autoencoders
Theodosis, Emmanouil / Ba, Demba et al. | 2023
digital version
1: ScaleMix: Intra- And Inter-Layer Multiscale Feature Combination for Change Detection
Huang, Rui / Zhao, Qingyi / Wang, Ruofei / Liu, Caihua / Gao, Sihua / Zhang, Yuxiang / Fan, Wei et al. | 2023
digital version
1: Is Multi-Task Learning an Upper Bound for Continual Learning?
Wu, Zihao / Tran, Huy / Pirsiavash, Hamed / Kolouri, Soheil et al. | 2023
digital version
1: Local Graph-Homomorphic Processing for Privatized Distributed Systems
Rizk, Elsa / Vlaski, Stefan / Sayed, Ali H. et al. | 2023
digital version
1: MASKED-AP: Attention Pyramid Convolutional Neural Network with Mask for Cervical Cell Classification
Jin, Yu / Liu, Juan / Chen, Hua / Duan, Wensi / Cao, Dehua / Pang, Baochuan et al. | 2023
digital version
1: Pondering About Task Spatial Misalignment: Classification-Localization Equilibrated Object Detection
Zhang, Yudong / Lu, Wei / Wang, Xu / Wang, Pengkun / Wang, Yang et al. | 2023
digital version
1: Multiple Access Computation Offloading for the K-User Case
Liu, Xiaomeng / Schaible, Christian / Davidson, Timothy N. et al. | 2023
digital version
1: Movienet-PS: A Large-Scale Person Search Dataset in the Wild
Qin, Jie / Zheng, Peng / Yan, Yichao / Quan, Rong / Cheng, Xiaogang / Ni, Bingbing et al. | 2023
digital version
1: Spatial Similarity Guidance for Few-Shot Segmentation
Luo, Xiaoliu / Duan, Zhao / Zhang, Taiping et al. | 2023
digital version
1: Efficient Monaural Speech Enhancement with Universal Sample Rate Band-Split RNN
Yu, Jianwei / Luo, Yi et al. | 2023
digital version
1: Code-Switching Speech Synthesis Based on Self-Supervised Learning and Domain Adaptive Speaker Encoder
Lin, Yi-Xing / Pai, Cheng-Hsun / Le, Phuong Thi / Prihasto, Bima / Huang, Chien-Ling / Wang, Jia Ching et al. | 2023
digital version
1: Mixed Sample Augmentation for Online Distillation
Shen, Yiqing / Xu, Liwu / Yang, Yuzhe / Li, Yaqian / Guo, Yandong et al. | 2023
digital version
1: Meeting Action Item Detection with Regularized Context Modeling
Liu, Jiaqing / Deng, Chong / Zhang, Qinglin / Chen, Qian / Wang, Wen et al. | 2023
digital version
1: CLMAE: A Liter and Faster Masked Autoencoders
Song, Yiran / Ma, Lizhuang et al. | 2023
digital version
1: Graph Signal Processing for Narrowband Direction of Arrival Estimation
Li, Disheng / Liu, Wei / Zakharov, Yuriy / Mitchell, Paul D et al. | 2023
digital version
1: Privacy-Preserving Automatic Speaker Diarization
Teixeira, Francisco / Abad, Alberto / Raj, Bhiksha / Trancoso, Isabel et al. | 2023
digital version
1: An End-to-End Neural Network for Image-to-Audio Transformation
Chen, Liu / Deisher, Michael / Georges, Munir et al. | 2023
digital version
1: Joint Multi-Level Feature Network for Lightweight Person Re-Identification
Zhang, Yunzuo / Kang, Weili / Liu, Yameng / Zhu, Pengfei et al. | 2023
digital version
1: Learning Cross-Modal Audiovisual Representations with Ladder Networks for Emotion Recognition
Goncalves, Lucas / Busso, Carlos et al. | 2023
digital version
1: Quantized Precoding and RIS-Assisted Modulation for Integrated Sensing and Communications Systems
Prasobh Sankar, R. S. / Prabhakar Chepuri, Sundeep et al. | 2023
digital version
1: Towards Adversarially Robust Continual Learning
Bai, Tao / Chen, Chen / Lyu, Lingjuan / Zhao, Jun / Wen, Bihan et al. | 2023
digital version
1: Ultimate Negative Sampling for Contrastive Learning
Guo, Huijie / Shi, Lei et al. | 2023
digital version
1: A Holistic Cascade System, Benchmark, and Human Evaluation Protocol for Expressive Speech-to-Speech Translation
Huang, Wen-Chin / Peloquin, Benjamin / Kao, Justine / Wang, Changhan / Gong, Hongyu / Salesky, Elizabeth / Adi, Yossi / Lee, Ann / Chen, Peng-Jen et al. | 2023
digital version
1: T5lephone: Bridging Speech and Text Self-Supervised Models for Spoken Language Understanding Via Phoneme Level T5
Hsu, Chan-Jan / Chung, Ho-Lam / Lee, Hung-Yi / Tsao, Yu et al. | 2023
digital version
1: CD-FSOD: A Benchmark For Cross-Domain Few-Shot Object Detection
Xiong, Wuti et al. | 2023
digital version
1: Elliptical Wishart Distribution: Maximum Likelihood Estimator from Information Geometry
Ayadi, Imen / Bouchard, Florent / Pascal, Frederic et al. | 2023
digital version
1: Distributed Bayesian Tracking on the Special Euclidean Group Using Lie Algebra Parametric Approximations
Bordin, Claudio J. / de Figueredo, Caio G. / Bruno, Marcelo G. S. et al. | 2023
digital version
1: Asynchronous Social Learning
Cemri, Mert / Bordignon, Virginia / Kayaalp, Mert / Shumovskaia, Valentina / Sayed, Ali H. et al. | 2023
digital version
1: Cramér-Rao Bound on Lie Groups with Observations on Lie Groups: Application to SE(2)
Labsir, Samy / Renaux, Alexandre / Vila-Valls, Jordi / Chaumette, Eric et al. | 2023
digital version
1: D2Former: A Fully Complex Dual-Path Dual-Decoder Conformer Network Using Joint Complex Masking and Complex Spectral Mapping for Monaural Speech Enhancement
Zhao, Shengkui / Ma, Bin et al. | 2023
digital version
1: Extended Kalman Filter for Graph Signals in Nonlinear Dynamic Systems
Sagi, Guy / Shlezinger, Nir / Routtenberg, Tirza et al. | 2023
digital version
1: Perspective Projection-Based 3d CT Reconstruction from Biplanar X-Rays
Kyung, Daeun / Jo, Kyungmin / Choo, Jaegul / Lee, Joonseok / Choi, Edward et al. | 2023
digital version
1: Tg-Critic: A Timbre-Guided Model For Reference-Independent Singing Evaluation
Sun, Xiaoheng / Gao, Yuejie / Lin, Hanyao / Liu, Huaping et al. | 2023
digital version
1: Exploration of Language Dependency for Japanese Self-Supervised Speech Representation Models
Ashihara, Takanori / Moriya, Takafumi / Matsuura, Kohei / Tanaka, Tomohiro et al. | 2023
digital version
1: Frequency Bin-Wise Single Channel Speech Presence Probability Estimation Using Multiple DNNS
Tao, Shuai / Reddy, Himavanth / Jensen, Jesper Rindom / Christensen, Mads Grasboll et al. | 2023
digital version
1: Structural Optimization of Factor Graphs for Symbol Detection via Continuous Clustering and Machine Learning
Rapp, Lukas / Schmid, Luca / Rode, Andrej / Schmalen, Laurent et al. | 2023
digital version
1: Selective Film Conditioning with CTC-Based ASR Probability for Speech Enhancement
Yang, Da-Hee / Chang, Joon-Hyuk et al. | 2023
digital version
1: Egocentric Action Anticipation for Personal Health
Rodin, Ivan / Furnari, Antonino / Mavroeidis, Dimitrios / Farinella, Giovanni Maria et al. | 2023
digital version
1: Enhanced Low-Resolution LiDAR-Camera Calibration via Depth Interpolation and Supervised Contrastive Learning
Zhang, Zhikang / Yu, Zifan / You, Suya / Rao, Raghuveer / Agarwal, Sanjeev / Ren, Fengbo et al. | 2023
digital version
1: SCSGNet: Spatial-Correlated and Shape-Guided Network for Breast Mass Segmentation
Li, Qingqiu / Xu, Jilan / Yuan, Runtian / Zhang, Yuejie / Feng, Rui et al. | 2023
digital version
1: A Progressive Neural Network for Acoustic Echo Cancellation
Chen, Zhuangqi / Xia, Xianjun / Sun, Siyu / Wang, Ziqian / Chen, Cheng / Xie, Guoliang / Zhang, Pingjian / Xiao, Yijian et al. | 2023
digital version
1: Ensemble Knowledge Distillation of Self-Supervised Speech Models
Huang, Kuan -Po / Feng, Tzu-Hsun / Fu, Yu-Kuan / Hsu, Tsu-Yuan / Yen, Po-Chieh / Tseng, Wei-Cheng / Chang, Kai-Wei / Lee, Hung-Yi et al. | 2023
digital version
1: On Crowdsourcing-Design with Comparison Category Rating for Evaluating Speech Enhancement Algorithms
Suarez, Angelica S. Z. / Laroche, Clement / Clemmensen, Line H. / Das, Sneha et al. | 2023
digital version
1: Rate-Distortion Optimization with Alternative References for UGC Video Compression
Xiong, Xin / Pavez, Eduardo / Ortega, Antonio / Adsumilli, Balu et al. | 2023
digital version
1: Audiodec: An Open-Source Streaming High-Fidelity Neural Audio Codec
Wu, Yi-Chiao / Gebru, Israel D. / Markovic, Dejan / Richard, Alexander et al. | 2023
digital version
1: Image Reconstruction without Explicit Priors
Gao, Angela F. / Leong, Oscar / Sun, He / Bouman, Katherine L. et al. | 2023
digital version
1: Classification via Subspace Learning Machine (SLM): Methodology and Performance Evaluation
Fu, Hongyu / Yang, Yijing / Mishra, Vinod K. / Jay Kuo, C.-C. et al. | 2023
digital version
1: A Multi-Scale Feature Aggregation Based Lightweight Network for Audio-Visual Speech Enhancement
Xu, Haitao / Wei, Liangfa / Zhang, Jie / Yang, Jianming / Wang, Yannan / Gao, Tian / Fang, Xin / Dai, Lirong et al. | 2023
digital version
1: Multi-Scale Compositional Constraints for Representation Learning on Videos
Paraskevopoulos, Georgios / Lavania, Chandrashekhar / Chum, Lovish / Sundaram, Shiva et al. | 2023
digital version
1: Enhanced GM-PHD Filter for Real Time Satellite Multi-Target Tracking
Aguilar, Camilo / Ortner, Mathias / Zerubia, Josiane et al. | 2023
digital version
1: De’hubert: Disentangling Noise in a Self-Supervised Model for Robust Speech Recognition
Ng, Dianwen / Zhang, Ruixi / Yip, Jia Qi / Yang, Zhao / Ni, Jinjie / Zhang, Chong / Ma, Yukun / Ni, Chongjia / Chng, Eng Siong / Ma, Bin et al. | 2023
digital version
1: Weakly- and Semi-Supervised Object Localization
Huang, Zhen-Tang / Chen, Yan-He / Yeh, Mei-Chen et al. | 2023
digital version
1: Torchaudio-Squim: Reference-Less Speech Quality and Intelligibility Measures in Torchaudio
Kumar, Anurag / Tan, Ke / Ni, Zhaoheng / Manocha, Pranay / Zhang, Xiaohui / Henderson, Ethan / Xu, Buye et al. | 2023
digital version
1: Coarse-to-Fine Covid-19 Segmentation via Vision-Language Alignment
Shan, Dandan / Li, Zihan / Chen, Wentao / Li, Qingde / Tian, Jie / Hong, Qingqi et al. | 2023
digital version
1: EMC²-Net: Joint Equalization and Modulation Classification Based on Constellation Network
Ryu, Hyun / Choi, Junil et al. | 2023
digital version
1: Ripple Sparse Self-Attention for Monaural Speech Enhancement
Zhang, Qiquan / Zhu, Hongxu / Song, Qi / Qian, Xinyuan / Ni, Zhaoheng / Li, Haizhou et al. | 2023
digital version
1: A Physically Explainable Framework for Human-Related Anomaly Detection
Jiang, Yalong / Li, Huining / Li, Changkang et al. | 2023
digital version
1: Noncoherent Multiuser Grassmannian Constellations for the Mimo Multiple Access Channel
Alvarez-Vizoso, Javier / Cuevas, Diego / Beltran, Carlos / Santamaria, Ignacio / Tucek, Vit / Peters, Gunnar et al. | 2023
digital version
1: Identifying Source Speakers for Voice Conversion Based Spoofing Attacks on Speaker Verification Systems
Cai, Danwei / Cai, Zexin / Li, Ming et al. | 2023
digital version
1: A Compensated Shrinkage Affine Projection Algorithm for Debiased Sparse Adaptive Filtering
Zhang, Yi / Yamada, Isao et al. | 2023
digital version
1: Cross-Domain Object Classification Via Successive Subspace Alignment
Chen, Kecheng / Li, Haoliang / Yan, Hong et al. | 2023
digital version
1: Textless Direct Speech-to-Speech Translation with Discrete Speech Representation
Li, Xinjian / Jia, Ye / Chiu, Chung-Cheng et al. | 2023
digital version
1: Speaker-Independent Acoustic-to-Articulatory Speech Inversion
Wu, Peter / Chen, Li-Wei / Cho, Cheol Jun / Watanabe, Shinji / Goldstein, Louis / Black, Alan W / Anumanchipalli, Gopala K. et al. | 2023
digital version
1: Single-Photon Image Super-Resolution via Self-Supervised Learning
Chen, Yiwei / Jiang, Chen / Pan, Yu et al. | 2023
digital version
1: TSPTQ-ViT: Two-Scaled Post-Training Quantization for Vision Transformer
Tai, Yu-Shan / Lin, Ming-Guang / Wu, An-Yeu Andy et al. | 2023
digital version
1: Sparse Error Correction for Power Network Parameters
Senaratne, Dilan / Kim, Jinsub et al. | 2023
digital version
1: An Evaluation Platform to Scope Performance of Synthetic Environments in Autonomous Ground Vehicles Simulation
Bai, Xiangyu / Jiang, Le / Luo, Yedi / Gupta, Aniket / Kaveti, Pushyami / Singh, Hanumant / Ostadabbas, Sarah et al. | 2023
digital version
1: Quaternion Orthogonal Transformer for Facial Expression Recognition in the Wild
Zhou, Yu / Guo, Liyuan / Jin, Lianghai et al. | 2023
digital version
1: HQP-MVS:High-Quality Plane Priors Assisted Multi-View Stereo for Low-Textured Areas
Tian, Zefan / Wang, Rongjie / Wang, Zhenyu / Wang, Ronggang et al. | 2023
digital version
1: Daily Mental Health Monitoring from Speech: A Real-World Japanese Dataset and Multitask Learning Analysis
Song, Meishu / Triantafyllopoulos, Andreas / Yang, Zijiang / Takeuchi, Hiroki / Nakamura, Toru / Kishi, Akifumi / Ishizawa, Tetsuro / Yoshiuchi, Kazuhiro / Jing, Xin / Karas, Vincent et al. | 2023
digital version
1: ICCRN: Inplace Cepstral Convolutional Recurrent Neural Network for Monaural Speech Enhancement
Liu, Jinjiang / Zhang, Xueliang et al. | 2023
digital version
1: CROSSSPEECH: Speaker-Independent Acoustic Representation for Cross-Lingual Speech Synthesis
Kim, Ji-Hoon / Yang, Hong-Sun / Ju, Yoon-Cheol / Kim, Il-Hwan / Kim, Byeong-Yeol et al. | 2023
digital version
1: Ensemble Prosody Prediction For Expressive Speech Synthesis
Teh, Tian Huey / Hu, Vivian / Ram Mohan, Devang S / Hodari, Zack / Wallis, Christopher G. R. / Gomez Ibarrondo, Tomas / Torresquintero, Alexandra / Leoni, James / Gales, Mark / King, Simon et al. | 2023
digital version
1: Progressive Meta-Pooling Learning for Lightweight Image Classification Model
Dong, Peijie / Niu, Xin / Tian, Zhiliang / Li, Lujun / Wang, Xiaodong / Wei, Zimian / Pan, Hengyue / Li, Dongsheng et al. | 2023
digital version
1: Euro: Espnet Unsupervised ASR Open-Source Toolkit
Gao, Dongji / Shi, Jiatong / Chuang, Shun-Po / Garcia, Leibny Paola / Lee, Hung-Yi / Watanabe, Shinji / Khudanpur, Sanjeev et al. | 2023
digital version
1: Learning Generalizable Light Field Networks from Few Images
Li, Qian / Multon, Franck / Boukhayma, Adnane et al. | 2023
digital version
1: Cross-Domain Diffusion Based Speech Enhancement for Very Noisy Speech
Wang, Heming / Wang, DeLiang et al. | 2023
digital version
1: A Few Shot Learning of Singing Technique Conversion Based on Cycle Consistency Generative Adversarial Networks
Chen, Po-Wei / Soo, Von-Wun et al. | 2023
digital version
1: Compressed Distributed Regression over Adaptive Networks
Carpentiero, Marco / Matta, Vincenzo / Sayed, Ali H. et al. | 2023
digital version
1: An Approach to Ontological Learning from Weak Labels
Shah, Ankit / Tang, Larry / Chou, Po Hao / Zheng, Yi Yu / Ge, Ziqian / Raj, Bhiksha et al. | 2023
digital version
1: Sequential Datum–Wise Joint Feature Selection and Classification in the Presence of External Classifier
Ekanayake, Sachini Piyoni / Zois, DaphneynStavroula / Chelmis, Charalampos et al. | 2023
digital version
1: Learning From Label Proportion with Online Pseudo-Label Decision by Regret Minimization
Matsuo, Shinnosuke / Bise, Ryoma / Uchida, Seiichi / Suehiro, Daiki et al. | 2023
digital version
1: Predictive Skim: Contrastive Predictive Coding for Low-Latency Online Speech Separation
Li, Chenda / Wu, Yifei / Qian, Yanmin et al. | 2023
digital version
1: Fine-Grained Emotional Control of Text-to-Speech: Learning to Rank Inter- and Intra-Class Emotion Intensities
Wang, Shijun / Guenason, Jon / Borth, Damian et al. | 2023
digital version
1: Role of Bias Terms in Dot-Product Attention
Namazifar, Mahdi / Hazarika, Devamanyu / Hakkani-Tur, Dilek et al. | 2023
digital version
1: Learning Interpretable Filters In Wav-UNet For Speech Enhancement
Mathieu, Felix / Courtat, Thomas / Richard, Gael / Peeters, Geoffroy et al. | 2023
digital version
1: Cochlear Decomposition: A Novel Bio-Inspired Multiscale Analysis Framework
Alfalahi, Hessa / Khandoker, Ahsan / Alhussein, Ghada / Hadjileontiadis, Leontios et al. | 2023
digital version
1: Contrastive Learning of Sentence Embeddings in Product Search
Zhang, Bo-Wen / Yan, Yan / Yu, Jiapei et al. | 2023
digital version
1: Leveraging Sparsity with Spiking Recurrent Neural Networks for Energy-Efficient Keyword Spotting
Dampfhoffer, Manon / Mesquida, Thomas / Hardy, Emmanuel / Valentian, Alexandre / Anghel, Lorena et al. | 2023
digital version
1: A Quantum Approach for Stochastic Constrained Binary Optimization
Gupta, Sarthak / Kekatos, Vassilis et al. | 2023
digital version
1: Joint Antenna Selection and Beamforming in Integrated Automotive Radar Sensing-Communications with Quantized Double Phase Shifters
Xu, Lifan / Sun, Shunqiao / Zhang, Yimin D. / Petropulu, Athina et al. | 2023
digital version
1: MODEFORMER: Modality-Preserving Embedding For Audio-Video Synchronization Using Transformers
Gupta, Akash / Tripathi, Rohun / Jang, Wondong et al. | 2023
digital version
1: Semi-Supervised Learning with Per-Class Adaptive Confidence Scores for Acoustic Environment Classification with Imbalanced Data
Fiorio, Luan Vinicius / Karanov, Boris / David, Johan / Houtum, Wim van / Widdershoven, Frans / Aarts, Ronald M. et al. | 2023
digital version
1: Database-Aware ASR Error Correction for Speech-to-SQL Parsing
Shao, Yutong / Kumar, Arun / Nakashole, Ndapa et al. | 2023
digital version
1: Convolutional Filtering on Sampled Manifolds
Wang, Zhiyang / Ruiz, Luana / Ribeiro, Alejandro et al. | 2023
digital version
1: A Database for Multi-Modal Short Video Quality Assessment
Zhang, Yukun / Wang, Chuan / Zhang, Sanyi / Cao, Xiaochun et al. | 2023
digital version
1: Diagonal State Space Augmented Transformers for Speech Recognition
Saon, George / Gupta, Ankit / Cui, Xiaodong et al. | 2023
digital version
1: Unrestricted Anchor Graph Based GCN for Incomplete Multi-View Clustering
Zhao, Liang / Wang, Zihao / Yuan, Yukun / Ding, Feng et al. | 2023
digital version
1: Wave-U-Net Discriminator: Fast and Lightweight Discriminator for Generative Adversarial Network-Based Speech Synthesis
Kaneko, Takuhiro / Kameoka, Hirokazu / Tanaka, Kou / Seki, Shogo et al. | 2023
digital version
1: High-Dimensional Confidence Regions in Sparse MRI
Hoppe, Frederik / Krahmer, Felix / Mayrink Verdun, Claudio / Menzel, Marion I. / Rauhut, Holger et al. | 2023
digital version
1: Towards Efficient and Optimal Joint Beamforming and Antenna Selection: A Machine Learning Approach
Shrestha, Sagar / Fu, Xiao / Hong, Mingyi et al. | 2023
digital version
1: Quantum Graph Transformers
Kollias, Georgios / Kalantzis, Vassilis / Salonidis, Theodoros / Ubaru, Shashanka et al. | 2023
digital version
1: Deep3DSketch: 3D Modeling from Free-Hand Sketches with View- and Structural-Aware Adversarial Training
Chen, Tianrun / Fu, Chenglong / Zhu, Lanyun / Mao, Papa / Zhang, Jia / Zang, Ying / Sun, Lingyun et al. | 2023
digital version
1: PhaseAug: A Differentiable Augmentation for Speech Synthesis to Simulate One-to-Many Mapping
Lee, Junhyeok / Han, Seungu / Cho, Hyunjae / Jung, Wonbin et al. | 2023
digital version
1: A Method of Constructing and Automatically Labeling Radio Frequency Signal Training Dataset for UAV
Liu, Chao / Ma, Ruipeng / Si, Zheng / Chi, Mingmin et al. | 2023
digital version
1: An Online Algorithm for Contrastive Principal Component Analysis
Golkar, Siavash / Lipshutz, David / Tesileanu, Tiberiu / Chklovskii, Dmitri B. et al. | 2023
digital version
1: Small-Footprint Slimmable Networks for Keyword Spotting
Akhtar, Zuhaib / Khursheed, Mohammad Omar / Du, Dongsu / Liu, Yuzong et al. | 2023
digital version
1: UFO2: A Unified Pre-Training Framework for Online and Offline Speech Recognition
Fu, Li / Li, Siqi / Li, Qingtao / Deng, Liping / Li, Fangzhu / Fan, Lu / Chen, Meng / He, Xiaodong et al. | 2023
digital version
1: Audio Coding With Unified Noise Shaping And Phase Contrast Control
Jo, Byeongho / Beack, Seungkwon / Lee, Taejin et al. | 2023
digital version
1: Learning To Locate Visual Answer In Video Corpus Using Question
Li, Bin / Weng, Yixuan / Sun, Bin / Li, Shutao et al. | 2023
digital version
1: ECG Artifact Removal from Single-Channel Surface EMG Using Fully Convolutional Networks
Wang, Kuan-Chen / Liu, Kai-Chun / Peng, Sheng-Yu / Tsao, Yu et al. | 2023
digital version
1: K²NN: Self-Supervised Learning with Hierarchical Nearest Neighbors for Remote Sensing
Yuan, Jianlong / Xu, Yuanhong / Wang, Zhibin et al. | 2023
digital version
1: Approximation Error Back-Propagation for Q-Function in Scalable Reinforcement Learning with Tree Dependence Structure
Yan, Yuzi / Dong, Yu / Ma, Kai / Shen, Yuan et al. | 2023
digital version
1: Multi-Resolution Sequence Aggregation and Model-Agnostic Framework for Time-Series Forecasting
Lyu, Juhyun / Yang, Jinseok / Kim, Junghee / Lim, Woohyung / Ahn, Wonbin / Kang, Dongwan / Kim, Minjae / Kim, Nam Soo et al. | 2023
digital version
1: DMSA: Dynamic Multi-Scale Unsupervised Semantic Segmentation Based On Adaptive Affinity
Yang, Kun / Lu, Jun et al. | 2023
digital version
1: A Discriminative Multi-Channel Noise Feature Representation Model for Image Manipulation Localization
Zhou, Yang / Wang, Hongxia / Zeng, Qiang / Zhang, Rui / Meng, Sijiang et al. | 2023
digital version
1: Incorporating Visual Information Reconstruction into Progressive Learning for Optimizing audio-visual Speech Enhancement
Zhang, Chen-Yue / Chen, Hang / Du, Jun / Yin, Bao-Cai / Pan, Jia / Lee, Chin-Hui et al. | 2023
digital version
1: Equivalence of Aperture Reduction in Element Space and Constrained Combination of DFT Beams in Beamspace
Rakhimov, Damir / Haardt, Martin et al. | 2023
digital version
1: Contrastive Learning at the Relation and Event Level for Rumor Detection
Xu, Yingrui / Hu, Jingyuan / Ge, Jingguo / Wu, Yulei / Li, Tong / Li, Hui et al. | 2023
digital version
1: Beamforming Optimization in RIS-Aided Mimo Systems Under Multiple-Reflection Effects
Wijekoon, Dilki / Mezghani, Amine / Hossain, Ekram et al. | 2023
digital version
1: EEG2IMAGE: Image Reconstruction from EEG Brain Signals
Singh, Prajwal / Pandey, Pankaj / Miyapuram, Krishna / Raman, Shanmuganathan et al. | 2023
digital version
1: Dual Meta Calibration Mix for Improving Generalization in Meta-Learning
Mi, Ze-Yu / Yang, Yu-Bin et al. | 2023
digital version
1: Implicit Bayes Adaptation: A Collaborative Transport Approach
Jiang, Bo / Krim, Hamid / Wu, Tianfu / Cansever, Derya et al. | 2023
digital version
1: Blind Source Counting and Separation with Relative Harmonic Coefficients
Sun, Huiyuan / Samarasinghe, Prasanga / Abhayapala, Thushara et al. | 2023
digital version
1: YOLOX-B: A Better Yolox Model for Real-Time Driver Behavior Detection
Guo, Xu / Ma, Ming / Zhang, Jiaqiang / Li, Shaojie et al. | 2023
digital version
1: Active Noise Control over 3D Space: A Realistic Error Microphone Geometry Design
Sun, Huiyuan / Samarasinghe, Prasanga / Abhayapala, Thushara et al. | 2023
digital version
1: A Multi-Stage Hierarchical Relational Graph Neural Network for Multimodal Sentiment Analysis
Gong, Peizhu / Liu, Jin / Zhang, Xiliang / Li, Xingye et al. | 2023
digital version
1: Single-Sample Direction-of-Arrival Estimation for Fast and Robust 3D Localization With Real Measurements from a Massive MIMO System
Mazokha, Stepan / Naderi, Sanaz / Orfanidis, Georgios I. / Sklivanitis, George / Pados, Dimitris A. / Hallstrom, Jason O. et al. | 2023
digital version
1: Low in Resolution, High in Precision: UAV Detection with Super-Resolution and Motion Information Extraction
Wang, Hanzhuo / Wang, Xingjian / Zhou, Chengwei / Meng, Wenchao / Shi, Zhiguo et al. | 2023
digital version
1: Continuous Descriptor-Based Control for Deep Audio Synthesis
Devis, Ninon / Demerle, Nils / Nabi, Sarah / Genova, David / Esling, Philippe et al. | 2023
digital version
1: SSGD: A Smartphone Screen Glass Dataset for Defect Detection
Han, Haonan / Yang, Rui / Li, Shuyan / Hu, Runze / Li, Xiu et al. | 2023
digital version
1: Leveraging Phone-Level Linguistic-Acoustic Similarity For Utterance-Level Pronunciation Scoring
Liu, Wei / Fu, Kaiqi / Tian, Xiaohai / Shi, Shuju / Li, Wei / Ma, Zejun / Lee, Tan et al. | 2023
digital version
1: Learning Unbiased Rewards with Mutual Information in Adversarial Imitation Learning
Zhang, Lihua / Liu, Quan / Huang, Zhigang / Wu, Lan et al. | 2023
digital version
1: Parasympathetic-Sympathetic Causal Interactions and Perceived Workload for Varying Difficulty Affective Computing Tasks
Lavanuru, Pravallika / Pratiher, Sawon / Sahoo, Karuna P. / Acharya, Mrinal / S, Sreejith / Ghosh, Nirmalya / Patra, Amit et al. | 2023
digital version
1: Picking the Underused Heads: A Network Pruning Perspective of Attention Head Selection for Fusing Dialogue Coreference Information
Liu, Zhengyuan / Chen, Nancy F. et al. | 2023
digital version
1: Deep Plug-and-Play for Tensor Robust Principal Component Analysis
Tan, Hao / Wang, Jianjun / Kong, Weichao et al. | 2023
digital version
1: Contrastive Learning-Based Audio to Lyrics Alignment for Multiple Languages
Durand, Simon / Stoller, Daniel / Ewert, Sebastian et al. | 2023
digital version
1: Robust Knowledge Distillation from RNN-T Models with Noisy Training Labels Using Full-Sum Loss
Zeineldeen, Mohammad / Audhkhasi, Kartik / Baskar, Murali Karthick / Ramabhadran, Bhuvana et al. | 2023
digital version
1: Hiding Speaker’s Sex in Speech Using Zero-Evidence Speaker Representation in an Analysis/Synthesis Pipeline
Noe, Paul-Gauthier / Miao, Xiaoxiao / Wang, Xin / Yamagishi, Junichi / Bonastre, Jean-Francois / Matrouf, Driss et al. | 2023
digital version
1: ICEL: Learning with Inconsistent Explanations
Liu, Biao / Wu, Xiaoyu / Yuan, Bo et al. | 2023
digital version
1: Facial Texure Perceiver: Towards High-Fidelity Facial Texture Recovery with Input-Level Inductive Biased Perceiver IO
Lee, Seungeun et al. | 2023
digital version
1: Single-Shot Domain Adaptation via Target-Aware Generative Augmentations
Subramanyam, Rakshith / Thopalli, Kowshik / Berman, Spring / Turaga, Pavan / Thiagarajan, Jayaraman J. et al. | 2023
digital version
1: Distance-Based Weight Transfer for Fine-Tuning From Near-Field to Far-Field Speaker Verification
Zhang, Li / Wang, Qing / Wang, Hongji / Li, Yue / Rao, Wei / Wang, Yannan / Xie, Lei et al. | 2023
digital version
1: Efficient and Effective Multi-Camera Pose Estimation with Weighted M-Estimate Sample Consensus
Lin, Xinyu / Zhou, Yingjie / Zhang, Xun / Liu, Yipeng / Zhu, Ce et al. | 2023
digital version
1: Paaploss: A Phonetic-Aligned Acoustic Parameter Loss for Speech Enhancement
Yang, Muqiao / Konan, Joseph / Bick, David / Zeng, Yunyang / Han, Shuo / Kumar, Anurag / Watanabe, Shinji / Raj, Bhiksha et al. | 2023
digital version
1: A Novel Extrapolation Technique to Accelerate WMMSE
Zhou, Kaiwen / Chen, Zhilin / Liu, Guochen / Chen, Zhitang et al. | 2023
digital version
1: Improving Non-Autoregressive Speech Recognition with Autoregressive Pretraining
Li, Yanjia / Samarakoon, Lahiru / Fung, Ivan et al. | 2023
digital version
1: CORSD: Class-Oriented Relational Self Distillation
Yu, Muzhou / Tan, Sia Huat / Wu, Kailu / Dong, Runpei / Zhang, Linfeng / Ma, Karsheng et al. | 2023
digital version
1: Short-Segment Speaker Verification Using ECAPA-TDNN with Multi-Resolution Encoder
Han, Sangwook / Ahn, Youngdo / Kang, Kyeongmuk / Shin, Jong Won et al. | 2023
digital version
1: Prefix Tuning for Automated Audio Captioning
Kim, Minkyu / Sung-Bin, Kim / Oh, Tae-Hyun et al. | 2023
digital version
1: Real-Time Multichannel Speech Separation and Enhancement Using a Beamspace-Domain-Based Lightweight CNN
Olivieri, Marco / Comanducci, Luca / Pezzoli, Mirco / Balsarri, Davide / Menescardi, Luca / Buccoli, Michele / Pecorino, Simone / Grosso, Antonio / Antonacci, Fabio / Sarti, Augusto et al. | 2023
digital version
1: LongFNT: Long-Form Speech Recognition with Factorized Neural Transducer
Gong, Xun / Wu, Yu / Li, Jinyu / Liu, Shujie / Zhao, Rui / Chen, Xie / Qian, Yanmin et al. | 2023
digital version
1: WIFI-Based Robust Child Presence Detection for Smart Cars
Jayaweera, Sakila S. / Wang, Beibei / Zeng, Xiaolu / Wang, Wei-Hsiang / Ray Liu, K. J. et al. | 2023
digital version
1: CANDY: Category-Kernelized Dynamic Convolution for Instance Segmentation
Lu, Yao / Chen, Zhiyi / Chen, Zehui / Hu, Jie / Cao, Liujuan / Zhang, Shengchuan et al. | 2023
digital version
1: Distance-Based Online Label Inference Attacks Against Split Learning
Liu, Junlin / Lyu, Xinchen et al. | 2023
digital version
1: Combining the Silhouette and Skeleton Data for Gait Recognition
Wang, Likai / Han, Ruize / Feng, Wei et al. | 2023
digital version
1: Comparing Decentralized Gradient Descent Approaches and Guarantees
Moothedath, Shana / Vaswani, Namrata et al. | 2023
digital version
1: Multi-Speaker and Wide-Band Simulated Conversations as Training Data for End-to-End Neural Diarization
Landini, Federico / Diez, Mireia / Lozano-Diez, Alicia / Burget, Lukas et al. | 2023
digital version
1: D-CONFORMER: Deformable Sparse Transformer Augmented Convolution for Voxel-Based 3D Object Detection
Zhao, Xiao / Su, Liuzhen / Zhang, Xukun / Yang, Dingkang / Sun, Mingyang / Wang, Shunli / Zhai, Peng / Zhang, Lihua et al. | 2023
digital version
1: Spatial Inference Using Censored Multiple Testing with Fdr Control
Golz, Martin / Zoubir, Abdelhak M. / Koivunen, Visa et al. | 2023
digital version
1: Runtime Prediction of Machine Learning Algorithms in Automl Systems
Dube, Parijat / Salonidis, Theodoros / Ram, Parikshit / Verma, Ashish et al. | 2023
digital version
1: Transformer-Based Bioacoustic Sound Event Detection on Few-Shot Learning Tasks
You, Liwen / Coyotl, Erika Pelaez / Gunturu, Suren / Van Segbroeck, Maarten et al. | 2023
digital version
1: Unlimited Sampling in Phase Space
Zhang, Peiyu / Bhandari, Ayush et al. | 2023
digital version
1: Integrated Sensing and Full-Duplex Communication: Joint Transceiver Beamforming and Power Allocation
He, Zhenyao / Xu, Wei / Shen, Hong / Kwan Ng, Derrick Wing / Eldar, Yonina C. / You, Xiaohu et al. | 2023
digital version
1: Online Model Compression for Federated Learning with Large Models
Yang, Tien-Ju / Xiao, Yonghui / Motta, Giovanni / Beaufays, Francoise / Mathews, Rajiv / Chen, Mingqing et al. | 2023
digital version
1: Active Beam Tracking with Reconfigurable Intelligent Surface
Han, Han / Jiang, Tao / Yu, Wei et al. | 2023
digital version
1: A Magnetic Framelet-Based Convolutional Neural Network for Directed Graphs
Lin, Lequan / Gao, Junbin et al. | 2023
digital version
1: An Edge Alignment-Based Orientation Selection Method for Neutron Tomography
Yang, Diyu / Tang, Shimin / Venkatakrishnan, Singanallur V. / Chowdhury, Mohammad S. N. / Zhang, Yuxuan / Bilheux, Hassina Z. / Buzzard, Gregery T. / Bouman, Charles A. et al. | 2023
digital version
1: SMUG: Towards Robust Mri Reconstruction by Smoothed Unrolling
Li, Hui / Jia, Jinghan / Liang, Shijun / Yao, Yuguang / Ravishankar, Saiprasad / Liu, Sijia et al. | 2023
digital version
1: Weavspeech: Data Augmentation Strategy For Automatic Speech Recognition Via Semantic-Aware Weaving
Seo, Kyusung / Park, Joonhyung / Song, Jaeyun / Yang, Eunho et al. | 2023
digital version
1: CTTSR: A Hybrid CNN-Transformer Network for Scene Text Image Super-Resolution
Dai, Kaiwei / Kang, Nan / Kuang, Li et al. | 2023
digital version
1: M22: Rate-Distortion Inspired Gradient Compression
Liu, Yangyi / Salehkalaibar, Sadaf / Rini, Stefano / Chen, Jun et al. | 2023
digital version
1: Joint Training of Hierarchical GANs and Semantic Segmentation for Expression Translation
Bodur, Rumeysa / Bhattarai, Binod / Kim, Tae-Kyun et al. | 2023
digital version
1: Performance Comparison of TTS Models for Brazilian Portuguese to Establish a Baseline
Lobato, Wilmer / Farias, Felipe / Cruz, William / Amadeus, Marcellus et al. | 2023
digital version
1: On Adversarial Robustness of Audio Classifiers
Lu, Kangkang / Nguyen, Manh Cuong / Xu, Xun / Foo, Chuan Sheng et al. | 2023
digital version
1: Audio-Driven High Definetion and Lip-Synchronized Talking Face Generation Based on Face Reenactment
Wang, Xianyu / Zhang, Yuhan / He, Weihua / Wang, Yaoyuan / Li, Minglei / Wang, Yuchen / Zhang, Jingyi / Zhou, Shunbo / Zhang, Ziyang et al. | 2023
digital version
1: Text-To-Speech Synthesis Based on Latent Variable Conversion Using Diffusion Probabilistic Model and Variational Autoencoder
Yasuda, Yusuke / Toda, Tomoki et al. | 2023
digital version
1: Representation Learning of Clinical Multivariate Time Series with Random Filter Banks
Keshavarzian, Alireza / Salehinejad, Hojjat / Valaee, Shahrokh et al. | 2023
digital version
1: Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation
Lam, Tsz Kin / Schamoni, Shigehiko / Riezler, Stefan et al. | 2023
digital version
1: SDRNet: Shape Decoupled Regression Network for 3d face Reconstruction
Zhang, Shikun / Song, Fengyi / Song, Ge / Yang, Ming et al. | 2023
digital version
1: IR-ECG: Invertible Reconstruction of ECG
Wang, Peng / Huang, Xi / Cui, Li et al. | 2023
digital version
1: Data Leakage in Cross-Modal Retrieval Training: A Case Study
Weck, Benno / Serra, Xavier et al. | 2023
digital version
1: EfficientSpeech: An On-Device Text to Speech Model
Atienza, Rowel et al. | 2023
digital version
1: Subband Dependency Modeling for Sound Event Detection
Guan, Yadong / Zheng, Guibin / Han, Jiqing / Wang, Huanliang et al. | 2023
digital version
1: Tracking Targets in Hyper-Scale Cameras Using Movement Predication
Yu, Jiaping / Zhou, Tongqing / Cai, Zhiping / Kuang, Wenyuan et al. | 2023
digital version
1: Revisit Out-Of-Vocabulary Problem For Slot Filling: A Unified Contrastive Framework With Multi-Level Data Augmentations
Guo, Daichi / Dong, Guanting / Fu, Dayuan / Wu, Yuxiang / Zeng, Chen / Hui, Tingfeng / Wang, Liwen / Li, Xuefeng / Wang, Zechen / He, Keqing et al. | 2023
digital version
1: End-to-End Amp Modeling: from Data to Controllable Guitar Amplifier Models
Juvela, Lauri / Damskagg, Eero-Pekka / Peussa, Aleksi / Makinen, Jaakko / Sherson, Thomas / Mimilakis, Stylianos I. / Rauhanen, Kimmo / Gotsopoulos, Athanasios et al. | 2023
digital version
1: TAPLoss: A Temporal Acoustic Parameter Loss for Speech Enhancement
Zeng, Yunyang / Konan, Joseph / Han, Shuo / Bick, David / Yang, Muqiao / Kumar, Anurag / Watanabe, Shinji / Raj, Bhiksha et al. | 2023
digital version
1: Decaying Contrast for Fine-Grained Video Representation Learning
Zhang, Heng / Su, Bing et al. | 2023
digital version
1: EMCLR: Expectation Maximization Contrastive Learning Representations
Liu, Meng / Yi, Ran / Ma, Lizhuang et al. | 2023
digital version
1: Difference Guided VHR Remote Sensing Image Change Detection
Sun, Jiukai / Liu, Ganchao / Li, Xuelong / Yuan, Yuan et al. | 2023
digital version
1: Topology Uncertainty Modeling For Imbalanced Node Classification on Graphs
Gao, Jiayi / Li, Jiaxing / Zhang, Ke / Kong, Youyong et al. | 2023
digital version
1: SSI-Net: A Multi-Stage Speech Signal Improvement System for ICASSP 2023 SSI Challenge
Zhu, Weixin / Wang, Zilin / Lin, Jiuxin / Zeng, Chang / Yu, Tao et al. | 2023
digital version
1: Blind Acoustic Room Parameter Estimation Using Phase Features
Ick, Christopher / Mehrabi, Adib / Jin, Wenyu et al. | 2023
digital version
1: Exploiting Speaker Embeddings for Improved Microphone Clustering and Speech Separation in ad-hoc Microphone Arrays
Kindt, Stijn / Thienpondt, Jenthe / Madhu, Nilesh et al. | 2023
digital version
1: Classification of the Cervical Vertebrae Maturation (CVM) Stages Using the Tripod Network
Atici, Salih / Pan, Hongyi / Elnagar, Mohammed H. / Allareddy, Veerasathpurush / Suhaym, Omar / Ansari, Rashid / Cetin, Ahmet Enis et al. | 2023
digital version
1: A Deep Fusion Rule for Infrared and Visible Image Fusion: Feature Communication for Importance Assessment
Lv, Xuran / Cheng, Jinyong / Lv, Guohua / Wei, Zhonghe et al. | 2023
digital version
1: On the Role of Visual Context in Enriching Music Representations
Avramidis, Kleanthis / Stewart, Shanti / Narayanan, Shrikanth et al. | 2023
digital version
1: Designing A 3d-Aware Stylenerf Encoder for Face Editing
Yang, Songlin / Wang, Wei / Peng, Bo / Dong, Jing et al. | 2023
digital version
1: Sensor Selection for Angle of Arrival Estimation Based on the Two-Target Cramér-Rao Bound
Kokke, Costas A. / Coutino, Mario / Anitori, Laura / Heusdens, Richard / Leus, Geert et al. | 2023
digital version
1: A Meta-Gnn Approach to Personalized Seizure Detection and Classification
Rahmani, Abdellah / Venkitaraman, Arun / Frossard, Pascal et al. | 2023
digital version
1: Does a Quieter City Mean Fewer Complaints? The Sounds of New York City During Covid-19 Lockdown
Cartwright, Mark / Fuentes, Magdalena / Mydlarz, Charlie / Miranda, Fabio / Bello, Juan Pablo et al. | 2023
digital version
1: ECGT2T: Towards Synthesizing Twelve-Lead Electrocardiograms from Two Asynchronous Leads
Jo, Yong-Yeon / Choi, Young Sang / Jang, Jong-Hwan / Kwon, Joon-Myoung et al. | 2023
digital version
1: Once-for-All Sequence Compression for Self-Supervised Speech Models
Chen, Hsuan-Jui / Meng, Yen / Lee, Hung-yi et al. | 2023
digital version
1: UX-Net: Filter-and-Process-Based Improved U-Net for real-time time-domain audio Separation
Patel, Kashyap / Kovalyov, Anton / Panahi, Issa et al. | 2023
digital version
1: Dasformer: Deep Alternating Spectrogram Transformer For Multi/Single-Channel Speech Separation
Wang, Shuo / Kong, Xiangyu / Peng, Xiulian / Movassagh, Hesam / Prakash, Vinod / Lu, Yan et al. | 2023
digital version
1: Audio Barlow Twins: Self-Supervised Audio Representation Learning
Anton, Jonah / Coppock, Harry / Shukla, Pancham / Schuller, Bjorn W. et al. | 2023
digital version
1: Confidence-Based Event-Centric Online Video Question Answering on a Newly Constructed ATBS Dataset
Kong, Weikai / Ye, Shuhong / Yao, Chenglin / Ren, Jianfeng et al. | 2023
digital version
1: Mcrood: Multi-Class Radar Out-Of-Distribution Detection
Kahya, Sabri Mustafa / Sami Yavuz, Muhammet / Steinbach, Eckehard et al. | 2023
digital version
1: Pre-Training Strategies Using Contrastive Learning and Playlist Information for Music Classification and Similarity
Alonso-Jimenez, Pablo / Favory, Xavier / Foroughmand, Hadrien / Bourdalas, Grigoris / Serra, Xavier / Lidy, Thomas / Bogdanov, Dmitry et al. | 2023
digital version
1: Multimodal Dyadic Impression Recognition via Listener Adaptive Cross-Domain Fusion
Li, Yuanchao / Bell, Peter / Lai, Catherine et al. | 2023
digital version
1: Forensics for Adversarial Machine Learning Through Attack Mapping Identification
Yan, Allen / Kim, Jinsub / Raich, Raviv et al. | 2023
digital version
1: Sketch Less Face Image Retrieval: A New Challenge
Dai, Dawei / Li, Yutang / Wang, Liang / Fu, Shiyu / Xia, Shuyin / Wang, Guoyin et al. | 2023
digital version
1: Sample-Adapt Fusion Network for RGB-D Hand Detection in the Wild
Liu, Xingyu / Ren, Pengfei / Chen, Yuchen / Liu, Cong / Wang, Jing / Sun, Haifeng / Qi, Qi / Wang, Jingyu et al. | 2023
digital version
1: Semantic Preserving Learning for Task-Oriented Point Cloud Downsampling
Xiong, Jianyu / Dai, Tao / Zha, Yaohua / Wang, Xin / Xia, Shu-Tao et al. | 2023
digital version
1: Subgradient Descent Learning with Over-the-Air Computation
Gez, Tamir L. S. / Cohen, Kobi et al. | 2023
digital version
1: Rigid-Body Sound Synthesis with Differentiable Modal Resonators
Diaz, Rodrigo / Hayes, Ben / Saitis, Charalampos / Fazekas, Gyorgy / Sandler, Mark et al. | 2023
digital version
1: Better Together: Dialogue Separation and Voice Activity Detection for Audio Personalization in TV
Torcoli, Matteo / Habets, Emanuel A. P. et al. | 2023
digital version
1: An Attention-Based Approach to Hierarchical Multi-Label Music Instrument Classification
Zhong, Zhi / Hirano, Masato / Shimada, Kazuki / Tateishi, Kazuya / Takahashi, Shusuke / Mitsufuji, Yuki et al. | 2023
digital version
1: Hadamard Layer to Improve Semantic Segmentation
Hoyos, Angello / Rivera, Mariano et al. | 2023
digital version
1: Decoding Musical Pitch from Human Brain Activity with Automatic Voxel-Wise Whole-Brain FMRI Feature Selection
Cheung, Vincent K.M. / Peng, Yueh-Po / Lin, Jing-Hua / Su, Li et al. | 2023
digital version
1: Graph Wavelet-Based Point Cloud Geometric Denoising with Surface-Consistent Non-Negative Kernel Regression
Watanabe, Ryosuke / Nonaka, Keisuke / Pavez, Eduardo / Kobayashi, Tatsuya / Ortega, Antonio et al. | 2023
digital version
1: Semi-Swinderain: Semi-Supervised Image Deraining Network Using SWIN Transformer
Ren, Chun / Yan, Danfeng / Cai, Yuanqiang / Li, Yangchun et al. | 2023
digital version
1: Hierarchical Multi-Task Learning for Fabric Component Analysis Based on NIR Spectral Signals
Kim, Joseph / Wu, Dong / Chi, Mingmin / Xu, Gaoqi et al. | 2023
digital version
1: Transferring Quantified Emotion Knowledge for the Detection of Depression in Alzheimer’s Disease Using Forestnets
Perez-Toro, P. A. / Rodriguez-Salas, D. / Arias-Vergara, T. / Bayerl, S. P. / Klumpp, P. / Riedhammer, K. / Schuster, M. / Noth, E. / Maier, A. / Orozco-Arroyave, J. R. et al. | 2023
digital version
1: End-to-End Classification of Cell-Cycle Stages with Center-Cell Focus Tracker Using Recurrent Neural Networks
Jose, Abin / Roy, Rijo / Eschweiler, Dennis / Laube, Ina / Azad, Reza / Moreno-Andres, Daniel / Stegmaier, Johannes et al. | 2023
digital version
1: Client Selection for Generalization in Accelerated Federated Learning: A Bandit Approach
Ami, Dan Ben / Cohen, Kobi / Zhao, Qing et al. | 2023
digital version
1: Efficient Speech Translation with Dynamic Latent Perceivers
Tsiamas, Ioannis / Gallego, Gerard I. / Fonollosa, Jose A. R. / Costa-jussa, Marta R. et al. | 2023
digital version
1: Towards Privacy and Utility in Tourette TIC Detection Through Pretraining Based on Publicly Available Video Data of Healthy Subjects
Sophie Brugge, Nele / Mohammadi, Esfandiar / Munchau, Alexander / Baumer, Tobias / Frings, Christian / Beste, Christian / Roessner, Veit / Handels, Heinz et al. | 2023
digital version
1: Mixer: DNN Watermarking using Image Mixup
Kallas, Kassem / Furon, Teddy et al. | 2023
digital version
1: Targeted Adversarial Attacks Against Neural Machine Translation
Sadrizadeh, Sahar / Aghdam, AmirHossein Dabiri / Dolamic, Ljiljana / Frossard, Pascal et al. | 2023
digital version
1: Supervised Hierarchical Clustering Using Graph Neural Networks for Speaker Diarization
Singh, Prachi / Kaul, Amrit / Ganapathy, Sriram et al. | 2023
digital version
1: FindAdaptNet: Find and Insert Adapters by Learned Layer Importance
Huang, Junwei / Ganesan, Karthik / Maiti, Soumi / Min Kim, Young / Chang, Xuankai / Liang, Paul / Watanabe, Shinji et al. | 2023
digital version
1: An Effective Anomalous Sound Detection Method Based on Representation Learning with Simulated Anomalies
Chen, Han / Song, Yan / Zhuo, Zhu / Zhou, Yu / Li, Yu-Hong / Xue, Hui / McLoughlin, Ian et al. | 2023
digital version
1: Batch Normalization Damages Federated Learning on NON-IID Data: Analysis and Remedy
Wang, Yanmeng / Shi, Qingjiang / Chang, Tsung-Hui et al. | 2023
digital version
1: Convolution-Based Channel-Frequency Attention for Text-Independent Speaker Verification
Li, Jingyu / Tian, Yusheng / Lee, Tan et al. | 2023
digital version
1: Learning Properties of Holomorphic Neural Networks of Dual Variables
Kozlov, Dmitry / Bakulin, Mikhail / Pavlov, Stanislav / Zuev, Aleksandr / Krylova, Mariya / Kharchikov, Igor et al. | 2023
digital version
1: Recursive/Iterative Unique Projection-Aggregation Decoding of Reed-Muller Codes
Hashemipour-Nazari, Marzieh / Debets, Renate / Goossens, Kees / Balatsoukas-Stimming, Alexios et al. | 2023
digital version
1: Improved Deep Speaker Localization and Tracking: Revised Training Paradigm and Controlled Latency
Bohlender, Alexander / Roelens, Liesbeth / Madhu, Nilesh et al. | 2023
digital version
1: Static-Scene Constrained Optimization for Matrix/Tensor-Decomposition-free Foreground-Background Separation
Naganuma, Kazuki / Ono, Shunsuke et al. | 2023
digital version
1: Image Inpainting with Semantic-Aware Transformer
Chen, Shiyu / Yu, Wenxin / Wang, Qi / Gong, Jun / Chen, Peng et al. | 2023
digital version
1: MCNET: Fuse Multiple Cues for Multichannel Speech Enhancement
Yang, Yujie / Quan, Changsheng / Li, Xiaofei et al. | 2023
digital version
1: Co-Operative CNN for Visual Saliency Prediction on WCE Images
Dimas, George / Koulaouzidis, Anastasios / Iakovidis, Dimitris K. et al. | 2023
digital version
1: ISmallNet: Densely Nested Network with Label Decoupling for Infrared Small Target Detection
Hu, Zhiheng / Wang, Yongzhen / Li, Peng / Qin, Jie / Xie, Haoran / Wei, Mingqiang et al. | 2023
digital version
1: Improved Projection Learning for Lower Dimensional Feature Maps
Price, Ilan / Tanner, Jared et al. | 2023
digital version
1: Wordreg: Mitigating the Gap between Training and Inference with Worst-Case Drop Regularization
Xia, Jun / Wang, Ge / Hu, Bozhen / Tan, Cheng / Zheng, Jiangbin / Xu, Yongjie / Li, Stan Z. et al. | 2023
digital version
1: The NIO System for Audio-Visual Diarization and Recognition in MISP Challenge 2022
Xu, Gaopeng / Wang, Xianliang / Wang, Sang / Yuan, Junfeng / Guo, Wei / Li, Wei / Gao, Jie et al. | 2023
digital version
1: Vision Transformer with Progressive Tokenization for CT Metal Artifact Reduction
Zheng, Songwei / Zhang, Dong / Yu, Chunyan / Zhu, Danhong / Zhu, Longlong / Liu, Hao / Huang, Zhongzheng et al. | 2023
digital version
1: A Critical Look at Recent Trends in Compression of Channel State Information
Ornhag, Marcus Valtonen / Adalbjornsson, Stefan / Guler, Puren / Mahdavi, Mojtaba et al. | 2023
digital version
1: Speech Emotion Recognition Via Two-Stream Pooling Attention With Discriminative Channel Weighting
Liu, Ke / Wang, Dekui / Wu, Dongya / Feng, Jun et al. | 2023
digital version
1: DATA2VEC-SG: Improving Self-Supervised Learning Representations for Speech Generation Tasks
Wang, Heming / Qian, Yao / Yang, Hemin / Kanda, Nauyuki / Wang, Peidong / Yoshioka, Takuya / Wang, Xiaofei / Wang, Yiming / Liu, Shujie / Chen, Zhuo et al. | 2023
digital version
1: Spherical Vector Quantization for Spatial Direction Coding
Ragot, Stephane / Vasilache, Adriana et al. | 2023
digital version
1: Perceive and Predict: Self-Supervised Speech Representation Based Loss Functions for Speech Enhancement
Close, George / Ravenscroft, William / Hain, Thomas / Goetze, Stefan et al. | 2023
digital version
1: DisCoHead: Audio-and-Video-Driven Talking Head Generation by Disentangled Control of Head Pose and Facial Expressions
Hwang, Geumbyeol / Hong, Sunwon / Lee, Seunghyun / Park, Sungwoo / Chae, Gyeongsu et al. | 2023
digital version
1: Naturalistic Head Motion Generation from Speech
Mittal, Trisha / Aldeneh, Zakaria / Fedzechkina, Masha / Ranjan, Anurag / Theobald, Barry-John et al. | 2023
digital version
1: Bayesian Methods for Optical Flow Estimation Using a Variational Approximation, with Applications to Ultrasound
Dorazil, Jan / Fleury, Bernard H. / Hlawatsch, Franz et al. | 2023
digital version
1: FNeural Speech Enhancement with Very Low Algorithmic Latency and Complexity via Integrated full- and sub-band Modeling
Wang, Zhong-Qiu / Cornell, Samuele / Choi, Shukjae / Lee, Younglo / Kim, Byeong-Yeol / Watanabe, Shinji et al. | 2023
digital version
1: LSTM-Based Video Quality Prediction Accounting for Temporal Distortions in Videoconferencing Calls
Mittag, Gabriel / Naderi, Babak / Gopal, Vishak / Cutler, Ross et al. | 2023
digital version
1: Applying Independent Vector Analysis on EEG-Based Motor Imagery Classification
Moraes, Caroline P. A. / Aristimunha, Bruno / Dos Santos, Lucas Heck / Pinaya, Walter Hugo Lopez / de Camargo, Raphael Yokoingawa / Fantinato, Denis G. / Neves, Aline et al. | 2023
digital version
1: Hierarchical Pronunciation Assessment with Multi-Aspect Attention
Do, Heejin / Kim, Yunsu / Lee, Gary Geunbae et al. | 2023
digital version
1: Zero-Shot Anomalous Sound Detection in Domestic Environments Using Large-Scale Pretrained Audio Pattern Recognition Models
Ilic Mezza, Alessandro / Zanetti, Giulio / Cobos, Maximo / Antonacci, Fabio et al. | 2023
digital version
1: Improving Bert Fine-Tuning via Stabilizing Cross-Layer Mutual Information
Li, Jicun / Li, Xingjian / Wang, Tianyang / Wang, Shi / Cao, Yanan / Xu, Chengzhong / Dou, Dejing et al. | 2023
digital version
1: A Model-Based Hearing Compensation Method Using a Self-Supervised Framework
Niu, Yadong / Li, Nan / Wu, Xihong / Chen, Jing et al. | 2023
digital version
1: Structured Pruning of Self-Supervised Pre-Trained Models for Speech Recognition and Understanding
Peng, Yifan / Kim, Kwangyoun / Wu, Felix / Sridhar, Prashant / Watanabe, Shinji et al. | 2023
digital version
1: Contrastive Domain Adaptation Via Delimitation Discriminator
Wei, Xing / Wen, Bin / Chen, Lei / Liu, Yujie / Zhao, Chong / Lu, Yang et al. | 2023
digital version
1: Efficient Siamese Network for UAV Tracking
Zhang, Xiaohan / Wang, Dong / Ma, Xiaohong et al. | 2023
digital version
1: Counterfactual Explanation for Multivariate Times Series Using A Contrastive Variational Autoencoder
Todo, William / Selmani, Merwann / Laurent, Beatrice / Loubes, Jean-Michel et al. | 2023
digital version
1: Long-Term Synchronization of Wireless Acoustic Sensor Networks with Nonpersistent Acoustic Activity Using Coherence State
Chinaev, Aleksej / Knaepper, Niklas / Enzner, Gerald et al. | 2023
digital version
1: CN-CVS: A Mandarin Audio-Visual Dataset for Large Vocabulary Continuous Visual to Speech Synthesis
Chen, Chen / Wang, Dong / Zheng, Thomas Fang et al. | 2023
digital version
1: Real-Time Speech Enhancement with Dynamic Attention Span
Zheng, Chengyu / Zhou, Yuan / Peng, Xiulian / Zhang, Yuan / Lu, Yan et al. | 2023
digital version
1: Neurally Augmented State Space Model for Simultaneous Communication and Tracking with Low Complexity Receivers
Pedraza, Fernando / Caire, Giuseppe et al. | 2023
digital version
1: Cosmopolite Sound Monitoring (CoSMo): A Study of Urban Sound Event Detection Systems Generalizing to Multiple Cities
Angulo, Florian / Essid, Slim / Peeters, Geoffroy / Mietlicki, Christophe et al. | 2023
digital version
1: NC-WAMKD: Neighborhood Correction Weight-Adaptive Multi-Teacher Knowledge Distillation for Graph-Based Semi-Supervised Node Classification
Liu, Jiahao / Guo, Pengcheng / Song, Yonghong et al. | 2023
digital version
1: F-PABEE: Flexible-Patience-Based Early Exiting For Single-Label and Multi-Label Text Classification Tasks
Gao, Xiangxiang / Zhu, Wei / Gao, Jiasheng / Yin, Congrui et al. | 2023
digital version
1: Speech and Noise Dual-Stream Spectrogram Refine Network With Speech Distortion Loss For Robust Speech Recognition
Lu, Haoyu / Li, Nan / Song, Tongtong / Wang, Longbiao / Dang, Jianwu / Wang, Xiaobao / Zhang, Shiliang et al. | 2023
digital version
1: Streaming Stroke Classification of Online Handwriting
Liu, Jing-Yu / Zhang, Yan-Ming / Yin, Fei / Liu, Cheng-Lin et al. | 2023
digital version
1: Reducing Language Confusion for Code-Switching Speech Recognition with Token-Level Language Diarization
Liu, Hexin / Xu, Haihua / Garcia, Leibny Paola / Khong, Andy W. H. / He, Yi / Khudanpur, Sanjeev et al. | 2023
digital version
1: Cross-Modal Audio-Visual Co-Learning for Text-Independent Speaker Verification
Liu, Meng / Lee, Kong Aik / Wang, Longbiao / Zhang, Hanyi / Zeng, Chang / Dang, Jianwu et al. | 2023
digital version
1: Egocentric Audio-Visual Noise Suppression
Sharma, Roshan / He, Weipeng / Lin, Ju / Lakomkin, Egor / Liu, Yang / Kalgaonkar, Kaustubh et al. | 2023
digital version
1: Sparse Graph Learning with Spectrum Prior for Deep Graph Convolutional Networks
Zeng, Jin / Liu, Yang / Cheung, Gene / Hu, Wei et al. | 2023
digital version
1: A Game of Snakes and Gans
Asokan, Siddarth / Mohammed, Fatwir Sheikh / Sekhar Seelamantula, Chandra et al. | 2023
digital version
1: Enabling Large-Scale Image Search with Co-Attention Mechanism
Hu, Zechao / Bors, Adrian G. et al. | 2023
digital version
1: Deep Manifold Graph Auto-Encoder For Attributed Graph Embedding
Hu, Bozhen / Zang, Zelin / Xia, Jun / Wu, Lirong / Tan, Cheng / Li, Stan Z. et al. | 2023
digital version
1: Learning Expressive And Generalizable Motion Features For Face Forgery Detection
Zhang, Jingyi / Zhang, Peng / Wang, Jingjing / Xie, Di / Pu, Shiliang et al. | 2023
digital version
1: Self-Supervised Speech Representation Learning for Keyword-Spotting With Light-Weight Transformers
Gao, Chenyang / Gu, Yue / Caliva, Francesco / Liu, Yuzong et al. | 2023
digital version
1: UPGLADE: Unplugged Plug-and-Play Audio Declipper Based on Consensus Equilibrium of DNN and Sparse Optimization
Tanaka, Tomoro / Yatabe, Kohei / Oikawa, Yasuhiro et al. | 2023
digital version
1: Spatio-Temporal Structure Consistency for Semi-Supervised Medical Image Classification
Lei, Wentao / Liu, Lei / Liu, Li et al. | 2023
digital version
1: A Bandit Online Convex Optimization Approach To Distributed Energy Management In Networked Systems
Tsetis, Ioannis / Cheng, Xiaotong / Maghsudi, Setareh et al. | 2023
digital version
1: Efficiently Fusing Sparse Lidar for Enhanced Self-Supervised Monocular Depth Estimation
Wang, Yue / Gong, Mingrong / Xia, Lei / Zhang, Qieshi / Cheng, Jun et al. | 2023
digital version
1: Exploiting Prompt Learning with Pre-Trained Language Models for Alzheimer’s Disease Detection
Wang, Yi / Deng, Jiajun / Wang, Tianzi / Zheng, Bo / Hu, Shoukang / Liu, Xunying / Meng, Helen et al. | 2023
digital version
1: Sparse Bayesian Learning Assisted Decision Fusion in Millimeter Wave Massive MIMO Sensor Networks
Chawla, Apoorva / Ciuonzo, Domenico / Rossi, Pierluigi Salvo et al. | 2023
digital version
1: FedVMR: A New Federated Learning Method for Video Moment Retrieval
Wang, Yan / Luo, Xin / Chen, Zhen-Duo / Zhang, Peng-Fei / Liu, Meng / Xu, Xin-Shun et al. | 2023
digital version
1: Context-Aware Face Clustering with Graph Convolutional Networks
Zhang, Dafeng / Guo, Jiangbo / Jin, Zhezhu et al. | 2023
digital version
1: Constrained non-negative PARAFAC2 for electromyogram separation
Magbonde, Abile / Quaine, Franck / Rivet, Bertrand et al. | 2023
digital version
1: Continuous Learning for Blind Image Quality Assessment with Contrastive Transformer
Yang, Jifan / Wang, Zhongyuan / Huang, Baojin / Deng, Lianbing et al. | 2023
digital version
1: Surface-Sampling Based Objective Quality Assessment Metrics for Meshes
Fu, Chunyang / Zhang, Xiang / Nguyen-Canh, Thuong / Xu, Xiaozhong / Li, Ge / Liu, Shan et al. | 2023
digital version
1: Exploration Into Translation-Equivariant Image Quantization
Shin, Woncheol / Lee, Gyubok / Lee, Jiyoung / Lyou, Eunyi / Lee, Joonseok / Choi, Edward et al. | 2023
digital version
1: Deep Subband Network for Joint Suppression of Echo, Noise and Reverberation in Real-Time Fullband Speech Communication
Xiong, Feifei / Dong, Minya / Zhou, Kechenying / Zhu, Houwei / Feng, Jinwei et al. | 2023
digital version
1: More Speaking or More Speakers?
Berrebbi, Dan / Collobert, Ronan / Jaitly, Navdeep / Likhomanenko, Tatiana et al. | 2023
digital version
1: Neighborhood Information-Based Label Refinement for Person Re-Identification with Label Noise
Zhong, Xian / Su, Shuaipeng / Liu, Wenxuan / Jia, Xuemei / Huang, Wenxin / Wang, Mengdie et al. | 2023
digital version
1: Universal Speaker Recognition Encoders for Different Speech Segments Duration
Novoselov, Sergey / Volokhov, Vladimir / Lavrentyeva, Galina et al. | 2023
digital version
1: Joint Neural Representation for Multiple Light Fields
Guludec, Guillaume Le / Guillemot, Christine et al. | 2023
digital version
1: Semi-Supervised Speech Enhancement Based On Speech Purity
Cui, Zihao / Zhang, Shilei / Chen, Yanan / Gao, Yingying / Deng, Chao / Feng, Junlan et al. | 2023
digital version
1: Continuous Interaction with A Smart Speaker via Low-Dimensional Embeddings of Dynamic Hand Pose
Xu, Songpei / Kaul, Chaitanya / Ge, Xuri / Murray-Smith, Roderick et al. | 2023
digital version
1: Analyzing Acoustic Word Embeddings from Pre-Trained Self-Supervised Speech Models
Sanabria, Ramon / Tang, Hao / Goldwater, Sharon et al. | 2023
digital version
1: Scalable Weight Reparametrization for Efficient Transfer Learning
Kim, Byeonggeun / Lee, Jun-Tae / Yang, Seunghan / Chang, Simyung et al. | 2023
digital version
1: Efficient Large-Scale Audio Tagging Via Transformer-to-CNN Knowledge Distillation
Schmid, Florian / Koutini, Khaled / Widmer, Gerhard et al. | 2023
digital version
1: Weight-Sharing Supernet for Searching Specialized Acoustic Event Classification Networks Across Device Constraints
Lin, Guan-Ting / Tang, Qingming / Kao, Chieh-Chi / Rozgic, Viktor / Wang, Chao et al. | 2023
digital version
1: Building Change Detection Using Cross-Temporal Feature Interaction Network
Feng, Yuchao / Jiang, Jiawei / Xu, Honghui / Zheng, Jianwei et al. | 2023
digital version
1: RCDPT: Radar-Camera Fusion Dense Prediction Transformer
Lo, Chen-Chou / Vandewalle, Patrick et al. | 2023
digital version
1: Global HRTF Interpolation Via Learned Affine Transformation of Hyper-Conditioned Features
Lee, Jin Woo / Lee, Sungho / Lee, Kyogu et al. | 2023
digital version
1: Wireless Power Transfer Using Chirp Waveforms
Roy, Arijit / Psomas, Constantinos / Krikidis, Ioannis et al. | 2023
digital version
1: Analysing the Masked Predictive Coding Training Criterion for Pre-Training a Speech Representation Model
Yadav, Hemant / Sitaram, Sunayana / Shah, Rajiv Ratn et al. | 2023
digital version
1: Less Is More: A Unified Architecture for Device-Directed Speech Detection with Multiple Invocation Types
Rudovic, Oggi / Chang, Wonil / Garg, Vineet / Dighe, Pranay / Simha, Pramod / Berkowitz, Jack / Abdelaziz, Ahmed H. / Kajarekar, Sachin / Marchi, Erik / Adya, Saurabh et al. | 2023
digital version
1: MRML: Multimodal Rumor Detection by Deep Metric Learning
Peng, Liwen / Jian, Songlei / Li, Dongsheng / Shen, Siqi et al. | 2023
digital version
1: Face Recognition on Point Cloud with Cgan-Top for Denoising
Liu, Junyu / Ren, Jianfeng / Sun, Hongliang / Jiang, Xudong et al. | 2023
digital version
1: Any-to-Any Voice Conversion with F0 and Timbre Disentanglement and Novel Timbre Conditioning
Kovela, Sudheer / Valle, Rafael / Dantrey, Ambrish / Catanzaro, Bryan et al. | 2023
digital version
1: Inverse Reinforcement Learning with Graph Neural Networks for IoT Resource Allocation
Wang, Guangchen / Cheng, Peng / Chen, Zhuo / Xiang, Wei / Vucetic, Branka / Li, Yonghui et al. | 2023
digital version
1: NNSVS: A Neural Network-Based Singing Voice Synthesis Toolkit
Yamamoto, Ryuichi / Yoneyama, Reo / Toda, Tomoki et al. | 2023
digital version
1: Overview of the L3DAS23 Challenge on Audio-Visual Extended Reality
Marinoni, Christian / Gramaccioni, Riccardo F. / Chen, Changan / Uncini, Aurelio / Comminiello, Danilo et al. | 2023
digital version
1: Overview of the ICASSP 2023 General Meeting Understanding and Generation Challenge (MUG)
Zhang, Qinglin / Deng, Chong / Liu, Jiaqing / Yu, Hai / Chen, Qian / Wang, Wen / Yan, Zhijie / Liu, Jinglin / Ren, Yi / Zhao, Zhou et al. | 2023
digital version
1: Multilingual Alzheimer’s Dementia Recognition through Spontaneous Speech: A Signal Processing Grand Challenge
Luz, Saturnino / Haider, Fasih / Fromm, Davida / Lazarou, Ioulietta / Kompatsiaris, Ioannis / MacWhinney, Brian et al. | 2023
digital version
1: Divcon: Learning Concept Sequences for Semantically Diverse Image Captioning
Zheng, Yue / Li, Ya-Li / Wang, Shengjin et al. | 2023
digital version
1: Exploiting Virtual Array Diversity for Accurate Radar Detection
Guan, Junfeng / Madani, Sohrab / Ahmed, Waleed / Hussein, Samah / Gupta, Saurabh / Hassanieh, Haitham et al. | 2023
digital version
1: Accelerated Distributed Stochastic Non-Convex Optimization over Time-Varying Directed Networks
Chen, Yiyue / Hashemi, Abolfazl / Vikalo, Haris et al. | 2023
digital version
1: SAN: A Robust End-to-End ASR Model Architecture
Min, Zeping / Ge, Qian / Huang, Guanhua et al. | 2023
digital version
1: Resource Allocation for UAV-Enabled Integrated Sensing and Communication (ISAC) via Multi-Objective Optimization
Rezaei, Omid / Naghsh, Mohammad Mahdi / Karbasi, Seyed Mohammad / Nayebi, Mohammad Mahdi et al. | 2023
digital version
1: Removing Radio Frequency Interference From Auroral Kilometric Radiation With Stacked Autoencoders
Chang, Allen / Knapp, Mary / LaBelle, James / Swoboda, John / Volz, Ryan / Erickson, Philip J. et al. | 2023
digital version
1: Soft Label Coding for end-to-end Sound Source Localization with ad-hoc Microphone Arrays
Feng, Linfeng / Gong, Yijun / Zhang, Xiao-Lei et al. | 2023
digital version
1: Study And Design Of Robust Personal Sound Zones With Vast Using Low Rank Rirs
Bhattacharjee, Sankha Subhra / Shi, Liming / Ping, Guoli / Shen, Xiaoxiang / Christensen, Mads Grasboll et al. | 2023
digital version
1: ROI-Based Deep Image Compression with Swin Transformers
Li, Binglin / Liang, Jie / Fu, Haisheng / Han, Jingning et al. | 2023
digital version
1: Event-Based Visual Microphone
Howard, Matthew / Hirakawa, Keigo et al. | 2023
digital version
1: Named Entity Detection and Injection for Direct Speech Translation
Gaido, Marco / Tang, Yun / Kulikov, Ilia / Huang, Rongqing / Gong, Hongyu / Inaguma, Hirofumi et al. | 2023
digital version
1: Efficient Stuttering Event Detection Using Siamese Networks
Mohapatra, Payal / Islam, Bashima / Islam, Md Tamzeed / Jiao, Ruochen / Zhu, Qi et al. | 2023
digital version
1: BadRes: Reveal the Backdoors Through Residual Connection
He, Mingrui / Chen, Tianyu / Zhou, Haoyi / Zhang, Shanghang / Li, Jianxin et al. | 2023
digital version
1: End-to-End Unsupervised Sketch to Image Generation
Lv, Xingming / Wu, Lei / Cheng, Zhenwei / Meng, Xiangxu et al. | 2023
digital version
1: Trinet: Stabilizing Self-Supervised Learning From Complete or Slow Collapse
Cao, Lixin / Wang, Jun / Yang, Ben / Su, Dan / Yu, Dong et al. | 2023
digital version
1: ERBNet: An Effective Representation Based Network for Unbiased Scene Graph Generation
Ma, Wenxi / Hou, Tianxiang / Di, Qianji / Qi, Zhongang / Shan, Ying / Wang, Hanzi et al. | 2023
digital version
1: Deformable Cross Attention for Learning Optical Flow
Abdein, Rokia / Xiang, Xuezhi / Lv, Ning / Saddik, Abdulmotaleb El et al. | 2023
digital version
1: Optimal Kernel for Real-Time Arbitrary-Shaped Text Detection
Ma, Haozhao / Yang, Chuang / Yuan, Yuan / Wang, Qi et al. | 2023
digital version
1: SVMV: Spatiotemporal Variance-Supervised Motion Volume for Video Frame Interpolation
Luo, Yao / Pan, Jinshan / Tang, Jinhui et al. | 2023
digital version
1: Cumulative Attention Based Streaming Transformer ASR with Internal Language Model Joint Training and Rescoring
Li, Mohan / Do, Cong-Thanh / Doddipatla, Rama et al. | 2023
digital version
1: Two-Stage Neural Network for ICASSP 2023 Speech Signal Improvement Challenge
Liu, Mingshuai / Lv, Shubo / Zhang, Zihan / Han, Runduo / Hao, Xiang / Xia, Xianjun / Chen, Li / Xiao, Yijian / Xie, Lei et al. | 2023
digital version
1: The Multimodal Information Based Speech Processing (Misp) 2022 Challenge: Audio-Visual Diarization And Recognition
Wang, Zhe / Wu, Shilong / Chen, Hang / He, Mao-Kui / Du, Jun / Lee, Chin-Hui / Chen, Jingdong / Watanabe, Shinji / Siniscalchi, Sabato / Scharenborg, Odette et al. | 2023
digital version
1: Implicit Vehicle Positioning with Cooperative Lidar Sensing
Barbieri, Luca / Tedeschini, Bernardo Camajori / Brambilla, Mattia / Nicoli, Monica et al. | 2023
digital version
1: Self-Supervised Guided Hypergraph Feature Propagation for Semi-Supervised Classification with Missing Node Features
Lei, Chengxiang / Fu, Sichao / Wang, Yuetian / Qiu, Wenhao / Hu, Yachen / Peng, Qinmu / You, Xinge et al. | 2023
digital version
1: Differential Analysis for Networks Obeying Conservation Laws
Rayas, Anirudh / Anguluri, Rajasekhar / Cheng, Jiajun / Dasarathy, Gautam et al. | 2023
digital version
1: Hardware-Limited Non-Uniform Task-Based Quantizers
Bernardo, Neil Irwin / Zhu, Jingge / Eldar, Yonina C. / Evans, Jamie et al. | 2023
digital version
1: Adaptive Noise Canceller Algorithm with SNR-Based Stepsize and Data-Dependent Averaging
Sugiyama, Akihiko et al. | 2023
digital version
1: Signal Processing And Quantum State Tomography on Noisy Devices
Shi, Wenbo / Malaney, Robert et al. | 2023
digital version
1: In-Sensor & Neuromorphic Computing Are all You Need for Energy Efficient Computer Vision
Datta, Gourav / Liu, Zeyu / Kaiser, Md Abdullah-Al / Kundu, Souvik / Mathai, Joe / Yin, Zihan / Jacob, Ajey P. / Jaiswal, Akhilesh R. / Beerel, Peter A. et al. | 2023
digital version
1: Adversarial Contrastive Distillation with Adaptive Denoising
Wang, Yuzheng / Chen, Zhaoyu / Yang, Dingkang / Liu, Yang / Liu, Siao / Zhang, Wenqiang / Qi, Lizhe et al. | 2023
digital version
1: On Designing Light-Weight Object Trackers Through Network Pruning: Use CNNS or Transformers?
Aggarwal, Saksham / Gupta, Taneesh / Sahu, Pawan K. / Chavan, Arnav / Tiwari, Rishabh / Prasad, Dilip K. / Gupta, Deepak K. et al. | 2023
digital version
1: Variational Inference Aided Estimation of Time Varying Channels
Bock, Benedikt / Baur, Michael / Rizzello, Valentina / Utschick, Wolfgang et al. | 2023
digital version
1: Class-Incremental Learning on Multivariate Time Series Via Shape-Aligned Temporal Distillation
Qiao, Zhongzheng / Hu, Minghui / Jiang, Xudong / Suganthan, Ponnuthurai Nagaratnam / Savitha, Ramasamy et al. | 2023
digital version
1: Inv-Senet: Invariant Self Expression Network for Clustering Under Biased Data
Singh, Ashutosh / Singh, Ashish / Masoomi, Aria / Imbiriba, Tales / Learned-Miller, Erik / Erdogmus, Deniz et al. | 2023
digital version
1: Fine-Grained Textual Knowledge Transfer to Improve RNN Transducers for Speech Recognition and Understanding
Sunder, Vishal / Thomas, Samuel / Kuo, Hong-Kwang J. / Kingsbury, Brian / Fosler-Lussier, Eric et al. | 2023
digital version
1: Training Neural Networks for Sequential Change-Point Detection
Lee, Junghwan / Xie, Yao / Cheng, Xiuyuan et al. | 2023
digital version
1: High-Resolution Neural Network Processing of LFM Radar Pulses
Akhtar, Jabran et al. | 2023
digital version
1: MLCGAN: Multi-Lead ECG Synthesis with Multi Label Conditional Generative Adversarial Network
Wu, Jian / Wang, Liping / Pan, Hailin / Wang, Binyu et al. | 2023
digital version
1: NRTSI: Non-Recurrent Time Series Imputation
Shan, Siyuan / Li, Yang / Oliva, Junier B. et al. | 2023
digital version
1: The Edinburgh International Accents of English Corpus: Towards the Democratization of English ASR
Sanabria, Ramon / Bogoychev, Nikolay / Markl, Nina / Carmantini, Andrea / Klejch, Ondrej / Bell, Peter et al. | 2023
digital version
1: Centralized Cascade Multi-Channel Noise Reduction and Acoustic Feedback Cancellation in a Wireless Acoustic Sensor And Actuator Network
Ruiz, Santiago / van Waterschoot, Toon / Moonen, Marc et al. | 2023
digital version
1: Intent Does Matter! Propagating High-Order Relations for Exploring Interest Preferences
Zheng, Xiangping / Liang, Xun / Wu, Bo / Feng, Junlan / Guo, Yuhui / Zhang, Sensen et al. | 2023
digital version
1: Compose & Embellish: Well-Structured Piano Performance Generation via A Two-Stage Approach
Wu, Shih-Lun / Yang, Yi-Hsuan et al. | 2023
digital version
1: Input-Dependent Dynamical Channel Association For Knowledge Distillation
Tang, Qiankun / Zhang, Yuan / Xu, Xiaogang / Wang, Jun / Guo, Yimin et al. | 2023
digital version
1: Robust Adaptive Beamforming with Proximal Method
Li, Ruifu / Cabric, Danijela et al. | 2023
digital version
1: Conformer-Based Target-Speaker Automatic Speech Recognition For Single-Channel Audio
Zhang, Yang / Puvvada, Krishna C. / Lavrukhin, Vitaly / Ginsburg, Boris et al. | 2023
digital version

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Quicklinks

Borrowing & Ordering

Quicklinks

Search & discover

Quicklinks

Learning & working

Quicklinks

Publishing & Archiving

Quicklinks

About the TIB

Quicklinks

Research & Development

Test Your Samples Jointly: Pseudo-Reference for Image Quality Evaluation (English)

How to get this title?

Export, share and cite

More details on this result

Table of contents

Table of contents conference proceedings

Similar titles

How to get this title?

Export, share and cite