Hyperbolic Audio Source Separation (English)

Petermann, Darius / Wichern, Gordon / Subramanian, Aswin / Roux, Jonathan Le

In: ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ; 1-5 ; 2023

ISBN:

978-1-7281-6327-7

ISSN:

2379-190X

Conference paper / Electronic Resource

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Export, share and cite

We introduce a framework for audio source separation using embeddings on a hyperbolic manifold that compactly represent the hierarchical relationship between sound sources and time-frequency features. Inspired by recent successes modeling hierarchical relationships in text and images with hyperbolic embeddings, our algorithm obtains a hyperbolic embedding for each time-frequency bin of a mixture signal and estimates masks using hyperbolic softmax layers. On a synthetic dataset containing mixtures of multiple people talking and musical instruments playing, our hyperbolic model performed comparably to a Euclidean baseline in terms of source to distortion ratio, with stronger performance at low embedding dimensions. Furthermore, we find that time-frequency regions containing multiple overlapping sources are embedded towards the center (i.e., the most uncertain region) of the hyperbolic space, and we can use this certainty estimate to efficiently trade-off between artifact introduction and interference reduction when isolating individual sounds.

Title:

Hyperbolic Audio Source Separation
Contributors:

Petermann, Darius ( author ) / Wichern, Gordon ( author ) / Subramanian, Aswin ( author ) / Roux, Jonathan Le ( author )
Published in:

ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ; 1-5
Publisher:

IEEE

Publication date:

2023-06-04
Size:

5787149 byte
ISBN:

978-1-7281-6327-7
ISSN:

2379-190X
DOI:

https://doi.org/10.1109/ICASSP49357.2023.10094943
Type of media:

Conference paper
Type of material:

Electronic Resource
Language:

English
Source:

IEEE

Table of contents conference proceedings

The tables of contents are generated automatically and are based on the data records of the individual contributions available in the index of the TIB portal. The display of the Tables of Contents may therefore be incomplete.

1: Sequential Invariant Information Bottleneck
Zhang, Yichen / Yu, Shujian / Chen, Badong et al. | 2023
digital version
1: Projected Hierarchical ALS for Generalized Boolean Matrix Factorization
Farias, Rodrigo Cabral / Miron, Sebastian et al. | 2023
digital version
1: Tensorized LSSVMS For Multitask Regression
Liu, Jiani / Tao, Qinghua / Zhu, Ce / Liu, Yipeng / Suykens, Johan A.K. et al. | 2023
digital version
1: Robust GMM Parameter Estimation via the K-BM Algorithm
Kenig, Ori / Todros, Koby / Adali, Tulay et al. | 2023
digital version
1: Nord: Non-Matching Reference Based Relative Depth Estimation from Binaural Speech
Manocha, Pranay / Gebru, Israel D. / Kumar, Anurag / Markovic, Dejan / Richard, Alexander et al. | 2023
digital version
1: Deep Reinforcement Learning for Green UAV-Assisted Data Collection
Mondal, Abhishek / Mishra, Deepak / Prasad, Ganesh / Hossain, Ashraf et al. | 2023
digital version
1: Multitrack Music Transformer
Dong, Hao-Wen / Chen, Ke / Dubnov, Shlomo / McAuley, Julian / Berg-Kirkpatrick, Taylor et al. | 2023
digital version
1: Rate Region Characterization for Semantics and Bits based Multiuser Communications
Mu, Xidong / Liu, Yuanwei et al. | 2023
digital version
1: Multiple Target Measurements: Bayesian Framework for Moving Object Detection in Mimo Radar
Eisele, Bastian / Bereyhi, Ali / Muller, Ralf et al. | 2023
digital version
1: Frequency-Aware Attentional Feature Fusion for Deepfake Detection
Tian, Cheng / Luo, Zhiming / Shi, Guimin / Li, Shaozi et al. | 2023
digital version
1: Parallel 2D Seismic Ray Tracing Using Cuda on a Jetson Nano
Shin, Ban-Sok / Wientgens, Luis / Shutin, Dmitriy et al. | 2023
digital version
1: Central Nodes Detection from Partially Observed Graph Signals
He, Yiran / Wai, Hoi-To et al. | 2023
digital version
1: Disentangled Feature Learning for Real-Time Neural Speech Coding
Jiang, Xue / Peng, Xiulian / Zhang, Yuan / Lu, Yan et al. | 2023
digital version
1: Noise-Aware Target Extension with Self-Distillation for Robust Speech Recognition
Seong, Ju-Seok / Choi, Jeong-Hwan / Kyung, Jehyun / Jeoung, Ye-Rin / Chang, Joon-Hyuk et al. | 2023
digital version
1: Imaginary Voice: Face-Styled Diffusion Model for Text-to-Speech
Lee, Jiyoung / Son Chung, Joon / Chung, Soo-Whan et al. | 2023
digital version
1: Target-Speaker Voice Activity Detection Via Sequence-to-Sequence Prediction
Cheng, Ming / Wang, Weiqing / Zhang, Yucong / Qin, Xiaoyi / Li, Ming et al. | 2023
digital version
1: Detail-Aware Uncalibrated Photometric Stereo
Agudo, Antonio et al. | 2023
digital version
1: CAN2V: Can-Bus Data-Based Seq2seq Model for Vehicle Velocity Prediction
Cho, Jae-Heung / Chang, Joon-Hyuk et al. | 2023
digital version
1: SemGeo: Semantic Keywords for Cross-View Image Geo-Localization
Rodrigues, Royston / Tani, Masahiro et al. | 2023
digital version
1: Direction-of-Arrival Estimation Using Gaussian Process Interpolation
Khurjekar, Ishan D. / Gerstoft, Peter / Mecklenbrauker, Christoph F. / Michalopoulou, Zoi-Heleni et al. | 2023
digital version
1: Learning Dependencies of Discrete Speech Representations with Neural Hidden Markov Models
Yeh, Sung-Lin / Tang, Hao et al. | 2023
digital version
1: Waveform Boundary Detection for Partially Spoofed Audio
Cai, Zexin / Wang, Weiqing / Li, Ming et al. | 2023
digital version
1: Fast 3D Human Pose Estimation Using RF Signals
Yu, Cong / Zhang, Dongheng / Wu, Zhi / Xie, Chunyang / Lu, Zhi / Hu, Yang / Chen, Yan et al. | 2023
digital version
1: LABANet: Lead-Assisting Backbone Attention Network for Oral Multi-Pathology Segmentation
Chen, Huabao / Huang, Xiaolong / Li, Qiankun / Wang, Jianqing / Fang, Bo / Chen, Junxin et al. | 2023
digital version
1: Boosting Bert Subnets with Neural Grafting
Hu, Ting / Meinel, Christoph / Yang, Haojin et al. | 2023
digital version
1: Parameter-Efficient Transfer Learning of Pre-Trained Transformer Models for Speaker Verification Using Adapters
Peng, Junyi / Stafylakis, Themos / Gu, Rongzhi / Plchot, Oldrich / Mosner, Ladislav / Burget, Lukas / Cernocky, Jan et al. | 2023
digital version
1: Wavsyncswap: End-To-End Portrait-Customized Audio-Driven Talking Face Generation
Bao, Weihong / Chen, Liyang / Zhou, Chaoyong / Yang, Sicheng / Wu, Zhiyong et al. | 2023
digital version
1: Fine-Grained Private Knowledge Distillation
Li, Yuntong / Wang, Shaowei / Wang, Yingying / Li, Jin / Qian, Yuqiu / Xin, Bangzhou / Yang, Wei et al. | 2023
digital version
1: Neural Diarization with Non-Autoregressive Intermediate Attractors
Fujita, Yusuke / Komatsu, Tatsuya / Scheibler, Robin / Kida, Yusuke / Ogawa, Tetsuji et al. | 2023
digital version
1: Cross-Site Generalization for Imbalanced Epileptic Classification
Abdallah, Tala / Jrad, Nisrine / Abdallah, Fahed / Humeau-Heurtier, Anne / Van Bogaert, Patrick et al. | 2023
digital version
1: PMMSD: Development of the Matrix Sentence Intelligibility Dataset for Mandarin with Lombard Effect
Pei, Hanchen / Yang, Yuhong / Chen, Xufeng / Liu, Qingmu / Chen, Hongyang / Tu, Weiping / Lin, Song et al. | 2023
digital version
1: Hardware Friendly Spline Sketched Lidar
Sheehan, Michael P. / Tachella, Julian / Davies, Mike E. et al. | 2023
digital version
1: Ontology-Aware Network for Zero-Shot Sketch-Based Image Retrieval
Zhang, Haoxiang / Jiang, He / Wang, Ziqiang / Cheng, Deqiang et al. | 2023
digital version
1: Post-Trained Language Model Adaptive to Extractive Summarization of Long Spoken Documents
Ok, Hyunjong / Park, Seong-Bae et al. | 2023
digital version
1: APGP: Accuracy-Preserving Generative Perturbation for Defending Against Model Cloning Attacks
Cheng, Anda / Cheng, Jian et al. | 2023
digital version
1: Robust Log-Based Anomaly Detection with Hierarchical Contrastive Learning
Zhao, Yuhui / Yang, Ruichun / Yang, Ning / Lin, Tao / Fu, Qiuai / Ma, Yuchi et al. | 2023
digital version
1: Learning Speech Representations with Flexible Hidden Feature Dimensions
Tang, Huaizhen / Zhang, Xulong / Wang, Jianzong / Cheng, Ning / Xiao, Jing et al. | 2023
digital version
1: Expectation Propagation on Factor Graphs Based on Matrix Decomposition
Mekhiche, Adam / Cipriano, Antonio Maria / Poulliat, Charly et al. | 2023
digital version
1: PRRD: Pixel-Region Relation Distillation For Efficient Semantic Segmentation
Wang, Chen / Zhong, Jiang / Dai, Qizhu / Qi, Yafei / Li, Rongzhen / Lei, Qin / Fang, Bin / Li, Xue et al. | 2023
digital version
1: Joint Noise Reduction and Listening Enhancement for Full-End Speech Enhancement
Li, Haoyu / Liu, Yun / Yamagishi, Junichi et al. | 2023
digital version
1: Towards Robust Data-Driven Underwater Acoustic Localization: A Deep CNN Solution with Performance Guarantees for Model Mismatch
Weiss, Amir / Singer, Andrew C. / Wornell, Gregory W. et al. | 2023
digital version
1: TF-GRIDNET: Making Time-Frequency Domain Models Great Again for Monaural Speaker Separation
Wang, Zhong-Qiu / Cornell, Samuele / Choi, Shukjae / Lee, Younglo / Kim, Byeong-Yeol / Watanabe, Shinji et al. | 2023
digital version
1: Fast Cross-Correlation for TDoA Estimation on Small Aperture Microphone Arrays
Grondin, Francois / Maheux, Marc-Antoine / Lauzon, Jean-Samuel / Vincent, Jonathan / Michaud, Francois et al. | 2023
digital version
1: Certified Robustness of Quantum Classifiers Against Adversarial Examples Through Quantum Noise
Huang, Jhih-Cing / Tsai, Yu-Lin / Yang, Chao-Han Huck / Su, Cheng-Fang / Yu, Chia-Mu / Chen, Pin-Yu / Kuo, Sy-Yen et al. | 2023
digital version
1: Deep AHS: A Deep Learning Approach to Acoustic Howling Suppression
Zhang, Hao / Yu, Meng / Yu, Dong et al. | 2023
digital version
1: PCF: ECAPA-TDNN with Progressive Channel Fusion for Speaker Verification
Zhao, Zhenduo / Li, Zhuo / Wang, Wenchao / Zhang, Pengyuan et al. | 2023
digital version
1: DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification
Wang, Yuanyuan / Zhang, Yang / Wu, Zhiyong / Yang, Zhihan / Wei, Tao / Zou, Kun / Meng, Helen et al. | 2023
digital version
1: Relevance Propagation through Deep Conditional Random Fields
Yang, Xiangyu / Joukovsky, Boris / Deligiannis, Nikos et al. | 2023
digital version
1: Benchmark of Physiological Model Based and Deep Learning Based Remote Photoplethysmography in Automotive Applications
Wang, Zhiyu / Yang, Xuezhi / Lu, Hongzhou / Shan, Caifeng / Wang, Wenjin et al. | 2023
digital version
1: WeSinger 2: Fully Parallel Singing Voice Synthesis via Multi-Singer Conditional Adversarial Training
Zhang, Zewang / Zheng, Yibin / Li, Xinhui / Lu, Li et al. | 2023
digital version
1: Managing Information Updating with Edge Computing: A Distributed and Learning Approach
He, Junyi / Zhang, Di / Liu, Shumeng / Zhou, Yuezhi / Zhang, Yaoxue et al. | 2023
digital version
1: Loss Function Design for DNN-Based Sound Event Localization and Detection on Low-Resource Realistic Data
Wang, Qing / Du, Jun / Nian, Zhaoxu / Niu, Shutong / Chai, Li / Wu, Huaxin / Pan, Jia / Lee, Chin-Hui et al. | 2023
digital version
1: BECTRA: Transducer-Based End-To-End ASR with Bert-Enhanced Encoder
Higuchi, Yosuke / Ogawa, Tetsuji / Kobayashi, Tetsunori / Watanabe, Shinji et al. | 2023
digital version
1: Vision Transformer-Based Feature Extraction for Generalized Zero-Shot Learning
Kim, Jiseob / Shim, Kyuhong / Kim, Junhan / Shim, Byonghyo et al. | 2023
digital version
1: On Designing A 3d Imaging Summer Project For Ontario’s High School Students During Covid-19 Pandemic
Lan, Fengbo / Cheung, Gene / Arora, Prabhkirat / Richard-Koko, Deinabo / Cole, Lisa et al. | 2023
digital version
1: Dynamic Alignment Mask CTC: Improved Mask CTC With Aligned Cross Entropy
Zhang, Xulong / Tang, Haobin / Wang, Jianzong / Cheng, Ning / Luo, Jian / Xiao, Jing et al. | 2023
digital version
1: Global-Context Aware Generative Protein Design
Tan, Cheng / Gao, Zhangyang / Xia, Jun / Hu, Bozhen / Li, Stan Z. et al. | 2023
digital version
1: MvCo-DoT: Multi-View Contrastive Domain Transfer Network for Medical Report Generation
Wang, Ruizhi / Wang, Xiangtao / Xu, Zhenghua / Xu, Wenting / Chen, Junyang / Lukasiewicz, Thomas et al. | 2023
digital version
1: Active Selection of Source Patients in Transfer Learning for Epileptic Seizure Detection Using Riemannian Manifold
Orihara, Toshiki / Hassan, Kazi Mahmudul / Tanaka, Toshihisa et al. | 2023
digital version
1: Exploring Subgroup Performance in End-to-End Speech Models
Koudounas, Alkis / Pastor, Eliana / Attanasio, Giuseppe / Mazzia, Vittorio / Giollo, Manuel / Gueudre, Thomas / Cagliero, Luca / de Alfaro, Luca / Baralis, Elena / Amberti, Daniele et al. | 2023
digital version
1: Source-Filter HiFi-GAN: Fast and Pitch Controllable High-Fidelity Neural Vocoder
Yoneyama, Reo / Wu, Yi-Chiao / Toda, Tomoki et al. | 2023
digital version
1: CyFi-TTS: Cyclic Normalizing Flow with Fine-Grained Representation for End-to-End Text-to-Speech
Hwang, In-Sun / Han, Young-Sub / Jeon, Byoung-Ki et al. | 2023
digital version
1: GaPP: Multi-Target Tracking with Gaussian Processes
Goodyer, Fred / Ahmad, Bashar I. / Godsill, Simon et al. | 2023
digital version
1: AMPose: Alternately Mixed Global-Local Attention Model for 3D Human Pose Estimation
Lin, Hongxin / Chiu, Yunwei / Wu, Peiyuan et al. | 2023
digital version
1: Modulo EEG Signal Recovery Using Transformer
Geng, Tianyu / Ji, Feng / Pratibha / Tay, Wee Peng et al. | 2023
digital version
1: Conditional Conformer: Improving Speaker Modulation For Single And Multi-User Speech Enhancement
O'Malley, Tom / Ding, Shaojin / Narayanan, Arun / Wang, Quan / Rikhye, Rajeev / Liang, Qiao / He, Yanzhang / McGraw, Ian et al. | 2023
digital version
1: Robust Data2VEC: Noise-Robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning
Zhu, Qiu-Shi / Zhou, Long / Zhang, Jie / Liu, Shu-Jie / Hu, Yu-Chen / Dai, Li-Rong et al. | 2023
digital version
1: Semantics-Aware Gamma Correction for Unsupervised Low-Light Image Enhancement
Chen, Yu-Hsuan / Pan, Fu-Cheng / Liao, Yu-Chien / Kao, Jao-Hong / Wang, Yu-Chiang Frank et al. | 2023
digital version
1: Time-Frequency Awareness Network For Human Mesh Recovery From Videos
Zhang, Boyang / Wu, Suping / Jia, Meining et al. | 2023
digital version
1: Could the BubbleView Metaphor be used to Infer Visual Attention on 3D Graphical Content?
Bruckert, Alexandre / Abid, Mona / Da Silva, Matthieu Perreira / Le Callet, Patrick et al. | 2023
digital version
1: Enhancement of Text-Predicting Style Token With Generative Adversarial Network for Expressive Speech Synthesis
Kanagawa, Hiroki / Ijima, Yusuke et al. | 2023
digital version
1: Modeling Global Latent Semantic in Multi-Turn Conversations with Random Context Reconstruction
Zhang, Chengwen / Wu, Danqin et al. | 2023
digital version
1: Extended Expectation Maximization for Under-Fitted Models
Rekavandi, Aref Miri / Seghouane, Abd-Krim / Boussaid, Farid / Bennamoun, Mohammed et al. | 2023
digital version
1: Visual Information Matters for ASR Error Correction
Kumar, Vanya Bannihatti / Cheng, Shanbo / Peng, Ningxin / Zhang, Yuchen et al. | 2023
digital version
1: Gesper: A Unified Framework for General Speech Restoration
Chen, Jun / Shi, Yupeng / Liu, Wenzhe / Rao, Wei / He, Shulin / Li, Andong / Wang, Yannan / Wu, Zhiyong / Shang, Shidong / Zheng, Chengshi et al. | 2023
digital version
1: Select The Best: Enhancing Graph Representation with Adaptive Negative Sample Selection
Zheng, Xiangping / Liang, Xun / Wu, Bo et al. | 2023
digital version
1: AV-TAD: Audio-Visual Temporal Action Detection With Transformer
Li, Yangcheng / Yu, Zefang / Xiang, Suncheng / Liu, Ting / Fu, Yuzhuo et al. | 2023
digital version
1: An Interpretable Model Using Evidence Information for Multi-Hop Question Answering Over Long Texts
Chen, Yanyi / Liu, Ruifang / Liu, Xiyan / Shi, Yidong / Bai, Ge et al. | 2023
digital version
1: Toward A Multimodal Approach for Disfluency Detection and Categorization
Romana, Amrit / Koishida, Kazuhito et al. | 2023
digital version
1: One-Shot Action Detection via Attention Zooming In
Hsieh, He-Yen / Chen, Ding-Jie / Chang, Cheng-Wei / Liu, Tyng-Luh et al. | 2023
digital version
1: On Tracking a Stochastically Time-Varying Subspace
Solo, Victor et al. | 2023
digital version
1: Enhancing Multimodal Alignment with Momentum Augmentation for Dense Video Captioning
Wei, Yiwei / Yuan, Shaozu / Chen, Meng / Wang, Longbiao et al. | 2023
digital version
1: Towards Real-Time Person Search with Invariant Feature Learning
Jia, Chengyou / Luo, Minnan / Dang, Zhuohang / Chang, Xiaojun / Zheng, Qinghua et al. | 2023
digital version
1: Semi-Supervised Sound Event Detection with Pre-Trained Model
Xu, Liang / Wang, Lizhong / Bi, Sijun / Liu, Hanyue / Wang, Jing et al. | 2023
digital version
1: Fast and Exact Enumeration of Deep Networks Partitions Regions
Balestriero, Randall / LeCun, Yann et al. | 2023
digital version
1: Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech
Saeki, Takaaki / Zen, Heiga / Chen, Zhehuai / Morioka, Nobuyuki / Wang, Gary / Zhang, Yu / Bapna, Ankur / Rosenberg, Andrew / Ramabhadran, Bhuvana et al. | 2023
digital version
1: Improving Noisy Student Training on Non-Target Domain Data for Automatic Speech Recognition
Chen, Yu / Ding, Wen / Lai, Junjie et al. | 2023
digital version
1: A Lightweight Fourier Convolutional Attention Encoder for Multi-Channel Speech Enhancement
Sun, Siyu / Jin, Jian / Han, Zhe / Xia, Xianjun / Chen, Li / Xiao, Yijian / Ding, Piao / Song, Shenyi / Togneri, Roberto / Zhang, Haijian et al. | 2023
digital version
1: ICStega: Image Captioning-based Semantically Controllable Linguistic Steganography
Wang, Xilong / Wang, Yaofei / Chen, Kejiang / Ding, Jinyang / Zhang, Weiming / Yu, Nenghai et al. | 2023
digital version
1: Multi-Agent Reinforcement Learning for Covert Semantic Communications over Wireless Networks
Wang, Yining / Hu, Ye / Du, Hongyang / Luo, Tao / Niyato, Dusit et al. | 2023
digital version
1: Precognition in Contextual Spoken Language Understanding via Knowledge Distillation
Su, Nan / Du, Bingzhu / Zhang, Yuchi / Liu, Chao / Wang, Yongliang / Chen, Hong / Lu, Xin et al. | 2023
digital version
1: Improving Spoken Language Identification with Map-Mix
Rajaa, Shangeth / Anandan, Kriti / Dalmia, Swaraj / Gupta, Tarun / Chng, Eng Siong et al. | 2023
digital version
1: Last: Scalable Lattice-Based Speech Modelling in Jax
Wu, Ke / Variani, Ehsan / Bagby, Tom / Riley, Michael et al. | 2023
digital version
1: Multiple Acoustic Features Speech Emotion Recognition Using Cross-Attention Transformer
He, Yurun / Minematsu, Nobuaki / Saito, Daisuke et al. | 2023
digital version
1: Output-Dependent Gaussian Process State-Space Model
Lin, Zhidi / Cheng, Lei / Yin, Feng / Xu, Lexi / Cui, Shuguang et al. | 2023
digital version
1: Graph Based Semantic Ensemble of Riemannian Neural Structured Learning for BCI-EEG Signal Classification
Gupta, Vinay / Behera, Laxmidhar / Sandhan, Tushar et al. | 2023
digital version
1: On the Importance of Different Cough Phases for COVID-19 Detection
Zhu, Yi / Shaik, Mahil Hussain / Falk, Tiago H. et al. | 2023
digital version
1: SRTNET: Time Domain Speech Enhancement via Stochastic Refinement
Qiu, Zhibin / Fu, Mengfan / Yu, Yinfeng / Yin, Lili / Sun, Fuchun / Huang, Hao et al. | 2023
digital version
1: TRICL: Triplet Continual Learning
Zhang, Xianchao / Wang, Guanglu / Zhang, Xiaotong / Liu, Han / Yin, Zhengxi / Yang, Wentao et al. | 2023
digital version
1: Modulation-Based Center Alignment and Motion Mining for Spatial Temporal Action Detection
Zhao, Weiji / Huang, Kefeng / Zhang, Chongyang et al. | 2023
digital version
1: Context-Aware Coherent Speaking Style Prediction with Hierarchical Transformers for Audiobook Speech Synthesis
Lei, Shun / Zhou, Yixuan / Chen, Liyang / Wu, Zhiyong / Kang, Shiyin / Meng, Helen et al. | 2023
digital version
1: Electric Network Frequency Detection Using Least Absolute Deviations
Korgialas, Christos / Kotropoulos, Constantine et al. | 2023
digital version
1: An Empirical Study on Speech Restoration Guided by Self-Supervised Speech Representation
Byun, Jaeuk / Ji, Youna / Chung, Soo-Whan / Choe, Soyeon / Choi, Min-Seok et al. | 2023
digital version
1: Source Localization for Extremely Large-Scale Antenna Arrays with Spatial Non-Stationarity
Wu, Xiaohuan / Sun, Ji / Jia, Xiaoyuan / Wang, Shuxin et al. | 2023
digital version
1: Cross-Modal Optical Flow Estimation via Modality Compensation and Alignment
Zhai, Mingliang / Ni, Kang / Xie, Jiucheng / Gao, Hao et al. | 2023
digital version
1: Detecting Out-of-Distribution Examples Via Class-Conditional Impressions Reappearing
Chen, Jinggang / Qu, Xiaoyang / Li, Junjie / Wang, Jianzong / Wan, Jiguang / Xiao, Jing et al. | 2023
digital version
1: OTW: Optimal Transport Warping for Time Series
Latorre, Fabian / Liu, Chenghao / Sahoo, Doyen / Hoi, Steven C.H. et al. | 2023
digital version
1: Enhancing Unsupervised Speech Recognition with Diffusion GANS
Wu, Xianchao et al. | 2023
digital version
1: Cross-Modal Matching and Adaptive Graph Attention Network for RGB-D Scene Recognition
Guo, Yuhui / Liang, Xun / Kwok, James T. / Zheng, Xiangping / Wu, Bo / Ma, Yuefeng et al. | 2023
digital version
1: Column-Based Matrix Approximation with Quasi-Polynomial Structure
Chae, Jeongmin / Narayanamurthy, Praneeth / Bac, Selin / Sharada, Shaama Mallikarjun / Mitra, Urbashi et al. | 2023
digital version
1: Row Conditional-TGAN for Generating Synthetic Relational Databases
Gueye, Mohamed / Attabi, Yazid / Dumas, Maxime et al. | 2023
digital version
1: Product Graph Learning From Multi-Attribute Graph Signals with Inter-Layer Coupling
Zhang, Chenyue / He, Yiran / Wai, Hoi-To et al. | 2023
digital version
1: Unlimited Sampling Radar: Life Below the Quantization Noise
Feuillen, Thomas / Shankar MRR, Bhavani / Bhandari, Ayush et al. | 2023
digital version
1: SQA: Strong Guidance Query with Self-Selected Attention for Human-Object Interaction Detection
Zhang, Feng / Sheng, Liu / Guo, Bingnan / Chen, Ruixiang / Chen, Junhao et al. | 2023
digital version
1: Optimal Compression for Minimizing Classification Error Probability: An Information-Theoretic Approach
Gao, Jingchao / Tang, Ao / Xu, Weiyu et al. | 2023
digital version
1: Whether Contribution of Features Differ Between Video-Mediated and In-Person Meetings in Important Utterance Estimation
Nihei, Fumio / Ishii, Ryo / Nakano, Yukiko I. / Fukayama, Atsushi / Nakamura, Takao et al. | 2023
digital version
1: Hybrid Neural Network with Cross- and Self-Module Attention Pooling for Text-Independent Speaker Verification
Alam, Jahangir / Kang, Woo Hyun / Fathan, Abderrahim et al. | 2023
digital version
1: Light-Weight Sequential SBL Algorithm: An Alternative to OMP
Pote, Rohan R. / Rao, Bhaskar D. et al. | 2023
digital version
1: CyPMLI: WISL-Minimized Unimodular Sequence Design via Power Method-Like Iterations
Eamaz, Arian / Yeganegi, Farhang / Soltanalian, Mojtaba et al. | 2023
digital version
1: Invariant Adversarial Imitation Learning From Visual Inputs
Zhang, Haoran / Tian, Yinghong / Yuan, Liang / Lu, Yue et al. | 2023
digital version
1: Feature-Rich Audio Model Inversion for Data-Free Knowledge Distillation Towards General Sound Classification
Kang, Zuheng / He, Yayun / Wang, Jianzong / Peng, Junqing / Qu, Xiaoyang / Xiao, Jing et al. | 2023
digital version
1: Relating EEG Recordings to Speech Using Envelope Tracking and The Speech-FFR
Thornton, Mike / Mandic, Danilo / Reichenbach, Tobias et al. | 2023
digital version
1: A New Probabilistic Distance Metric with Application in Gaussian Mixture Reduction
Sajedi, Ahmad / Lawryshyn, Yuri A. / Plataniotis, Konstantinos N. et al. | 2023
digital version
1: Nonnegative Block-Term Decomposition with the β-Divergence: Joint Data Fusion and Blind Spectral Unmixing
Prevost, C. / Leplat, V. et al. | 2023
digital version
1: Simultaneously Learning Robust Audio Embeddings and Balanced Hash Codes for Query-by-Example
Singh, Anup / Demuynck, Kris / Arora, Vipul et al. | 2023
digital version
1: Robust and Parallelizable Tensor Completion Based on Tensor Factorization and Maximum Correntropy Criterion
He, Yicong / Atia, George K. et al. | 2023
digital version
1: Possibilistic Bernoulli Filter for Extended Target Tracking
Chen, Zhijin / Ristic, Branko / Kim, Du Yong et al. | 2023
digital version
1: Augmentation Robust Self-Supervised Learning for Human Activity Recognition
Xu, Cong / Li, Yuhang / Lee, Dae / Hoon Park, Dae / Mao, Hongda / Do, Huyen / Chung, Jonathan / Nair, Dinesh et al. | 2023
digital version
1: RIS-Aided Wideband DFRC with Reconfigurable Holographic Surface
Wei, Tong / Wu, Linlong / Mishra, Kumar Vijay / Bhavani Shankar, M. R. et al. | 2023
digital version
1: Time-Varying Signals Recovery Via Graph Neural Networks
Castro-Correa, Jhon A. / Giraldo, Jhony H. / Mondal, Anindya / Badiey, Mohsen / Bouwmans, Thierry / Malliaros, Fragkiskos D. et al. | 2023
digital version
1: Low-Rank Plus Sparse Trajectory Decomposition for Direct Exoplanet Imaging
Vary, Simon / Daglayan, Hazan / Jacques, Laurent / Absil, P.-A. et al. | 2023
digital version
1: Healthcall Corpus and Transformer Embeddings from Healthcare Customer-Agent Conversations
Lackovic, Nikola / Montacie, Claude / Lequilliec, Cedric / Caraty, Marie-Jose et al. | 2023
digital version
1: Tracking Objects and Activities with Attention for Temporal Sentence Grounding
Xiong, Zeyu / Liu, Daizong / Zhou, Pan / Zhu, Jiahao et al. | 2023
digital version
1: A Computationally Efficient Algorithm for Distributed Adaptive Signal Fusion Based on Fractional Programs
Musluoglu, Cem Ates / Bertrand, Alexander et al. | 2023
digital version
1: Improving Weakly Supervised Sound Event Detection with Causal Intervention
Xin, Yifei / Yang, Dongchao / Cui, Fan / Wang, Yujun / Zou, Yuexian et al. | 2023
digital version
1: Phase Retrieval for Rydberg Quantum Arrays
Vouras, Peter / Vijay Mishra, Kumar / Artusio-Glimpse, Alexandra et al. | 2023
digital version
1: Federated Semi-Supervised Learning for Object Detection in Autonomous Driving
Chi, Fangyuan / Wang, Yixiao / Nasiopoulos, Panos / Leung, Victor C. M. / Pourazad, Mahsa T. et al. | 2023
digital version
1: SIAST: A Slot Imbalance-Aware Self-Training Scheme for Semi-Supervised Slot Filling
Liu, Jiachi / Xiong, Sishi / He, Yuehuan / Zhou, Tong / Wang, Liwen / Li, Xuefeng / Xiao, Bo et al. | 2023
digital version
1: Continual Cell Instance Segmentation of Microscopy Images
Chuang, Tzu-Ting / Wei, Ting-Yun / Hsieh, Yu-Hsing / Chen, Chu-Song / Yang, Huei-Fang et al. | 2023
digital version
1: Code-Switching Text Generation and Injection in Mandarin-English ASR
Yu, Haibin / Hu, Yuxuan / Qian, Yao / Jin, Ma / Liu, Linquan / Liu, Shujie / Shi, Yu / Qian, Yanmin / Lin, Edward / Zeng, Michael et al. | 2023
digital version
1: Multi-Speaker End-to-End Multi-Modal Speaker Diarization System for the MISP 2022 Challenge
Liu, Tao / Chen, Zhengyang / Qian, Yanmin / Yu, Kai et al. | 2023
digital version
1: How to Push the Fastest Model 50x Faster: Streaming Non-Autoregressive Speech Synthesis on Resouce-Limited Devices
Nguyen, Van-Thinh / Pham, Hung-Cuong / Mac, Dang-Khoa et al. | 2023
digital version
1: Improving Transformer-Based Networks with Locality for Automatic Speaker Verification
Sang, Mufan / Zhao, Yong / Liu, Gang / Hansen, John H.L. / Wu, Jian et al. | 2023
digital version
1: Quickest Change Detection with Leave-one-out Density Estimation
Liang, Yuchen / Veeravalli, Venugopal V. et al. | 2023
digital version
1: CPA: Compressed Private Aggregation for Scalable Federated Learning Over Massive Networks
Lang, Natalie / Sofer, Elad / Shlezinger, Nir / D'Oliveira, Rafael G. L. / El Rouayheb, Salim et al. | 2023
digital version
1: Optimizing Vision Transformers for Medical Image Segmentation
Liu, Qianying / Kaul, Chaitanya / Wang, Jun / Anagnostopoulos, Christos / Murray-Smith, Roderick / Deligianni, Fani et al. | 2023
digital version
1: Jointly Visual- and Semantic-Aware Graph Memory Networks for Temporal Sentence Localization in Videos
Liu, Daizong / Zhou, Pan et al. | 2023
digital version
1: Rate-Distortion Optimized Variable-Node-size Trisoup for Point Cloud Coding
Unno, Kyohei / Matsuzaki, Kohei / Komorita, Satoshi / Kawamura, Kei et al. | 2023
digital version
1: Cross-Device Federated Learning for Mobile Health Diagnostics: A First Study on COVID-19 Detection
Xia, Tong / Han, Jing / Ghosh, Abhirup / Mascolo, Cecilia et al. | 2023
digital version
1: Disentangling Speech from Surroundings with Neural Embeddings
Omran, Ahmed / Zeghidour, Neil / Borsos, Zalan / de Chaumont Quitry, Felix / Slaney, Malcolm / Tagliasacchi, Marco et al. | 2023
digital version
1: Diffusion Motion: Generate Text-Guided 3D Human Motion by Diffusion Model
Ren, Zhiyuan / Pan, Zhihong / Zhou, Xin / Kang, Le et al. | 2023
digital version
1: Distributed Admm with Limited Communications Via Deep Unfolding
Noah, Yoav / Shlezinger, Nir et al. | 2023
digital version
1: Semantic Preprocessor for Image Compression for Machines
Yang, Mingyi / Herranz, Luis / Yang, Fei / Murn, Luka / Blanch, Marc Gorriz / Wan, Shuai / Yang, Fuzheng / Mrak, Marta et al. | 2023
digital version
1: New Interpretable Patterns and Discriminative Features from Brain Functional Network Connectivity using Dictionary Learning
Ghayem, F. / Yang, H. / Kantar, F. / Kim, S.-J. / Calhoun, V. D. / Adali, T. et al. | 2023
digital version
1: Multi-User Data Detection in Massive MIMO with 1-Bit ADCS
Radbord, Amin / Atzeni, Italo / Tolli, Antti et al. | 2023
digital version
1: Estimating and Analyzing Neural Information flow using Signal Processing on Graphs
Schwock, Felix / Bloch, Julien / Atlas, Les / Abadi, Shima / Yazdan-Shahmorad, Azadeh et al. | 2023
digital version
1: Oct Image Blind Despeckling Based on Gradient Guided Filter with Speckle Statistical Prior
Li, Sanqian / Xiong, Muxing / Yang, Bing / Zhang, Xiaoqing / Higashita, Risa / Liu, Jiang et al. | 2023
digital version
1: SSVMR: Saliency-Based Self-Training for Video-Music Retrieval
Cheng, Xuxin / Zhu, Zhihong / Li, Hongxiang / Li, Yaowei / Zou, Yuexian et al. | 2023
digital version
1: Efficient Multi-Scale Attention Module with Cross-Spatial Learning
Ouyang, Daliang / He, Su / Zhang, Guozhong / Luo, Mingzhu / Guo, Huaiyong / Zhan, Jian / Huang, Zhijie et al. | 2023
digital version
1: Local to global prior Learning for blind Unsupervised Image super Resolution
Yamawaki, Kazuhiro / Han, Xian-Hua et al. | 2023
digital version
1: Multi-Observation Hidden Semi-Markov Model for Photoplethysmogram Signal Semantic Segmentation
Hasanzadeh, Navid / Valaee, Shahrokh / Salehinejad, Hojjat et al. | 2023
digital version
1: Relational Representation Learning for Zero-Shot Relation Extraction with Instance Prompting and Prototype Rectification
Duan, Bin / Liu, Xingxian / Wang, Shusen / Xu, Yajing / Xiao, Bo et al. | 2023
digital version
1: Customized Automatic Face Beautification
Chen, Wang / Chen, Peizhen / Chen, Weijie / Lin, Luojun et al. | 2023
digital version
1: Towards Trustworthy Multi-Label Sewer Defect Classification via Evidential Deep Learning
Zhao, Chenyang / Hu, Chuanfei / Shao, Hang / Wang, Zhe / Wang, Yongxiong et al. | 2023
digital version
1: Neural Architecture Search with Multimodal Fusion Methods for Diagnosing Dementia
Chatzianastasis, Michail / Ilias, Loukas / Askounis, Dimitris / Vazirgiannis, Michalis et al. | 2023
digital version
1: Infrared and Visible Image Fusion by Using Multi-Scale Transformation and Fractional-Order Gradient Information
Wu, Shiwei / Zhang, Kang / Yuan, Xia / Zhao, Chunxia et al. | 2023
digital version
1: I3D: Transformer Architectures with Input-Dependent Dynamic Depth for Speech Recognition
Peng, Yifan / Lee, Jaesong / Watanabe, Shinji et al. | 2023
digital version
1: Semi-Supervised Graph Ultra-Sparsifier Using Reweighted ℓ1 Optimization
Li, Jiayu / Zhang, Tianyun / Jin, Shengmin / Zafarani, Reza et al. | 2023
digital version
1: Retrieval-Based Natural 3D Human Motion Generation
Tan, Zehan / Yang, Weidong / Wu, Shuai et al. | 2023
digital version
1: Deep Learning-Based Compressive Sampling Optimization in Massive MIMO Systems
Pavel, Saidur R. / Zhang, Yimin D. / Greco, Maria S. / Gini, Fulvio et al. | 2023
digital version
1: Multi-Resolution Location-Based Training for Multi-Channel Continuous Speech Separation
Taherian, Hassan / Wang, DeLiang et al. | 2023
digital version
1: Multitrack Music Transcription with a Time-Frequency Perceiver
Lu, Wei -Tsung / Wang, Ju-Chiang / Hung, Yun -Ning et al. | 2023
digital version
1: On the Relevance of the Differences Between HRTF Measurement Setups for Machine Learning
Pauwels, Johan / Picinali, Lorenzo et al. | 2023
digital version
1: On Neural Architectures for Deep Learning-Based Source Separation of Co-Channel OFDM Signals
Lee, Gary C.F. / Weiss, Amir / Lancho, Alejandro / Polyanskiy, Yury / Wornell, Gregory W. et al. | 2023
digital version
1: LightGrad: Lightweight Diffusion Probabilistic Model for Text-to-Speech
Chen, Jie / Song, Xingchen / Peng, Zhendong / Zhang, Binbin / Pan, Fuping / Wu, Zhiyong et al. | 2023
digital version
1: Wekws: A Production First Small-Footprint End-to-End Keyword Spotting Toolkit
Wang, Jie / Xu, Menglong / Hou, Jingyong / Zhang, Binbin / Zhang, Xiao-Lei / Xie, Lei / Pan, Fuping et al. | 2023
digital version
1: Gated Enhanced RPN and Hybrid-View for Few-Shot Object Detection
Wei, Xujun / Zhou, Zechu / Guo, Pinxue / Zhang, Wenqiang et al. | 2023
digital version
1: SW-WAVENET: Learning Representation from Spectrogram and Wavegram Using Wavenet for Anomalous Sound Detection
Chen, Haihui / Ran, Likai / Sun, Xixia / Cai, Chao et al. | 2023
digital version
1: Towards Trustworthy Phoneme Boundary Detection with Autoregressive Model and Improved Evaluation Metric
Kim, Hyeongju / Choi, Hyeong-Seok et al. | 2023
digital version
1: Knowledge Transfer for on-Device Speech Emotion Recognition With Neural Structured Learning
Chang, Yi / Ren, Zhao / Nguyen, Thanh Tam / Qian, Kun / Schuller, Bjorn W. et al. | 2023
digital version
1: Asymptotic Bias and Variance of Kernel Ridge Regression
Solo, Victor et al. | 2023
digital version
1: Modeling Turn-Taking in Human-To-Human Spoken Dialogue Datasets Using Self-Supervised Features
Morais, Edmilson / Damasceno, Matheus / Aronowitz, Hagai / Satt, Aharon / Hoory, Ron et al. | 2023
digital version
1: Do Coarser Units Benefit Cluster Prediction-Based Speech Pre-Training?
Elkahky, Ali / Hsu, Wei-Ning / Tomasello, Paden / Nguyen, Tu-Anh / Algayres, Robin / Adi, Yossi / Copet, Jade / Dupoux, Emmanuel / Mohamed, Abdelrahman et al. | 2023
digital version
1: Unsupervised Anomaly Detection and Localization of Machine Audio: A Gan-Based Approach
Jiang, Anbai / Zhang, Wei-Qiang / Deng, Yufeng / Fan, Pingyi / Liu, Jia et al. | 2023
digital version
1: TRUSTERA: A Live Conversation Redaction System
Gouvea, Evandro / Dadgar, Ali / Jalalvand, Shahab / Chengalvarayan, Rathi / Jayakumar, Badrinath / Price, Ryan / Ruiz, Nicholas / McGovern, Jennifer / Bangalore, Srinivas / Stern, Ben et al. | 2023
digital version
1: A Comprehensive Comparison of Projections in Omnidirectional Super-Resolution
Pi, Huicheng / Tian, Senmao / Lu, Ming / Liu, Jiaming / Guo, Yandong / Zhang, Shunli et al. | 2023
digital version
1: Compressive Estimation of Near Field Channels for Ultra Massive-Mimo Wideband THz Systems
Tarboush, Simon / Ali, Anum / Al-Naffouri, Tareq Y. et al. | 2023
digital version
1: W2KPE: Keyphrase Extraction with Word-Word Relation
Cheng, Wen / Dong, Shichen / Wang, Wei et al. | 2023
digital version
1: CPD-GAN: Cascaded Pyramid Deformation GAN for Pose Transfer
Huang, Yuan / Tang, Yuting / Zheng, Xiu / Tang, Jie et al. | 2023
digital version
1: Auto-AVSR: Audio-Visual Speech Recognition with Automatic Labels
Ma, Pingchuan / Haliassos, Alexandros / Fernandez-Lopez, Adriana / Chen, Honglie / Petridis, Stavros / Pantic, Maja et al. | 2023
digital version
1: SDG-L: A Semiparametric Deep Gaussian Process based Framework for Battery Capacity Prediction
Liu, Hanbing / Wu, Yanru / Li, Yang / Kuruoglu, Ercan E. / Zhang, Xuan et al. | 2023
digital version
1: Eigen-Decomposition-Free Directed Graph Sampling via Gershgorin Disc Alignment
Li, Yuejiang / Vicky Zhao, H. / Cheung, Gene et al. | 2023
digital version
1: Self-Supervised Audio-Visual Speaker Representation with Co-Meta Learning
Chen, Hui / Zhang, Hanyi / Wang, Longbiao / Lee, Kong Aik / Liu, Meng / Dang, Jianwu et al. | 2023
digital version
1: An Asynchronous Updating Reinforcement Learning Framework for Task-Oriented Dialog System
Zhang, Sai / Hu, Yuwei / Wang, Xiaojie / Yuan, Caixia et al. | 2023
digital version
1: Gridless Target Localization for FDA-Mimo Radar with Sparse Arrays
Wu, Xiaohuan / Liu, Yaxin / Jia, Xiaoyuan et al. | 2023
digital version
1: Anchored Speech Recognition with Neural Transducers
Raj, Desh / Jia, Junteng / Mahadeokar, Jay / Wu, Chunyang / Moritz, Niko / Zhang, Xiaohui / Kalinli, Ozlem et al. | 2023
digital version
1: A Novel Approach Based on Voronoï Cells to Classify Spectrogram Zeros of Multicomponent Signals
Laurent, N. / Meignen, S. / Colominas, M. A. / Miramont, J. M. / Auger, F. et al. | 2023
digital version
1: SLICER: Learning Universal Audio Representations Using Low-Resource Self-Supervised Pre-Training
Seth, Ashish / Ghosh, Sreyan / Umesh, S. / Manocha, Dinesh et al. | 2023
digital version
1: Adapter Tuning With Task-Aware Attention Mechanism
Lu, Jinliang / Jin, Feihu / Zhang, Jiajun et al. | 2023
digital version
1: Spice+: Evaluation of Automatic Audio Captioning Systems with Pre-Trained Language Models
Gontier, Felix / Serizel, Romain / Cerisara, Christophe et al. | 2023
digital version
1: HITSZ TMG at ICASSP 2023 SPGC Shared Task: Leveraging Pre-Training and Distillation Method for Title Generation with Limited Resource
Xu, Tianxiao / Zheng, Zihao / Hu, Xinshuo / Sun, Zetian / Zhao, Yu / Hu, Baotian et al. | 2023
digital version
1: Prior-Enhanced Temporal Action Localization Using Subject-Aware Spatial Attention
Liu, Yifan / Tang, Youbao / Zhang, Ning / Lin, Ruei-Sung / Wang, Haoqian et al. | 2023
digital version
1: Phoneme-Level Bert for Enhanced Prosody of Text-To-Speech with Grapheme Predictions
Li, Yinghao Aaron / Han, Cong / Jiang, Xilin / Mesgarani, Nima et al. | 2023
digital version
1: CO-NET: Classification-Oriented Point Cloud Sampling via Informative Feature Learning and Non-Overlapped Local Adjustment
Lin, Yanan / Chen, Keyu / Zhou, Shihao / Huang, Yunan / Lei, Yunqi et al. | 2023
digital version
1: An Automotive Radar Dataset For Object Classification
Shyam, Akshad / Komalavally, Kusum / Gautam, Monika / Kancharla, Vamshikrishna / Gudisa, Vennela / Patil, Virendra / Balasubramanian, Aanandh / Channappayya, Sumohana et al. | 2023
digital version
1: Personalized Federated Learning on Long-Tailed Data via Adversarial Feature Augmentation
Lu, Yang / Qian, Pinxin / Huang, Gang / Wang, Hanzi et al. | 2023
digital version
1: Robust Content-Variant Reference Image Quality Assessment Via Similar Patch Matching
Shi, Wenbo / Yang, Wenming / Liao, Qingmin et al. | 2023
digital version
1: Selinet: A Lightweight Model for Single Channel Speech Separation
Tan, Ha Minh / Vu, Duc-Quang / Wang, Jia-Ching et al. | 2023
digital version
1: Multi-Speaker Speech Synthesis from Electromyographic Signals by Soft Speech Unit Prediction
Scheck, Kevin / Schultz, Tanja et al. | 2023
digital version
1: Meta++ Network for Few-Shot Aerospace Crack Segmentation
Xu, Chengyuan / Liu, Kang / Li, Xuelong et al. | 2023
digital version
1: On Cross-Layer Alignment for Model Fusion of Heterogeneous Neural Networks
Nguyen, Dang / Nguyen, Trang / Nguyen, Khai / Phung, Dinh / Bui, Hung / Ho, Nhat et al. | 2023
digital version
1: Gaussian Prior Reinforcement Learning for Nested Named Entity Recognition
Yang, Yawen / Hu, Xuming / Ma, Fukun / Li, Shu'Ang / Liu, Aiwei / Wen, Lijie / Yu, Philip S. et al. | 2023
digital version
1: Near-field Localization with Dynamic Metasurface Antennas
Yang, Qianyu / Guerra, Anna / Guidi, Francesco / Shlezinger, Nir / Zhang, Haiyang / Dardari, Davide / Wang, Baoyun / Eldar, Yonina C. et al. | 2023
digital version
1: Performance of Social Machine Learning Under Limited Data
Hu, Ping / Bordignon, Virginia / Kayaalp, Mert / Sayed, Ali H. et al. | 2023
digital version
1: Efficient Quantized Constant Envelope Precoding for Multiuser Downlink Massive MIMO Systems
Wu, Zheyu / Liu, Ya-Feng / Jiang, Bo / Dai, Yu-Hong et al. | 2023
digital version
1: Switching Kronecker Product Linear Filtering for Multispeaker Adaptive Speech Dereverberation
Huang, Gongping / Benesty, Jacob / Cohen, Israel / Winebrand, Emil / Chen, Jingdong / Kellermann, Walter et al. | 2023
digital version
1: SADE: A Self-Adaptive Expert for Multi-Dataset Question Answering
Peng, Yixing / Wang, Quan / Mao, Zhendong / Zhang, Yongdong et al. | 2023
digital version
1: Multi-View Millimeter-Wave Imaging Over Wireless Cellular Network
Tong, Xin / Zhang, Zhaoyang / Yang, Zhaohui et al. | 2023
digital version
1: Effective Graph-Based Modeling of Articulation Traits for Mispronunciation Detection and Diagnosis
Yan, Bi-Cheng / Wang, Hsin-Wei / Wang, Yi-Cheng / Chen, Berlin et al. | 2023
digital version
1: Visual Prompting for Adversarial Robustness
Chen, Aochuan / Lorenz, Peter / Yao, Yuguang / Chen, Pin-Yu / Liu, Sijia et al. | 2023
digital version
1: Inter-Scale Sure-Let Denoise with Structured Deep Image Prior: Interpretable Self-Supervised Learning
Li, Jikai / Muramatsu, Shogo et al. | 2023
digital version
1: Personalized Speech Enhancement Combining Band-Split RNN and Speaker Attentive Module
Le, Xiaohuai / Chen, Li / He, Chao / Guo, Yiqing / Chen, Cheng / Xia, Xianjun / Lu, Jing et al. | 2023
digital version
1: Grad-CAM-Inspired Interpretation of Nearfield Acoustic Holography using Physics-Informed Explainable Neural Network
Kafri, Hagar / Olivieri, Marco / Antonacci, Fabio / Moradi, Mordehay / Sarti, Augusto / Gannot, Sharon et al. | 2023
digital version
1: Epilepsy Detection Grand Challenge
Chatzichristos, Christos / Bhagubai, Miguel / Van Paesschen, Wim / De Vos, Maarten et al. | 2023
digital version
1: Lightweight, Multi-Speaker, Multi-Lingual Indic Text-to-Speech
Singh, Abhayjeet / Nagireddi, Amala / G, Deekshitha / Bandekar, Jesuraja / R, Roopa / Badiger, Sandhya / Udupa, Sathvik / Ghosh, Prasanta Kumar / Murthy, Hema A / Zen, Heiga et al. | 2023
digital version
1: Overview of the ICASSP 2023 General Meeting Understanding and Generation Challenge (MUG)
Zhang, Qinglin / Deng, Chong / Liu, Jiaqing / Yu, Hai / Chen, Qian / Wang, Wen / Yan, Zhijie / Liu, Jinglin / Ren, Yi / Zhao, Zhou et al. | 2023
digital version
1: Multilingual Alzheimer’s Dementia Recognition through Spontaneous Speech: A Signal Processing Grand Challenge
Luz, Saturnino / Haider, Fasih / Fromm, Davida / Lazarou, Ioulietta / Kompatsiaris, Ioannis / MacWhinney, Brian et al. | 2023
digital version
1: Divcon: Learning Concept Sequences for Semantically Diverse Image Captioning
Zheng, Yue / Li, Ya-Li / Wang, Shengjin et al. | 2023
digital version
1: Exploiting Virtual Array Diversity for Accurate Radar Detection
Guan, Junfeng / Madani, Sohrab / Ahmed, Waleed / Hussein, Samah / Gupta, Saurabh / Hassanieh, Haitham et al. | 2023
digital version
1: Accelerated Distributed Stochastic Non-Convex Optimization over Time-Varying Directed Networks
Chen, Yiyue / Hashemi, Abolfazl / Vikalo, Haris et al. | 2023
digital version
1: SAN: A Robust End-to-End ASR Model Architecture
Min, Zeping / Ge, Qian / Huang, Guanhua et al. | 2023
digital version
1: Resource Allocation for UAV-Enabled Integrated Sensing and Communication (ISAC) via Multi-Objective Optimization
Rezaei, Omid / Naghsh, Mohammad Mahdi / Karbasi, Seyed Mohammad / Nayebi, Mohammad Mahdi et al. | 2023
digital version
1: Removing Radio Frequency Interference From Auroral Kilometric Radiation With Stacked Autoencoders
Chang, Allen / Knapp, Mary / LaBelle, James / Swoboda, John / Volz, Ryan / Erickson, Philip J. et al. | 2023
digital version
1: Soft Label Coding for end-to-end Sound Source Localization with ad-hoc Microphone Arrays
Feng, Linfeng / Gong, Yijun / Zhang, Xiao-Lei et al. | 2023
digital version
1: Study And Design Of Robust Personal Sound Zones With Vast Using Low Rank Rirs
Bhattacharjee, Sankha Subhra / Shi, Liming / Ping, Guoli / Shen, Xiaoxiang / Christensen, Mads Grasboll et al. | 2023
digital version
1: ROI-Based Deep Image Compression with Swin Transformers
Li, Binglin / Liang, Jie / Fu, Haisheng / Han, Jingning et al. | 2023
digital version
1: Event-Based Visual Microphone
Howard, Matthew / Hirakawa, Keigo et al. | 2023
digital version
1: Named Entity Detection and Injection for Direct Speech Translation
Gaido, Marco / Tang, Yun / Kulikov, Ilia / Huang, Rongqing / Gong, Hongyu / Inaguma, Hirofumi et al. | 2023
digital version
1: Efficient Stuttering Event Detection Using Siamese Networks
Mohapatra, Payal / Islam, Bashima / Islam, Md Tamzeed / Jiao, Ruochen / Zhu, Qi et al. | 2023
digital version
1: BadRes: Reveal the Backdoors Through Residual Connection
He, Mingrui / Chen, Tianyu / Zhou, Haoyi / Zhang, Shanghang / Li, Jianxin et al. | 2023
digital version
1: End-to-End Unsupervised Sketch to Image Generation
Lv, Xingming / Wu, Lei / Cheng, Zhenwei / Meng, Xiangxu et al. | 2023
digital version
1: Trinet: Stabilizing Self-Supervised Learning From Complete or Slow Collapse
Cao, Lixin / Wang, Jun / Yang, Ben / Su, Dan / Yu, Dong et al. | 2023
digital version
1: ERBNet: An Effective Representation Based Network for Unbiased Scene Graph Generation
Ma, Wenxi / Hou, Tianxiang / Di, Qianji / Qi, Zhongang / Shan, Ying / Wang, Hanzi et al. | 2023
digital version
1: Deformable Cross Attention for Learning Optical Flow
Abdein, Rokia / Xiang, Xuezhi / Lv, Ning / Saddik, Abdulmotaleb El et al. | 2023
digital version
1: Optimal Kernel for Real-Time Arbitrary-Shaped Text Detection
Ma, Haozhao / Yang, Chuang / Yuan, Yuan / Wang, Qi et al. | 2023
digital version
1: SVMV: Spatiotemporal Variance-Supervised Motion Volume for Video Frame Interpolation
Luo, Yao / Pan, Jinshan / Tang, Jinhui et al. | 2023
digital version
1: Cumulative Attention Based Streaming Transformer ASR with Internal Language Model Joint Training and Rescoring
Li, Mohan / Do, Cong-Thanh / Doddipatla, Rama et al. | 2023
digital version
1: Two-Stage Neural Network for ICASSP 2023 Speech Signal Improvement Challenge
Liu, Mingshuai / Lv, Shubo / Zhang, Zihan / Han, Runduo / Hao, Xiang / Xia, Xianjun / Chen, Li / Xiao, Yijian / Xie, Lei et al. | 2023
digital version
1: The Multimodal Information Based Speech Processing (Misp) 2022 Challenge: Audio-Visual Diarization And Recognition
Wang, Zhe / Wu, Shilong / Chen, Hang / He, Mao-Kui / Du, Jun / Lee, Chin-Hui / Chen, Jingdong / Watanabe, Shinji / Siniscalchi, Sabato / Scharenborg, Odette et al. | 2023
digital version
1: Implicit Vehicle Positioning with Cooperative Lidar Sensing
Barbieri, Luca / Tedeschini, Bernardo Camajori / Brambilla, Mattia / Nicoli, Monica et al. | 2023
digital version
1: Self-Supervised Guided Hypergraph Feature Propagation for Semi-Supervised Classification with Missing Node Features
Lei, Chengxiang / Fu, Sichao / Wang, Yuetian / Qiu, Wenhao / Hu, Yachen / Peng, Qinmu / You, Xinge et al. | 2023
digital version
1: Differential Analysis for Networks Obeying Conservation Laws
Rayas, Anirudh / Anguluri, Rajasekhar / Cheng, Jiajun / Dasarathy, Gautam et al. | 2023
digital version
1: Hardware-Limited Non-Uniform Task-Based Quantizers
Bernardo, Neil Irwin / Zhu, Jingge / Eldar, Yonina C. / Evans, Jamie et al. | 2023
digital version
1: Adaptive Noise Canceller Algorithm with SNR-Based Stepsize and Data-Dependent Averaging
Sugiyama, Akihiko et al. | 2023
digital version
1: Signal Processing And Quantum State Tomography on Noisy Devices
Shi, Wenbo / Malaney, Robert et al. | 2023
digital version
1: In-Sensor & Neuromorphic Computing Are all You Need for Energy Efficient Computer Vision
Datta, Gourav / Liu, Zeyu / Kaiser, Md Abdullah-Al / Kundu, Souvik / Mathai, Joe / Yin, Zihan / Jacob, Ajey P. / Jaiswal, Akhilesh R. / Beerel, Peter A. et al. | 2023
digital version
1: Adversarial Contrastive Distillation with Adaptive Denoising
Wang, Yuzheng / Chen, Zhaoyu / Yang, Dingkang / Liu, Yang / Liu, Siao / Zhang, Wenqiang / Qi, Lizhe et al. | 2023
digital version
1: On Designing Light-Weight Object Trackers Through Network Pruning: Use CNNS or Transformers?
Aggarwal, Saksham / Gupta, Taneesh / Sahu, Pawan K. / Chavan, Arnav / Tiwari, Rishabh / Prasad, Dilip K. / Gupta, Deepak K. et al. | 2023
digital version
1: Variational Inference Aided Estimation of Time Varying Channels
Bock, Benedikt / Baur, Michael / Rizzello, Valentina / Utschick, Wolfgang et al. | 2023
digital version
1: Class-Incremental Learning on Multivariate Time Series Via Shape-Aligned Temporal Distillation
Qiao, Zhongzheng / Hu, Minghui / Jiang, Xudong / Suganthan, Ponnuthurai Nagaratnam / Savitha, Ramasamy et al. | 2023
digital version
1: Inv-Senet: Invariant Self Expression Network for Clustering Under Biased Data
Singh, Ashutosh / Singh, Ashish / Masoomi, Aria / Imbiriba, Tales / Learned-Miller, Erik / Erdogmus, Deniz et al. | 2023
digital version
1: Fine-Grained Textual Knowledge Transfer to Improve RNN Transducers for Speech Recognition and Understanding
Sunder, Vishal / Thomas, Samuel / Kuo, Hong-Kwang J. / Kingsbury, Brian / Fosler-Lussier, Eric et al. | 2023
digital version
1: Training Neural Networks for Sequential Change-Point Detection
Lee, Junghwan / Xie, Yao / Cheng, Xiuyuan et al. | 2023
digital version
1: High-Resolution Neural Network Processing of LFM Radar Pulses
Akhtar, Jabran et al. | 2023
digital version
1: MLCGAN: Multi-Lead ECG Synthesis with Multi Label Conditional Generative Adversarial Network
Wu, Jian / Wang, Liping / Pan, Hailin / Wang, Binyu et al. | 2023
digital version
1: NRTSI: Non-Recurrent Time Series Imputation
Shan, Siyuan / Li, Yang / Oliva, Junier B. et al. | 2023
digital version
1: The Edinburgh International Accents of English Corpus: Towards the Democratization of English ASR
Sanabria, Ramon / Bogoychev, Nikolay / Markl, Nina / Carmantini, Andrea / Klejch, Ondrej / Bell, Peter et al. | 2023
digital version
1: Centralized Cascade Multi-Channel Noise Reduction and Acoustic Feedback Cancellation in a Wireless Acoustic Sensor And Actuator Network
Ruiz, Santiago / van Waterschoot, Toon / Moonen, Marc et al. | 2023
digital version
1: Intent Does Matter! Propagating High-Order Relations for Exploring Interest Preferences
Zheng, Xiangping / Liang, Xun / Wu, Bo / Feng, Junlan / Guo, Yuhui / Zhang, Sensen et al. | 2023
digital version
1: Compose & Embellish: Well-Structured Piano Performance Generation via A Two-Stage Approach
Wu, Shih-Lun / Yang, Yi-Hsuan et al. | 2023
digital version
1: Input-Dependent Dynamical Channel Association For Knowledge Distillation
Tang, Qiankun / Zhang, Yuan / Xu, Xiaogang / Wang, Jun / Guo, Yimin et al. | 2023
digital version
1: Robust Adaptive Beamforming with Proximal Method
Li, Ruifu / Cabric, Danijela et al. | 2023
digital version
1: Conformer-Based Target-Speaker Automatic Speech Recognition For Single-Channel Audio
Zhang, Yang / Puvvada, Krishna C. / Lavrukhin, Vitaly / Ginsburg, Boris et al. | 2023
digital version
1: An Isotropy Analysis for Self-Supervised Acoustic Unit Embeddings on the Zero Resource Speech Challenge 2021 Framework
Chen, Jianan / Sakti, Sakriani et al. | 2023
digital version
1: Bimodal Fusion Network for Basic Taste Sensation Recognition from Electroencephalography and Electromyography
Gao, Han / Zhao, Shuo / Li, Huiyan / Liu, Li / Wang, You / Hu, Ruifen / Zhang, Jin / Li, Guang et al. | 2023
digital version
1: Papez: Resource-Efficient Speech Separation with Auditory Working Memory
Oh, Hyunseok / Yi, Juheon / Lee, Youngki et al. | 2023
digital version
1: Effectiveness of Text, Acoustic, and Lattice-Based Representations in Spoken Language Understanding Tasks
Villatoro-Tello, Esau / Madikeri, Srikanth / Zuluaga-Gomez, Juan / Sharma, Bidisha / Saeed Sarfjoo, Seyyed / Nigmatulina, Iuliia / Motlicek, Petr / Ivanov, Alexei V. / Ganapathiraju, Aravind et al. | 2023
digital version
1: Search for Efficient Deep Visual-Inertial Odometry Through Neural Architecture Search
Chen, Yu / Yang, Mingyu / Kim, Hun-Seok et al. | 2023
digital version
1: Prune Then Distill: Dataset Distillation with Importance Sampling
Sundar, Anirudh S / Keskin, Gokce / Chandak, Chander / Chen, I-Fan / Ghahremani, Pegah / Ghosh, Shalini et al. | 2023
digital version
1: CF-VTON: Multi-Pose Virtual Try-on with Cross-Domain Fusion
Du, Chenghu / Xiong, Shengwu et al. | 2023
digital version
1: LQGNET: Hybrid Model-Based and Data-Driven Linear Quadratic Stochastic Control
Casspi, Solomon Goldgraber / Husser, Oliver / Revach, Guy / Shlezinger, Nir et al. | 2023
digital version
1: Mingling or Misalignment? Temporal Shift for Speech Emotion Recognition with Pre-Trained Representations
Shen, Siyuan / Liu, Feng / Zhou, Aimin et al. | 2023
digital version
1: GTN-Bailando: Genre Consistent long-Term 3D Dance Generation Based on Pre-Trained Genre Token Network
Zhuang, Haolin / Lei, Shun / Xiao, Long / Li, Weiqin / Chen, Liyang / Yang, Sicheng / Wu, Zhiyong / Kang, Shiyin / Meng, Helen et al. | 2023
digital version
1: Streaming Multi-Channel Speech Separation with Online Time-Domain Generalized Wiener Filter
Luo, Yi et al. | 2023
digital version
1: String-Based Molecule Generation Via Multi-Decoder VAE
Kwon, Kisoo / Jeong, Kuhwan / Park, Junghyun / Na, Hwidong / Shin, Jinwoo et al. | 2023
digital version
1: Robust Spatiotemporal Fusion of Satellite Images via Convex Optimization
Isono, Ryosuke / Naganuma, Kazuki / Ono, Shunsuke et al. | 2023
digital version
1: A Sidecar Separator Can Convert A Single-Talker Speech Recognition System to A Multi-Talker One
Meng, Lingwei / Kang, Jiawen / Cui, Mingyu / Wang, Yuejiao / Wu, Xixin / Meng, Helen et al. | 2023
digital version
1: N2MVSNet: Non-Local Neighbors Aware Multi-View Stereo Network
Zhang, Zhe / Gao, Huachen / Hu, Yuxi / Wang, Ronggang et al. | 2023
digital version
1: Windowed Fourier Analysis for Signal Processing on Graph Bundles
Roddenberry, T. Mitchell / Segarra, Santiago et al. | 2023
digital version
1: Diffusion-Based Generative Speech Source Separation
Scheibler, Robin / Ji, Youna / Chung, Soo-Whan / Byun, Jaeuk / Choe, Soyeon / Choi, Min-Seok et al. | 2023
digital version
1: Shuffled Autoregression for Motion Interpolation
Huang, Shuo / Jia, Jia / Yang, Zongxin / Wang, Wei / Wu, Haozhe / Yang, Yi / Xing, Junliang et al. | 2023
digital version
1: Joint Estimation of DOA and Distance in Noisy Reverberant Conditions
Bu, Suliang / Zhao, Tuo / Zhao, Yunxin et al. | 2023
digital version
1: Change Point Detection with Neural Online Density-Ratio Estimator
Wang, Xiuheng / Borsoi, Ricardo Augusto / Richard, Cedric / Chen, Jie et al. | 2023
digital version
1: Towards Low-Power Heart Rate Estimation Based on User’s Demographics and Activity Level For Wearables
Pacheco, Andre G. C. / Cabello, Frank A. C. / Fonoff, Adriana M. O. / Rodrigues, Paula G. / Penatti, Otavio A. B. / Pinto, Paula R. et al. | 2023
digital version
1: ifUNet++: Iterative Feedback UNet++ for Infrared Small Target Detection
Weng, Zhangying / Li, Peng / Zhuang, Xin / Yan, Xuefeng / Gong, Lina / Xie, Haoran / Wei, Mingqiang et al. | 2023
digital version
1: Vararray Meets T-Sot: Advancing the State of the Art of Streaming Distant Conversational Speech Recognition
Kanda, Naoyuki / Wu, Jian / Wang, Xiaofei / Chen, Zhuo / Li, Jinyu / Yoshioka, Takuya et al. | 2023
digital version
1: Binary Image Fast Perfect Recovery from Sparse 2D-DFT Coefficients
Pei, Soo-Chang / Chang, Kuo-Wei et al. | 2023
digital version
1: Time-Aware Multiway Adaptive Fusion Network for Temporal Knowledge Graph Question Answering
Liu, Yonghao / Liang, Di / Fang, Fang / Wang, Sirui / Wu, Wei / Jiang, Rui et al. | 2023
digital version
1: Exploiting Interactivity and Heterogeneity for Sleep Stage Classification Via Heterogeneous Graph Neural Network
Jia, Ziyu / Lin, Youfang / Zhou, Yuhan / Cai, Xiyang / Zheng, Peng / Li, Qiang / Wang, Jing et al. | 2023
digital version
1: When is Mimo Massive in Radar?
Shah, Jaimin / Cardone, Martina / Dytso, Alex / Rush, Cynthia et al. | 2023
digital version
1: Detecting Malicious Migration on Edge to Prevent Running Data Leakage
Wong, Yuchen / Shen, Qingni / Li, Cong / Liu, Cunzhan / Ai, Tianxiang et al. | 2023
digital version
1: PI-Trans: Parallel-Convmlp and Implicit-Transformation Based Gan for Cross-View Image Translation
Ren, Bin / Tang, Hao / Wang, Yiming / Li, Xia / Wang, Wei / Sebe, Mcu et al. | 2023
digital version
1: Interpolation of Spatial Room Impulse Responses Using Partial Optimal Transport
Geldert, Aaron / Meyer-Kahlen, Nils / Schlecht, Sebastian J. et al. | 2023
digital version
1: Knowledge-Augmented Frame Semantic Parsing with Hybrid Prompt-Tuning
Zhang, Rui / Sun, Yajing / Yang, Jingyuan / Peng, Wei et al. | 2023
digital version
1: HappyQuokka System for ICASSP 2023 Auditory EEG Challenge
Piao, Zhenyu / Kim, Miseul / Yoon, Hyungchan / Kang, Hong-Goo et al. | 2023
digital version
1: Deep Unfolded Tensor Robust PCA With Self-Supervised Learning
Dong, Harry / Shah, Megna / Donegan, Sean / Chi, Yuejie et al. | 2023
digital version
1: Continual Learning for On-Device Speech Recognition Using Disentangled Conformers
Diwan, Anuj / Yeh, Ching-Feng / Hsu, Wei-Ning / Tomasello, Paden / Choi, Eunsol / Harwath, David / Mohamed, Abdelrahman et al. | 2023
digital version
1: Robust Online Multiband Drift Estimation in Electrophysiology Data
Windolf, Charlie / Paulk, Angelique C. / Kfir, Yoav / Trautmann, Eric / Meszena, Domokos / Munoz, William / Caprara, Irene / Jamali, Mohsen / Boussard, Julien / Williams, Ziv M. et al. | 2023
digital version
1: Progressive Refinement Learning Based on Feature Cross Perception for Residential Areas Semantic Segmentation
Lyu, Xinran / Zhang, Libao et al. | 2023
digital version
1: Improving Adversarial Robustness with Hypersphere Embedding and Angular-Based Regularizations
Fakorede, Olukorede / Nirala, Ashutosh / Atsague, Modeste / Tian, Jin et al. | 2023
digital version
1: Graph Contrastive Learning with Learnable Graph Augmentation
Pu, Xinyan / Zhang, Ke / Shu, Huazhong / Coatrieux, Jean Louis / Kong, Youyong et al. | 2023
digital version
1: To Regularize or Not to Regularize: The Role of Positivity in Sparse Array Interpolation with a Single Snapshot
Hucumenoglu, Mehmet Can / Sarangi, Pulak / Rajamaki, Robin / Pal, Piya et al. | 2023
digital version
1: TeAw: Text-Aware Few-Shot Remote Sensing Image Scene Classification
Cheng, Kaihui / Yang, Chule / Fan, Zunlin / Wu, Dayan / Guan, Naiyang et al. | 2023
digital version
1: RIS Reflection and Placement Optimisation for Underlay D2D Communications in Cognitive Cellular Networks
Ghose, Sarbani / Mishra, Deepak / Maity, Santi P. / Alexandropoulos, George C. et al. | 2023
digital version
1: Not All Classes are Equal: Adaptively Focus-Aware Confidence for Semi-Supervised Object Detection
Zhu, Hui / Lu, Yongchun / Zhao, Hongyu / Zhao, Guoqing / Zhao, Xiaofang et al. | 2023
digital version
1: Adversarial Data Augmentation Using VAE-GAN for Disordered Speech Recognition
Jin, Zengrui / Xie, Xurong / Geng, Mengzhe / Wang, Tianzi / Hu, Shujie / Deng, Jiajun / Li, Guinan / Liu, Xunying et al. | 2023
digital version
1: Multi-Blank Transducers for Speech Recognition
Xu, Hainan / Jia, Fei / Majumdar, Somshubra / Watanabe, Shinji / Ginsburg, Boris et al. | 2023
digital version
1: End-to-End Word-Level Disfluency Detection and Classification in Children’s Reading Assessment
Venkatasubramaniam, Lavanya / Sunder, Vishal / Fosler-Lussier, Eric et al. | 2023
digital version
1: Speech Emotion Recognition via Heterogeneous Feature Learning
Liu, Ke / Wu, DongYa / Wang, Dekui / Feng, Jun et al. | 2023
digital version
1: A Study on Bias and Fairness in Deep Speaker Recognition
Hajavi, Amirhossein / Etemad, Ali et al. | 2023
digital version
1: Retinal Biomarkers for Detecting Diabetic Retinopaty Using Smartphone-Based Deep Learning Frameworks
Karakaya, Mahmut / Aygun, Ramazan S. et al. | 2023
digital version
1: Hierarchical Interactive Reconstruction Network for Video Compressive Sensing
Zhang, Tong / Cui, Wenxue / Hui, Chen / Jiang, Feng et al. | 2023
digital version
1: A Unified Uncertainty-Aware Exploration: Combining Epistemic and Aleatory Uncertainty
Malekzadeh, Parvin / Hou, Ming / Plataniotis, Konstantinos N. et al. | 2023
digital version
1: FedSD: A New Federated Learning Structure Used in Non-iid Data
Yi, Minmin / Ning, Houchun / Liu, Peng et al. | 2023
digital version
1: Towards Dialogue Modeling Beyond Text
Wu, Tongzi / Zhou, Yuhao / Ling, Wang / Yang, Hojin / Veloso, Joana / Sun, Lin / Huang, Ruixin / Guimaraes, Norberto / Sanner, Scott et al. | 2023
digital version
1: DPP-Based Client Selection for Federated Learning with NON-IID DATA
Zhang, Yuxuan / Xu, Chao / Yang, Howard H. / Wang, Xijun / Quek, Tony Q. S. et al. | 2023
digital version
1: Learning Robust Self-Attention Features for Speech Emotion Recognition with Label-Adaptive Mixup
Kang, Lei / Zhang, Lichao / Jiang, Dazhi et al. | 2023
digital version
1: Adaptive Eccm for Mitigating Smart Jammers
Jain, Shashwat / Pattanayak, Kunal / Krishnamurthy, Vikram / Berry, Christopher et al. | 2023
digital version
1: IAST: Instance Association Relying on Spatio-Temporal Features for Video Instance Segmentation
Chen, Junhao / Liu, Sheng / Chen, Ruixiang / Guo, Bingnan / Zhang, Feng et al. | 2023
digital version
1: Exploring the Role of Fricatives in Classifying Healthy Subjects and Patients with Amyotrophic Lateral Sclerosis and Parkinson’s Disease
Bhattacharjee, Tanuka / Belur, Yamini / Nalini, Atchayaram / Yadav, Ravi / Ghosh, Prasanta Kumar et al. | 2023
digital version
1: Stay In The Middle: A Semi-Supervised Model for CT Metal Artifact Reduction
Wang, Tao / Yu, Hui / Lu, Zexin / Zhang, Zhongzhou / Zhou, Jiliu / Zhang, Yi et al. | 2023
digital version
1: Neural Fourier Shift for Binaural Speech Rendering
Woo Lee, Jin / Lee, Kyogu et al. | 2023
digital version
1: Semi-Supervised Contrastive Learning with Soft Mask Attention for Facial Action Unit Detection
Liu, Zhongling / Liu, Rujie / Shi, Ziqiang / Liu, Liu / Mi, Xiaoyu / Murase, Kentaro et al. | 2023
digital version
1: Recursive Estimation of User Intent From Noninvasive Electroencephalography Using Discriminative Models
Smedemark-Margulies, Niklas / Celik, Basak / Imbiriba, Tales / Kocanaogullari, Aziz / Erdogmus, Deniz et al. | 2023
digital version
1: Diabetic Retinopathy Grading with Weakly-Supervised Lesion Priors
Hou, Junlin / Xiao, Fan / Xu, Jilan / Feng, Rui / Zhang, Yuejie / Zou, Haidong / Lu, Lina / Xue, Wenwen et al. | 2023
digital version
1: Prompt-Distiller: Few-Shot Knowledge Distillation for Prompt-Based Language Learners with Dual Contrastive Learning
Hou, Boyu / Wang, Chengyu / Chen, Xiaoqing / Qiu, Minghui / Feng, Liang / Huang, Jun et al. | 2023
digital version
1: Contextually-Rich Human Affect Perception Using Multimodal Scene Information
Bose, Digbalay / Hebbar, Rajat / Somandepalli, Krishna / Narayanan, Shrikanth et al. | 2023
digital version
1: Stabilising and Accelerating Light Gated Recurrent Units for Automatic Speech Recognition
Moumen, Adel / Parcollet, Titouan et al. | 2023
digital version
1: Sampling Order-Limited Signals on the Sphere
Khan, Muhammad Salaar Arif / Nadeem, Salman / Khalid, Zubair et al. | 2023
digital version
1: Sequence-Based Device-Free Gesture Recognition Framework for Multi-Channel Acoustic Signals
Yang, Zhizheng / Wang, Xun / Xia, Dongyu / Wang, Wei / Dai, Haipeng et al. | 2023
digital version
1: Using Adapters to Overcome Catastrophic Forgetting in End-to-End Automatic Speech Recognition
Eeckt, Steven Vander / Van Hamme, Hugo et al. | 2023
digital version
1: Can Knowledge of End-to-End Text-to-Speech Models Improve Neural Midi-to-Audio Synthesis Systems?
Shi, Xuan / Cooper, Erica / Wang, Xin / Yamagishi, Junichi / Narayanan, Shrikanth et al. | 2023
digital version
1: MGAT: Multi-Granularity Attention Based Transformers for Multi-Modal Emotion Recognition
Fan, Weiquan / Xing, Xiaofen / Cai, Bolun / Xu, Xiangmin et al. | 2023
digital version
1: HPFTN: Hierarchical Progressive Fusion Transformer Network for Video Denoising
Zhang, Shuaitao / Zhang, Yuan / Zhao, Zheng / Xie, Di / Pu, Shiliang et al. | 2023
digital version
1: Soft 2D-to-3D Delivery Using Deep Graph Neural Networks for Holographic-Type Communication
Fujihashi, Takuya / Koike-Akino, Toshiaki / Watanabe, Takashi et al. | 2023
digital version
1: CLAP Learning Audio Concepts from Natural Language Supervision
Elizalde, Benjamin / Deshmukh, Soham / Ismail, Mahmoud Al / Wang, Huaming et al. | 2023
digital version
1: Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond
Krause, Michael / Weis, Christof / Muller, Meinard et al. | 2023
digital version
1: SPECTRANET-SO(3): Learning Satellite Orientation from Optical Spectra by Implicitly Modeling Mutually Exclusive Probability Distributions on The Rotation Manifold
Phelps, Matthew / Swindle, Thomas / Gazak, J. Zachary / Vandenberg, Andrew / Fletcher, Justin et al. | 2023
digital version
1: Channel Estimation in Massive MIMO with Heavy-Tailed Noise: Gaussian-Mixture Versus Cauchy Models
Gulgun, Ziya / Larsson, Erik G. et al. | 2023
digital version
1: Speech Intelligibility Classifiers from 550k Disordered Speech Samples
Venugopalan, Subhashini / Tobin, Jimmy / Yang, Samuel J. / Seaver, Katie / Cave, Richard J.N. / Jiang, Pan-Pan / Zeghidour, Neil / Heywood, Rus / Green, Jordan / Brenner, Michael P. et al. | 2023
digital version
1: Filler Word Detection with Hard Category Mining and Inter-Category Focal Loss
Zhao, Zhiyuan / Wu, Lijun / Tang, Chuanxin / Yin, Dacheng / Zhao, Yucheng / Luo, Chong et al. | 2023
digital version
1: Modular Conformer Training for Flexible End-to-End ASR
Audhkhasi, Kartik / Farris, Brian / Ramabhadran, Bhuvana / Moreno, Pedro J. et al. | 2023
digital version
1: Untargeted Backdoor Attack Against Object Detection
Luo, Chengxiao / Li, Yiming / Jiang, Yong / Xia, Shu-Tao et al. | 2023
digital version
1: Cross-Modality depth Estimation via Unsupervised Stereo RGB-to-infrared Translation
Tang, Shi / Ye, Xinchen / Xue, Fei / Xu, Rui et al. | 2023
digital version
1: A Dynamic Cross-Scale Transformer with Dual-Compound Representation for 3D Medical Image Segmentation
Zhang, Ruixia / Wang, Zhiqiong / Wang, Zhongyang / Xin, Junchang et al. | 2023
digital version
1: Generic Dependency Modeling for Multi-Party Conversation
Shen, Weizhou / Quan, Xiaojun / Yang, Ke et al. | 2023
digital version
1: WL-MSR: Watch and Listen for Multimodal Subtitle Recognition
Liu, Jiawei / Wang, Hao / Wang, Weining / He, Xingjian / Liu, Jing et al. | 2023
digital version
1: Residual Hybrid Attention Network for Compression Artifact Reduction
Luo, Bingchun / Yu, Wei et al. | 2023
digital version
1: Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition
Sahai, Saumya Y. / Liu, Jing / Muniyappa, Thejaswi / Sathyendra, Kanthashree M. / Alexandridis, Anastasios / Strimel, Grant P. / McGowan, Ross / Rastrow, Ariya / Chang, Feng-Ju / Mouchtaris, Athanasios et al. | 2023
digital version
1: Look and Think: Intrinsic Unification of Self-Attention and Convolution for Spatial-Channel Specificity
Gao, Xiang / Lin, Honghui / Li, Yu / Fang, Ruiyan / Zhang, Xin et al. | 2023
digital version
1: Higher-Order Link Prediction Via Learnable Maximum Mean Discrepancy
Karanikolas, Georgios V. / Pages-Zamora, Alba / Giannakis, Georgios B. et al. | 2023
digital version
1: EI²SR: Learning an Enhanced Intra-Instance Semantic Relationship for Arbitrary-Shaped Scene Text Detection
Shu, Yan / Liu, Shaohui / Zhou, Yu / Xu, Honglei / Jiang, Feng et al. | 2023
digital version
1: Towards Real-Time Single-Channel Speech Separation in Noisy and Reverberant Environments
Neri, Julian / Braun, Sebastian et al. | 2023
digital version
1: Comparative Layer-Wise Analysis of Self-Supervised Speech Models
Pasad, Ankita / Shi, Bowen / Livescu, Karen et al. | 2023
digital version
1: Maximum Likelihood Distillation for Robust Modulation Classification
Maroto, Javier / Bovet, Gerome / Frossard, Pascal et al. | 2023
digital version
1: Stochastic Optimization of Vector Quantization Methods in Application to Speech and Image Processing
Vali, Mohammad Hassan / Backstrom, Tom et al. | 2023
digital version
1: Deep Fusion of Multi-Object Densities Using Transformer
Li, Lechi / Dai, Chen / Xia, Yuxuan / Svensson, Lennart et al. | 2023
digital version
1: Core: Transferable Long-Range Time Series Forecasting Enhanced by Covariates-Guided Representation
Li, Xin-Yi / Zhong, Pei-Nan / Chen, Di / Yang, Yu-Bin et al. | 2023
digital version
1: Toward Privacy-Enhancing Ambulatory-Based Well-Being Monitoring: Investigating User Re-Identification Risk in Multimodal Data
Pranjal, Ravi / Seshadri, Ranjana / Kumar Sanath Kumar Kadaba, Rakesh / Feng, Tiantian / Narayanan, Shrikanth S. / Chaspari, Theodora et al. | 2023
digital version
1: Mutually Guided Few-Shot Learning For Relational Triple Extraction
Yang, Chengmei / Jiang, Shuai / He, Bowei / Ma, Chen / He, Lianghua et al. | 2023
digital version
1: Guide and Select: A Transformer-Based Multimodal Fusion Method for Points of Interest Description Generation
Liu, Hanqing / Wang, Wei / Hu, Niu / Zheng, Hai-Tao / Xie, Rui / Wu, Wei / Bai, Yang et al. | 2023
digital version
1: Interpretation of Neural Networks is Susceptible to Universal Adversarial Perturbations
Oskouie, Haniyeh Ehsani / Farnia, Farzan et al. | 2023
digital version
1: High-Resolution Embedding Extractor for Speaker Diarisation
Heo, Hee-Soo / Kwon, Youngki / Lee, Bong-Jin / Kim, You Jin / Jung, Jee-Weon et al. | 2023
digital version
1: Prosody-Controllable Spontaneous TTS with Neural HMMS
Lameris, Harm / Mehta, Shivam / Henter, Gustav Eje / Gustafson, Joakim / Szekely, Eva et al. | 2023
digital version
1: Faster Than Fast: Accelerating the Griffin-Lim Algorithm
Nenov, Rossen / Nguyen, Dang-Khoa / Balazs, Peter et al. | 2023
digital version
1: Scalable and Secure Federated XGBoost
Nguyen, Quang Minh / Khanh Le, Nhan / Nguyen, Lam M. et al. | 2023
digital version
1: A Generalized Subspace Distribution Adaptation Framework for Cross-Corpus Speech Emotion Recognition
Li, Shaokai / Song, Peng / Ji, Liang / Jin, Yun / Zheng, Wenming et al. | 2023
digital version
1: ClassA Entropy for the Analysis of Structural Complexity of Physiological Signals
Xiao, Hongjian / Li, Ling / Mandic, Danilo P. et al. | 2023
digital version
1: Improving Disfluency Detection with Multi-Scale Self Attention and Contrastive Learning
Wang, Peiying / Duan, Chaoqun / Chen, Meng / He, Xiaodong et al. | 2023
digital version
1: Time-Resolved FMRI Shared Response Model Using Gaussian Process Factor Analysis
Ebrahimi, MohammadReza / Calarco, Navona / Hawco, Colin / Voineskos, Aristotle / Khisti, Ashish et al. | 2023
digital version
1: Dynamic TF-TDNN: Dynamic Time Delay Neural Network Based on Temporal-Frequency Attention for Dialect Recognition
Liao, Chao / Huang, Jinwen / Yuan, Huan / Yao, Peng / Tan, Jianchao / Zhang, Dawei / Deng, Feng / Wang, Xiaorui / Song, Chengru et al. | 2023
digital version
1: Contrastive Learning of Functionality-Aware Code Embeddings
Li, Yiyang / Wu, Hongqiu / Zhao, Hai et al. | 2023
digital version
1: Ultrasound Image Quality Control Using Speech-Assisted Switchable CycleGAN
Huh, Jaeyoung / Khan, Shujaat / Sun Lee, Eun / Chul Ye, Jong et al. | 2023
digital version
1: Super Dilated Nested Arrays with Ideal Critical Weights and Increased Degrees of Freedom
Shaalan, Ahmed M. A. / Du, Jun et al. | 2023
digital version
1: Transient Dictionary Learning for Compressed Time-of-Flight Imaging
Conde, Miguel Heredia et al. | 2023
digital version
1: Does Your Model Think Like an Engineer? Explainable AI for Bearing Fault Detection with Deep Learning
Decker, Thomas / Lebacher, Michael / Tresp, Volker et al. | 2023
digital version
1: FAPM: Fast Adaptive Patch Memory for Real-Time Industrial Anomaly Detection
Kim, Donghyeong / Park, Chaewon / Cho, Suhwan / Lee, Sangyoun et al. | 2023
digital version
1: A Distributed Adaptive Algorithm for Non-Smooth Spatial Filtering Problems
Hovine, Charles / Bertrand, Alexander et al. | 2023
digital version
1: Graph Learning from Gaussian and Stationary Graph Signals
Buciulea, Andrei / Marques, Antonio G. et al. | 2023
digital version
1: Spatio-Temporal Attention in Multi-Granular Brain Chronnectomes For Detection of Autism Spectrum Disorder
Orme-Rogers, James / Srivastava, Ajitesh et al. | 2023
digital version
1: Priv-Aug-Shap-ECGResNet: Privacy Preserving Shapley-Value Attributed Augmented Resnet for Practical Single-Lead Electrocardiogram Classification
Ukil, Arijit / Marin, Leandro / Jara, Antonio J. et al. | 2023
digital version
1: Efficient Online Convolutional Dictionary Learning Using Approximate Sparse Components
Veshki, Farshad G. / Vorobyov, Sergiy A. et al. | 2023
digital version
1: Low-Latency Electrolaryngeal Speech Enhancement Based on Fastspeech2-Based Voice Conversion and Self-Supervised Speech Representation
Kobayashi, Kazuhiro / Hayashi, Tomoki / Toda, Tomoki et al. | 2023
digital version
1: Zero-Shot Personalized Lip-To-Speech Synthesis with Face Image Based Voice Control
Sheng, Zheng-Yan / Ai, Yang / Ling, Zhen-Hua et al. | 2023
digital version
1: mmWave Wi-Fi Trajectory Estimation with Continuous-Time Neural Dynamic Learning
Vaca-Rubio, Cristian J. / Wang, Pu / Koike-Akino, Toshiaki / Wang, Ye / Boufounos, Petros / Popovski, Petar et al. | 2023
digital version
1: Efficient Intelligibility Evaluation Using Keyword Spotting: A Study on Audio-Visual Speech Enhancement
Valentini-Botinhao, Cassia / Aldana Blanco, Andrea Lorena / Klejch, Ondrej / Bell, Peter et al. | 2023
digital version
1: D-3DLD: Depth-Aware Voxel Space Mapping for Monocular 3D Lane Detection with Uncertainty
Kim, Nayeon / Byeon, Moonsub / Ji, Daehyun / Oh, Dokwan et al. | 2023
digital version
1: Finer-Grained Decomposition for Parallel Quantum Mimo Processing
Kim, Minsung / Jamieson, Kyle et al. | 2023
digital version
1: Deep Root Music Algorithm for Data-Driven Doa Estimation
Shmuel, Dor H. / Merkofer, Julian P. / Revach, Guy / van Sloun, Ruud J. G. / Shlezinger, Nir et al. | 2023
digital version
1: Police: Provably Optimal Linear Constraint Enforcement For Deep Neural Networks
Balestriero, Randall / LeCun, Yann et al. | 2023
digital version
1: A Novel Metric For Evaluating Audio Caption Similarity
Bhosale, Swapnil / Chakraborty, Rupayan / Kopparapu, Sunil Kumar et al. | 2023
digital version
1: Generalized Two-Stage Particle Filter for High Dimensions
Iloska, Marija / Bugallo, Monica F. et al. | 2023
digital version
1: Mitigating Unintended Memorization in Language Models Via Alternating Teaching
Liu, Zhe / Zhang, Xuedong / Peng, Fuchun et al. | 2023
digital version
1: Adaptive Multi-Corpora Language Model Training for Speech Recognition
Ma, Yingyi / Liu, Zhe / Zhang, Xuedong et al. | 2023
digital version
1: Domain Adaptation without Catastrophic Forgetting on a Small-Scale Partially-Labeled Corpus for Speech Emotion Recognition
Zhu, Zhi / Sato, Yoshinao et al. | 2023
digital version
1: SingNet: a real-time Singing Voice beat and Downbeat Tracking System
Heydari, Mojtaba / Wang, Ju-Chiang / Duan, Zhiyao et al. | 2023
digital version
1: PCQA-Graphpoint: Efficient Deep-Based Graph Metric for Point Cloud Quality Assessment
Tliba, Marouane / Chetouani, Aladine / Valenzise, Giuseppe / Dufaux, Frederic et al. | 2023
digital version
1: Adaptive Step-Size Methods for Compressed SGD
Subramaniam, Adarsh M. / Magesh, Akshayaa / Veeravalli, Venugopal V. et al. | 2023
digital version
1: Leveraging Multiple Sources in Automatic African American English Dialect Detection for Adults and Children
Johnson, Alexander / Shetty, Vishwas M. / Ostendorf, Mari / Alwan, Abeer et al. | 2023
digital version
1: Adaptive Simulated Annealing Through Alternating Rényi Divergence Minimization
Guilmeau, Thomas / Chouzenoux, Emilie / Elvira, Victor et al. | 2023
digital version
1: NAS-DYMC: NAS-Based Dynamic Multi-Scale Convolutional Neural Network for Sound Event Detection
Wang, Jun / Yao, Peng / Deng, Feng / Tan, Jianchao / Song, Chengru / Wang, Xiaorui et al. | 2023
digital version
1: Wespeaker: A Research and Production Oriented Speaker Embedding Learning Toolkit
Wang, Hongji / Liang, Chengdong / Wang, Shuai / Chen, Zhengyang / Zhang, Binbin / Xiang, Xu / Deng, Yanlei / Qian, Yanmin et al. | 2023
digital version
1: Privacy Preserving Face Recognition with Lensless Camera
Henry, Chris / Asif, M. Salman / Li, Zhu et al. | 2023
digital version
1: Exploiting CCTV Cameras for Hand Hygiene Recognition in ICU
Huang, Weijun / Huang, Jia / Wang, Guowei / Lu, Hongzhou / He, Min / Wang, Wenjin et al. | 2023
digital version
1: Learning Sparse auto-Encoders for Green AI image coding
Gille, Cyprien / Guyard, Frederic / Antonini, Marc / Barlaud, Michel et al. | 2023
digital version
1: 3D Audio Signal Processing Systems for Speech Enhancement and Sound Localization and Detection
Bai, Jisheng / Huang, Siwei / Yin, Han / Jia, Yafei / Wang, Mou / Chen, Jianfeng et al. | 2023
digital version
1: Quantum Variational Bayes on Manifolds
Lopatnikova, Anna / Tran, Minh-Ngoc et al. | 2023
digital version
1: Exploring Complementary Features in Multi-Modal Speech Emotion Recognition
Wang, Suzhen / Ma, Yifeng / Ding, Yu et al. | 2023
digital version
1: Deep Spatio-Temporal Multiplex Graph Learning for Cardiac Imaging Classification
Banus, Jaume / Ogier, Augustin / Hullin, Roger / Meyer, Philippe / van Heeswijk, Ruud B. / Richiardi, Jonas et al. | 2023
digital version
1: Sign Language Recognition via Deformable 3D Convolutions and Modulated Graph Convolutional Networks
Papadimitriou, Katerina / Potamianos, Gerasimos et al. | 2023
digital version
1: Unsupervised word Segmentation Based on Word Influence
Yan, Ruohao / Zhang, Huaping / Silamu, Wushour / Hamdulla, Askar et al. | 2023
digital version
1: TAPE: An End-to-End Timbre-Aware Pitch Estimator
Tamer, Nazif Can / Ozer, Yigitcan / Muller, Meinard / Serra, Xavier et al. | 2023
digital version
1: Text Classification In The Wild: A Large-Scale Long-Tailed Name Normalization Dataset
Qi, Jiexing / Li, Shuhao / Guo, Zhixin / Huang, Yusheng / Zhou, Chenghu / Zhang, Weinan / Wang, Xinbing / Lin, Zhouhan et al. | 2023
digital version
1: Designing and Evaluating Speech Emotion Recognition Systems: A Reality Check Case Study with IEMOCAP
Antoniou, Nikolaos / Katsamanis, Athanasios / Giannakopoulos, Theodoros / Narayanan, Shrikanth et al. | 2023
digital version
1: TEA-PSE 3.0: Tencent-Ethereal-Audio-Lab Personalized Speech Enhancement System For ICASSP 2023 Dns-Challenge
Ju, Yukai / Chen, Jun / Zhang, Shimin / He, Shulin / Rao, Wei / Zhu, Weixin / Wang, Yannan / Yu, Tao / Shang, Shidong et al. | 2023
digital version
1: General or Specific? Investigating Effective Privacy Protection in Federated Learning for Speech Emotion Recognition
Tan, Chao / Cao, Yang / Li, Sheng / Yoshikawa, Masatoshi et al. | 2023
digital version
1: AST-SED: An Effective Sound Event Detection Method Based on Audio Spectrogram Transformer
Li, Kang / Song, Yan / Dai, Li-Rong / McLoughlin, Ian / Fang, Xin / Liu, Lin et al. | 2023
digital version
1: Nested Attention Network with Graph Filtering for Visual Question and Answering
Lu, Jing / Wu, Chunlei / Wang, Leiquan / Yuan, Shaozu / Wu, Jie et al. | 2023
digital version
1: Defending Against Universal Patch Attacks by Restricting Token Attention in Vision Transformers
Yu, Hongwei / Chen, Jiansheng / Ma, Huimin / Yu, Cheng / Ding, Xinlong et al. | 2023
digital version
1: M²-CTTS: End-to-End Multi-Scale Multi-Modal Conversational Text-to-Speech Synthesis
Xue, Jinlong / Deng, Yayue / Wang, Fengping / Li, Ya / Gao, Yingming / Tao, Jianhua / Sun, Jianqing / Liang, Jiaen et al. | 2023
digital version
1: Effectiveness of Mining Audio and Text Pairs from Public Data for Improving ASR Systems for Low-Resource Languages
Bhogale, Kaushal / Raman, Abhigyan / Javed, Tahir / Doddapaneni, Sumanth / Kunchukuttan, Anoop / Kumar, Pratyush / Khapra, Mitesh M. et al. | 2023
digital version
1: Effectiveness of Inter- and Intra-Subarray Spatial Features for Acoustic Scene Classification
Kawamura, Takao / Kinoshita, Yuma / Ono, Nobutaka / Scheibler, Robin et al. | 2023
digital version
1: Bayesian Network Modeling and Prediction of Transitions Within the Homelessness System
Rahman, Khandker Sadia / Zois, Daphney-Stavroula / Chelmis, Charalampos et al. | 2023
digital version
1: Adaptive Knowledge Distillation Between Text and Speech Pre-Trained Models
Ni, Jinjie / Ma, Yukun / Wang, Wen / Chen, Qian / Ng, Dianwen / Lei, Han / Nguyen, Trung Hieu / Zhang, Chong / Ma, Bin / Cambria, Erik et al. | 2023
digital version
1: Tell Model Where to Attend: Improving Interpretability of Aspect-Based Sentiment Classification via Small Explanation Annotations
Cheng, Zhenxiao / Zhou, Jie / Wu, Wen / Chen, Qin / He, Liang et al. | 2023
digital version
1: Comparative Study of IRS Assisted Opportunistic Communications Over i.i.d. and los channels
Yashvanth, L. / Murthy, Chandra R. et al. | 2023
digital version
1: Multi-Head Attention and GRU for Improved Match-Mismatch Classification of Speech Stimulus and EEG Response
Borsdorf, Marvin / Pahuja, Saurav / Ivucic, Gabriel / Cai, Siqi / Li, Haizhou / Schultz, Tanja et al. | 2023
digital version
1: DTTR: Detecting Text with Transformers
Yang, Jing / You, Zhiqiang / Zhong, Zhiwei / Liu, Peng / Mei, Langqi / Huang, Shenguang et al. | 2023
digital version
1: DST: Deformable Speech Transformer for Emotion Recognition
Chen, Weidong / Xing, Xiaofen / Xu, Xiangmin / Pang, Jianxin / Du, Lan et al. | 2023
digital version
1: Cross-Training: A Semi-Supervised Training Scheme for Speech Recognition
Khorram, Soheil / Tripathi, Anshuman / Kim, Jaeyoung / Lu, Han / Zhang, Qian / Prabhavalkar, Rohit / Sak, Hasim et al. | 2023
digital version
1: Wav2Seq: Pre-Training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages
Wu, Felix / Kim, Kwangyoun / Watanabe, Shinji / Han, Kyu J. / McDonald, Ryan / Weinberger, Kilian Q. / Artzi, Yoav et al. | 2023
digital version
1: MLP-GAN for Brain Vessel Image Segmentation
Xie, Bin / Tang, Hao / Duan, Bin / Cai, Dawen / Yan, Yan et al. | 2023
digital version
1: Stacking-Based Attention Temporal Convolutional Network for Action Segmentation
Yang, Liu / Jiang, Yu / Hong, Junkun / Wu, Zhenjie / Yang, Zhan / Long, Jun et al. | 2023
digital version
1: Probabilistic Back-ends for Online Speaker Recognition and Clustering
Sholokhov, Alexey / Kuzmin, Nikita / Lee, Kong Aik / Chng, Eng Siong et al. | 2023
digital version
1: Information Extraction from Pill Bottle Images via Text Stitching
Gupta, Rahul Kumar / Roy, Shilka / Jos, Sujit / S., Unni V. / Lavoie, Lauren / Medous, Frederic / Smith, Walter et al. | 2023
digital version
1: Semi-Supervised Remote Sensing Image Change Detection Using Mean Teacher Model for Constructing Pseudo-Labels
Mao, Zan / Tong, Xinyu / Luo, Ze et al. | 2023
digital version
1: Analysing Discrete Self Supervised Speech Representation For Spoken Language Modeling
Sicherman, Amitay / Adi, Yossi et al. | 2023
digital version
1: Flowpose: Conditional Normalizing Flows for 3D Human Pose and Shape Estimation from Monocular Videos
Du, Yaoyao / Zhang, Zixiao / Li, Zhihao / Wei, Peng / Liao, Qingmin / Yang, Wenming et al. | 2023
digital version
1: Glacier: Glass-Box Transformer for Interpretable Dynamic Neuroimaging
Mahmood, Usman / Fu, Zening / Calhoun, Vince / Plis, Sergey et al. | 2023
digital version
1: NBA-OMP: Near-Field Beam-Split-Aware Orthogonal Matching Pursuit for Wideband THz Channel Estimation
Elbir, Ahmet M. / Vijay Mishra, Kumar / Chatzinotas, Symeon et al. | 2023
digital version
1: MUG: A General Meeting Understanding and Generation Benchmark
Zhang, Qinglin / Deng, Chong / Liu, Jiaqing / Yu, Hai / Chen, Qian / Wang, Wen / Yan, Zhijie / Liu, Jinglin / Ren, Yi / Zhao, Zhou et al. | 2023
digital version
1: Automatic Classification of Vocal Intensity Category from Speech
Kodali, Manila / Kadiri, Sudarsana Reddy / Laaksonen, Laura / Alku, Paavo et al. | 2023
digital version
1: A Template Matching Approach for Reference Picture Padding in Video Coding
Horst, Nicolas / Das, Priyanka / Wien, Mathias et al. | 2023
digital version
1: An Efficient Relay Selection Scheme for Relay-assisted HARQ
Ding, Weihang / Shikh-Bahaei, Mohammad et al. | 2023
digital version
1: Sora: Scalable Black-Box Reachability Analyser on Neural Networks
Xu, Peipei / Wang, Fu / Ruan, Wenjie / Zhang, Chi / Huang, Xiaowei et al. | 2023
digital version
1: The First Pathloss Radio Map Prediction Challenge
Yapar, Cagkan / Jaensch, Fabian / Levie, Ron / Kutyniok, Gitta / Caire, Giuseppe et al. | 2023
digital version
1: U-Shiftformer: Brain Tumor Segmentation Using A Shifted Attention Mechanism
Lin, Chih-Wei / Chen, Zhongsheng et al. | 2023
digital version
1: Does Human Speech Follow Benford’s Law?
Hsu, Leo / Berisha, Visar et al. | 2023
digital version
1: Conversation-Oriented ASR with Multi-Look-Ahead CBS Architecture
Zhao, Huaibo / Fujie, Shinya / Ogawa, Tetsuji / Sakuma, Jin / Kida, Yusuke / Kobayashi, Tetsunori et al. | 2023
digital version
1: Towards a Unified Training for Levenshtein Transformer
Zheng, Kangjie / Wang, Longyue / Wang, Zhihao / Chen, Binqi / Zhang, Ming / Tu, Zhaopeng et al. | 2023
digital version
1: A Principled Approach to Model Validation in Domain Generalization
Lyu, Boyang / Nguyen, Thuan / Scheutz, Matthias / Ishwar, Prakash / Aeron, Shuchin et al. | 2023
digital version
1: Neural Networks with Quantization Constraints
Hounie, Ignacio / Elenter, Juan / Ribeiro, Alejandro et al. | 2023
digital version
1: Direct Position Determination with One-Bit Signal for Multiple Targets
Ni, Lihua / Zhang, Di / Xing, Tianyi / Ran, Maoyan / Liu, Ning / Wan, Qun et al. | 2023
digital version
1: Learning to Balance the Global Coherence and Informativeness in Knowledge-Grounded Dialogue Generation
Niu, Chenxu / Hu, Yue / Peng, Wei / Xie, Yuqiang et al. | 2023
digital version
1: Backdoor Attack Against Automatic Speaker Verification Models in Federated Learning
Meng, Dan / Wang, Xue / Wang, Jun et al. | 2023
digital version
1: Wireless Deep Speech Semantic Transmission
Xiao, Zixuan / Yao, Shengshi / Dai, Jincheng / Wang, Sixian / Niu, Kai / Zhang, Ping et al. | 2023
digital version
1: Context-Aware Fine-Tuning of Self-Supervised Speech Models
Shon, Suwon / Wu, Felix / Kim, Kwangyoun / Sridhar, Prashant / Livescu, Karen / Watanabe, Shinji et al. | 2023
digital version
1: Improved Acoustic-to-Articulatory Inversion Using Representations from Pretrained Self-Supervised Learning Models
Udupa, Sathvik / C, Siddarth / Ghosh, Prasanta Kumar et al. | 2023
digital version
1: Lightweight Annotation and Class Weight Training for Automatic Estimation of Alarm Audibility in Noise
Effa, Francois / Serizel, Romain / Arz, Jean-Pierre / Grimault, Nicolas et al. | 2023
digital version
1: Disentangled Training with Adversarial Examples for Robust Small-Footprint Keyword Spotting
Wang, Zhenyu / Wan, Li / Zhang, Biqiao / Huang, Yiteng / Li, Shang-Wen / Sun, Ming / Lei, Xin / Yang, Zhaojun et al. | 2023
digital version
1: Numerical Semantic Modeling for Implicit Discourse Relation Recognition
Wang, Chenxu / Jian, Ping / Wang, Hai et al. | 2023
digital version
1: Stereoscopic Video Retargeting Based on Camera Motion Classification
Cai, Linghui / Tang, Zhenhua et al. | 2023
digital version
1: Spoofed Training Data for Speech Spoofing Countermeasure Can Be Efficiently Created Using Neural Vocoders
Wang, Xin / Yamagishi, Junichi et al. | 2023
digital version
1: Massively Multilingual Shallow Fusion with Large Language Models
Hu, Ke / Sainath, Tara N. / Li, Bo / Du, Nan / Huang, Yanping / Dai, Andrew M. / Zhang, Yu / Cabrera, Rodrigo / Chen, Zhifeng / Strohman, Trevor et al. | 2023
digital version
1: SDTN: Speaker Dynamics Tracking Network for Emotion Recognition in Conversation
Chen, Jiawei / Huang, Peijie / Huang, Guotai / Li, Qianer / Xu, Yuhong et al. | 2023
digital version
1: Improving CTC-Based ASR Models With Gated Interlayer Collaboration
Yang, Yuting / Li, Yuke / Du, Binbin et al. | 2023
digital version
1: Restoration of Time-Varying Graph Signals using Deep Algorithm Unrolling
Kojima, Hayate / Noguchi, Hikari / Yamada, Koki / Tanaka, Yuichi et al. | 2023
digital version
1: A Dual-Path Transformer Network for Scene Text Detection
Lin, Jingyu / Yan, Yan / Wang, Hanzi et al. | 2023
digital version
1: Audio-Visual Speech Enhancement with a Deep Kalman Filter Generative Model
Golmakani, Ali / Sadeghi, Mostafa / Serizel, Romain et al. | 2023
digital version
1: Ideal: Improved Dense Local Contrastive Learning For Semi-Supervised Medical Image Segmentation
Basak, Hritam / Chattopadhyay, Soumitri / Kundu, Rohit / Nag, Sayan / Mallipeddi, Rammohan et al. | 2023
digital version
1: Embedding a Differentiable Mel-Cepstral Synthesis Filter to a Neural Speech Synthesis System
Yoshimura, Takenori / Takaki, Shinji / Nakamura, Kazuhiro / Oura, Keiichiro / Hono, Yukiya / Hashimoto, Kei / Nankaku, Yoshihiko / Tokuda, Keiichi et al. | 2023
digital version
1: Symbol Level Precoding in the RF Domain for Low Hardware Complexity RIS-Assisted MU-MISO Systems
Tsinos, Christos G. / Tsiftsis, Theodoros A. / Schober, Robert et al. | 2023
digital version
1: CTCBERT: Advancing Hidden-Unit Bert with CTC Objectives
Fan, Ruchao / Wang, Yiming / Gaur, Yashesh / Li, Jinyu et al. | 2023
digital version
1: Sine: Similarity-Regularized Intra-Class Exploitation for Cross-Granularity Few-Shot Learning
Yang, Jinhai / Yang, Hua et al. | 2023
digital version
1: Topological Signal Processing Over Weighted Simplicial Complexes
Battiloro, Claudio / Sardellitti, Stefania / Barbarossa, Sergio / Lorenzo, Paolo Di et al. | 2023
digital version
1: Neural Mode Estimation
Sun, Peng / Wen, Zhenyu / Zhou, Yejian / Hong, Zhen / Lin, Tao et al. | 2023
digital version
1: Meta Learning with Adaptive Loss Weight for Low-Resource Speech Recognition
Wang, Qiulin / Hu, Wenxuan / Li, Lin / Hong, Qingyang et al. | 2023
digital version
1: An Auto-Encoder Based Method for Camera Fingerprint Compression
Zhang, Kaixuan / Liu, Zihan / Hu, Jiashang / Wang, Shilin et al. | 2023
digital version
1: A Transformer-Based E2E SLU Model for Improved Semantic Parsing
Istaiteh, Othman / Kussad, Yasmeen / Daqour, Yahya / Habib, Maria / Habash, Mohammad / Gowda, Dhananjaya et al. | 2023
digital version
1: Procontext: Exploring Progressive Context Transformer for Tracking
Lan, Jin-Peng / Cheng, Zhi-Qi / He, Jun-Yan / Li, Chenyang / Luo, Bin / Bao, Xu / Xiang, Wangmeng / Geng, Yifeng / Xie, Xuansong et al. | 2023
digital version
1: Achieving Fair Speech Emotion Recognition via Perceptual Fairness
Chien, Woan-Shiuan / Lee, Chi-Chun et al. | 2023
digital version
1: Unsupervised Pre-Training for Data-Efficient Text-to-Speech on Low Resource Languages
Park, Seongyeon / Song, Myungseo / Kim, Bohyung / Oh, Tae-Hyun et al. | 2023
digital version
1: Image Sharing Chain Detection VIA Sequence-To-Sequence Model
You, Jiaxiang / Li, Yuanman / Liang, Rongqin / Tan, Yuxuan / Zhou, Jiantao / Li, Xia et al. | 2023
digital version
1: NCL: Textual Backdoor Defense Using Noise-Augmented Contrastive Learning
Zhai, Shengfang / Shen, Qingni / Chen, Xiaoyi / Wang, Weilong / Li, Cong / Fang, Yuejian / Wu, Zhonghai et al. | 2023
digital version
1: Higher-Order Spatio-Temporal Neural Networks for Covid-19 Forecasting
Chen, Yuzhou / Batsakis, Sotiris / Poor, H. Vincent et al. | 2023
digital version
1: Regression to Classification: Waveform Encoding for Neural Field-Based Audio Signal Representation
Kim, TaeSoo / Rho, Daniel / Lee, Gahui / Park, JaeHan / Ko, Jong Hwan et al. | 2023
digital version
1: Visual Answer Localization with Cross-Modal Mutual Knowledge Transfer
Weng, Yixuan / Li, Bin et al. | 2023
digital version
1: An Empirical Study and Improvement for Speech Emotion Recognition
Wu, Zhen / Lu, Yizhe / Dai, Xinyu et al. | 2023
digital version
1: A Study of Audio Mixing Methods for Piano Transcription in Violin-Piano Ensembles
Kim, Hyemi / Park, Jiyun / Kwon, Taegyun / Jeong, Dasaem / Nam, Juhan et al. | 2023
digital version
1: Interaction-Assisted Multi-Modal Representation Learning for Recommendation
Wu, Hao / Wang, Jiajie / Zu, Zhonglin et al. | 2023
digital version

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Quicklinks

Borrowing & Ordering

Quicklinks

Search & discover

Quicklinks

Learning & working

Quicklinks

Publishing & Archiving

Quicklinks

About the TIB

Quicklinks

Research & Development

Hyperbolic Audio Source Separation (English)

How to get this title?

Export, share and cite

More details on this result

Table of contents

Table of contents conference proceedings

Similar titles

How to get this title?

Export, share and cite