PartManip: Learning Cross-Category Generalizable Part Manipulation Policy from Point Cloud Observations (English)

Geng, Haoran / Li, Ziming / Geng, Yiran / Chen, Jiayi / Dong, Hao / Wang, He

In: 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) ; 2978-2988 ; 2023

ISBN:

979-8-3503-0129-8

ISSN:

2575-7075

Conference paper / Electronic Resource

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Export, share and cite

Learning a generalizable object manipulation policy is vital for an embodied agent to work in complex real-world scenes. Parts, as the shared components in different object categories, have the potential to increase the generalization ability of the manipulation policy and achieve cross-category object manipulation. In this work, we build the first large-scale, part-based cross-category object manipulation benchmark, PartManip, which is composed of 11 object categories, 494 objects, and 1432 tasks in 6 task classes. Compared to previous work, our benchmark is also more diverse and realistic, i.e., having more objects and using sparse-view point cloud as input without oracle information like part segmentation. To tackle the difficulties of vision-based policy learning, we first train a statebased expert with our proposed part-based canonicalization and part-aware rewards, and then distill the knowledge to a vision-based student. We also find an expressive backbone is essential to overcome the large diversity of different objects. For cross-category generalization, we introduce domain adversarial learning for domain-invariant feature extraction. Extensive experiments in simulation show that our learned policy can outperform other methods by a large margin, especially on unseen object categories. We also demonstrate our method can successfully manipulate novel objects in the real world. Our benchmark has been released in https://pku-epic.github.io/PartManip.

Title:

PartManip: Learning Cross-Category Generalizable Part Manipulation Policy from Point Cloud Observations
Contributors:

Geng, Haoran ( author ) / Li, Ziming ( author ) / Geng, Yiran ( author ) / Chen, Jiayi ( author ) / Dong, Hao ( author ) / Wang, He ( author )
Published in:

2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) ; 2978-2988
Publisher:

IEEE

Publication date:

2023-06-01
Size:

1293841 byte
ISBN:

979-8-3503-0129-8
ISSN:

2575-7075
DOI:

https://doi.org/10.1109/CVPR52729.2023.00291
Type of media:

Conference paper
Type of material:

Electronic Resource
Language:

English
Source:

IEEE

Table of contents conference proceedings

The tables of contents are generated automatically and are based on the data records of the individual contributions available in the index of the TIB portal. The display of the Tables of Contents may therefore be incomplete.

1: Megahertz Light Steering Without Moving Parts
Pediredla, Adithya / Narasimhan, Srinivasa G. / Chamanzar, Maysamreza / Gkioulekas, Ioannis et al. | 2023
digital version
1: Title Page i
| 2023
digital version
01: RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension
Jin, Lei / Luo, Gen / Zhou, Yiyi / Sun, Xiaoshuai / Jiang, Guannan / Shu, Annan / Ji, Rongrong et al. | 2023
digital version
01: Affordances from Human Videos as a Versatile Representation for Robotics
Bahl, Shikhar / Mendonca, Russell / Chen, Lili / Jain, Unnat / Pathak, Deepak et al. | 2023
digital version
1: Copyright and Reprint Permissions
| 2023
digital version
3: Title Page iii
| 2023
digital version
13: Robust Dynamic Radiance Fields
Liu, Yu-Lun / Gao, Chen / Meuleman, Andreas / Tseng, Hung-Yu / Saraf, Ayush / Kim, Changil / Chuang, Yung-Yu / Kopf, Johannes / Huang, Jia-Bin et al. | 2023
digital version
24: DBARF: Deep Bundle-Adjusting Generalizable Neural Radiance Fields
Chen, Yu / Lee, Gim Hee et al. | 2023
digital version
35: VDN-NeRF: Resolving Shape-Radiance Ambiguity via View-Dependence Normalization
Zhu, Bingfan / Yang, Yanchao / Wang, Xulong / Zheng, Youyi / Guibas, Leonidas et al. | 2023
digital version
46: AligNeRF: High-Fidelity Neural Radiance Fields via Alignment-Aware Training
Jiang, Yifan / Hedman, Peter / Mildenhall, Ben / Xu, Dejia / Barron, Jonathan T. / Wang, Zhangyang / Xue, Tianfan et al. | 2023
digital version
56: SeaThru-NeRF: Neural Radiance Fields in Scattering Media
Levy, Deborah / Peleg, Amit / Pearl, Naama / Rosenbaum, Dan / Akkaynak, Derya / Korman, Simon / Treibitz, Tali et al. | 2023
digital version
66: Exact-NeRF: An Exploration of a Precise Volumetric Parameterization for Neural Radiance Fields
Isaac-Medina, Brian K. S. / Willcocks, Chris G. / Breckon, Toby P. et al. | 2023
digital version
76: Neural Residual Radiance Fields for Streamably Free-Viewpoint Videos
Wang, Liao / Hu, Qiang / He, Qihan / Wang, Ziyu / Yu, Jingyi / Tuytelaars, Tinne / Xu, Lan / Wu, Minye et al. | 2023
digital version
88: Plen-VDB: Memory Efficient VDB-Based Radiance Fields for Fast Training and Rendering
Yan, Han / Liu, Celong / Ma, Chao / Mei, Xing et al. | 2023
digital version
97: Local Implicit Ray Function for Generalizable Radiance Field Representation
Huang, Xin / Zhang, Qi / Feng, Ying / Li, Xiaoyu / Wang, Xuan / Wang, Qing et al. | 2023
digital version
108: SurfelNeRF: Neural Surfel Radiance Fields for Online Photorealistic Reconstruction of Indoor Scenes
Gao, Yiming / Cao, Yan-Pei / Shan, Ying et al. | 2023
digital version
119: Frequency-Modulated Point Cloud Rendering with Easy Editing
Zhang, Yi / Huang, Xiaoyang / Ni, Bingbing / Zhang, Wenjun / Li, Teng et al. | 2023
digital version
130: HexPlane: A Fast Representation for Dynamic Scenes
Cao, Ang / Johnson, Justin et al. | 2023
digital version
142: Differentiable Shadow Mapping for Efficient Inverse Graphics
Worchel, Markus / Alexa, Marc et al. | 2023
digital version
154: Hybrid Neural Rendering for Large-Scale Scenes with Motion Blur
Dai, Peng / Zhang, Yinda / Yu, Xin / Lyu, Xiaoyang / Qi, Xiaojuan et al. | 2023
digital version
165: TensoIR: Tensorial Inverse Rendering
Jin, Haian / Liu, Isabella / Xu, Peijia / Zhang, Xiaoshuai / Han, Songfang / Bi, Sai / Zhou, Xiaowei / Xu, Zexiang / Su, Hao et al. | 2023
digital version
175: ShadowNeuS: Neural SDF Reconstruction by Shadow Ray Supervision
Ling, Jingwang / Wang, Zhibo / Xu, Feng et al. | 2023
digital version
186: Realistic Saliency Guided Image Enhancement
Miangoleh, S. Mahdi H. / Bylinskii, Zoya / Kee, Eric / Shechtman, Eli / Aksoy, Yagiz et al. | 2023
digital version
195: LightPainter: Interactive Portrait Relighting with Freehand Scribble
Mei, Yiqun / Zhang, He / Zhang, Xuaner / Zhang, Jianming / Shu, Zhixin / Wang, Yilin / Wei, Zijun / Yan, Shi / Jung, HyunJoon / Patel, Vishal M. et al. | 2023
digital version
206: A Unified Spatial-Angular Structured Light for Single-View Acquisition of Shape and Reflectance
Xu, Xianmin / Lin, Yuxin / Zhou, Haoyang / Zeng, Chong / Yu, Yaxin / Zhou, Kun / Wu, Hongzhi et al. | 2023
digital version
216: Learning Visibility Field for Detailed 3D Human Reconstruction and Relighting
Zheng, Ruichen / Li, Peng / Wang, Haoqian / Yu, Tao et al. | 2023
digital version
227: Unsupervised Contour Tracking of Live Cells by Mechanical and Cycle Consistency Losses
Jang, Junbong / Lee, Kwonmoo / Kim, Tae-Kyun et al. | 2023
digital version
237: NeUDF: Leaning Neural Unsigned Distance Fields with Volume Rendering
Liu, Yu-Tao / Wang, Li / Yang, Jie / Chen, Weikai / Meng, Xiaoxu / Yang, Bo / Gao, Lin et al. | 2023
digital version
248: NeAT: Learning Neural Implicit Surfaces with Arbitrary Topologies from Multi-View Images
Meng, Xiaoxu / Chen, Weikai / Yang, Bo et al. | 2023
digital version
259: ALTO: Alternating Latent Topologies for Implicit 3D Reconstruction
Wang, Zhen / Zhou, Shijie / Park, Jeong Joon / Paschalidou, Despoina / You, Suya / Wetzstein, Gordon / Guibas, Leonidas / Kadambi, Achuta et al. | 2023
digital version
271: Controllable Mesh Generation Through Sparse Latent Point Diffusion Models
Lyu, Zhaoyang / Wang, Jinyi / An, Yuwei / Zhang, Ya / Lin, Dahua / Dai, Bo et al. | 2023
digital version
275: Photo Pre-Training, But for Sketch
Li, Ke / Pang, Kaiyue / Song, Yi-Zhe et al. | 2023
digital version
281: Power Bundle Adjustment for Large-Scale 3D Reconstruction
Weber, Simon / Demmel, Nikolaus / Chan, Tin Chon / Cremersl, Daniel et al. | 2023
digital version
290: Neural Pixel Composition for 3D-4D View Synthesis from Multi-Views
Bansal, Aayush / Zollhoefer, Michael et al. | 2023
digital version
300: Magic3D: High-Resolution Text-to-3D Content Creation
Lin, Chen-Hsuan / Gao, Jun / Tang, Luming / Takikawa, Towaki / Zeng, Xiaohui / Huang, Xun / Kreis, Karsten / Fidler, Sanja / Liu, Ming-Yu / Lin, Tsung-Yi et al. | 2023
digital version
301: Message from the 2023 General and Program Chairs
| 2023
digital version
302: 2023 Organizing Committee
| 2023
digital version
304: 2023 Outstanding Reviewers
| 2023
digital version
305: Sponsors
| 2023
digital version
310: 3D Video Loops from Asynchronous Input
Ma, Li / Li, Xiaoyu / Liao, Jing / Sander, Pedro V. et al. | 2023
digital version
321: High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization
Xie, Jiaxin / Ouyang, Hao / Piao, Jingtan / Lei, Chenyang / Chen, Qifeng et al. | 2023
digital version
332: Lift3D: Synthesize 3D Training Data by Lifting 2D GAN to 3D Generative Radiance Field
Li, Leheng / Lian, Qing / Wang, Luozhou / Ma, Ningning / Chen, Ying-Cong et al. | 2023
digital version
342: 3D GAN Inversion with Facial Symmetry Prior
Yin, Fei / Zhang, Yong / Wang, Xuan / Wang, Tengfei / Li, Xiaoyu / Gong, Yuan / Fan, Yanbo / Cun, Xiaodong / Shan, Ying / Oztireli, Cengiz et al. | 2023
digital version
352: StyleIPSB: Identity-Preserving Semantic Basis of StyleGAN for High Fidelity Face Swapping
Jiang, Diqiong / Song, Dan / Tong, Ruofeng / Tang, Min et al. | 2023
digital version
362: FFHQ-UV: Normalized Facial UV-Texture Dataset for 3D Face Reconstruction
Bai, Haoran / Kang, Di / Zhang, Haoxian / Pan, Jinshan / Bao, Linchao et al. | 2023
digital version
372: Robust Model-based Face Reconstruction through Weakly-Supervised Outlier Segmentation
Li, Chunlu / Morel-Forster, Andreas / Vetter, Thomas / Egger, Bernhard / Kortylewski, Adam et al. | 2023
digital version
382: Learning Neural Proto-Face Field for Disentangled 3D Face Modeling in the Wild
Zhang, Zhenyu / Chen, Renwang / Cao, Weijian / Tai, Ying / Wang, Chengjie et al. | 2023
digital version
394: A Hierarchical Representation Network for Accurate and Detailed Face Reconstruction from In-The-Wild Images
Lei, Biwen / Ren, Jianqiang / Feng, Mengyang / Cui, Miaomiao / Xie, Xuansong et al. | 2023
digital version
404: BlendFields: Few-Shot Example-Driven Facial Modeling
Kania, Kacper / Garbin, Stephan J. / Tagliasacchi, Andrea / Estellers, Virginia / Yi, Kwang Moo / Valentin, Julien / Trzcinski, Tomasz / Kowalski, Marek et al. | 2023
digital version
416: Implicit Neural Head Synthesis via Controllable Local Deformation Fields
Chen, Chuhan / O'Toole, Matthew / Bharaj, Gaurav / Garrido, Pablo et al. | 2023
digital version
427: DPE: Disentanglement of Pose and Expression for General Video Portrait Editing
Pang, Youxin / Zhang, Yong / Quan, Weize / Fan, Yanbo / Cun, Xiaodong / Shan, Ying / Yan, Dong-Ming et al. | 2023
digital version
437: GANHead: Towards Generative Animatable Neural Head Avatars
Wu, Sijing / Yan, Yichao / Li, Yunhao / Cheng, Yuhao / Zhu, Wenhan / Gao, Ke / Li, Xiaobo / Zhai, Guangtao et al. | 2023
digital version
448: EDGE: Editable Dance Generation From Music
Tseng, Jonathan / Castellon, Rodrigo / Liu, C. Karen et al. | 2023
digital version
458: Unsupervised Volumetric Animation
Siarohin, Aliaksandr / Menapace, Willi / Skorokhodov, Ivan / Olszewski, Kyle / Ren, Jian / Lee, Hsin-Ying / Chai, Menglei / Tulyakov, Sergey et al. | 2023
digital version
459: Blowing in the Wind: CycleNet for Human Cinemagraphs from Still Images
Bertiche, Hugo / Mitra, Niloy J. / Kulkarni, Kuldeep / Huang, Chun-Hao Paul / Wang, Tuanfeng Y. / Madadi, Meysam / Escalera, Sergio / Ceylan, Duygu et al. | 2023
digital version
469: Generating Holistic 3D Human Motion from Speech
Yi, Hongwei / Liang, Hualin / Liu, Yifei / Cao, Qiong / Wen, Yandong / Bolkart, Timo / Tao, Dacheng / Black, Michael J. et al. | 2023
digital version
481: Avatars Grow Legs: Generating Smooth Human Motion from Sparse Tracking Inputs with Diffusion Model
Du, Yuming / Kips, Robin / Pumarola, Albert / Starke, Sebastian / Thabet, Ali / Sanakoyeu, Artsiom et al. | 2023
digital version
491: Learning Anchor Transformations for 3D Garment Animation
Zhao, Fang / Li, Zekun / Huang, Shaoli / Weng, Junwu / Zhou, Tianfei / Xie, Guo-Sen / Wang, Jue / Shan, Ying et al. | 2023
digital version
501: CloSET: Modeling Clothed Humans on Continuous Surface with Explicit Template Decomposition
Zhang, Hongwen / Lin, Siyou / Shao, Ruizhi / Zhang, Yuxiang / Zheng, Zerong / Huang, Han / Guo, Yandong / Liu, Yebin et al. | 2023
digital version
512: ECON: Explicit Clothed humans Optimized via Normal integration
Xiu, Yuliang / Yang, Jinlong / Cao, Xu / Tzionas, Dimitrios / Black, Michael J. et al. | 2023
digital version
524: PersonNeRF : Personalized Reconstruction from Photo Collections
Weng, Chung-Yi / Srinivasan, Pratul P. / Curless, Brian / Kemelmacher-Shlizerman, Ira et al. | 2023
digital version
534: 3D Human Mesh Estimation from Virtual Markers
Ma, Xiaoxuan / Su, Jiajun / Wang, Chunyu / Zhu, Wentao / Wang, Yizhou et al. | 2023
digital version
544: Overcoming the TradeOff between Accuracy and Plausibility in 3D Hand Shape Reconstruction
Yu, Ziwei / Li, Chen / Yang, Linlin / Zheng, Xiaoxu / Bi Mi, Michael / Lee, Gim Hee / Yao, Angela et al. | 2023
digital version
554: Recovering 3D Hand Mesh Sequence from a Single Blurry Image: A New Dataset and Temporal Unfolding
Oh, Yeonguk / Park, JoonKyu / Kim, Jaeha / Moon, Gyeongsik / Lee, Kyoung Mu et al. | 2023
digital version
564: MeMaHand: Exploiting Mesh-Mano Interaction for Single Image Two-Hand Reconstruction
Wang, Congyi / Zhu, Feida / Went, Shilei et al. | 2023
digital version
574: PLIKS: A Pseudo-Linear Inverse Kinematic Solver for 3D Human Body Estimation
Shetty, Karthik / Birkhold, Annette / Jaganathan, Srikrishna / Strobel, Norbert / Kowarschik, Markus / Maier, Andreas / Egger, Bernhard et al. | 2023
digital version
585: CAMS: CAnonicalized Manipulation Spaces for Category-Level Functional Hand-Object Manipulation Synthesis
Zheng, Juntian / Zheng, Qingyuan / Fang, Lixing / Liu, Yun / Yi, Li et al. | 2023
digital version
595: Instant-NVR: Instant Neural Volumetric Rendering for Human-object Interactions from Monocular RGBD Stream
Jiang, Yuheng / Yao, Kaixin / Su, Zhuo / Shen, Zhehao / Luo, Haimin / Xu, Lan et al. | 2023
digital version
606: BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown Objects
Wen, Bowen / Tremblay, Jonathan / Blukis, Valts / Tyree, Stephen / Muller, Thomas / Evans, Alex / Fox, Dieter / Kautz, Jan / Birchfield, Stan et al. | 2023
digital version
618: Human-Art: A Versatile Human-Centric Dataset Bridging Natural and Artificial Scenes
Ju, Xuan / Zeng, Ailing / Wang, Jianan / Xu, Qiang / Zhang, Lei et al. | 2023
digital version
630: Omnimatte3D: Associating Objects and Their Effects in Unconstrained Monocular Video
Suhail, Mohammed / Lu, Erika / Li, Zhengqi / Snavely, Noah / Sigal, Leonid / Cole, Forrester et al. | 2023
digital version
640: On the Benefits of 3D Pose and Tracking for Human Action Recognition
Rajasegaran, Jathushan / Pavlakos, Georgios / Kanazawa, Angjoo / Feichtenhofer, Christoph / Malik, Jitendra et al. | 2023
digital version
650: Towards Stable Human Pose Estimation via Cross-View Fusion and Foot Stabilization
Zhuo, Li'an / Cao, Jian / Wang, Qi / Zhang, Bang / Bo, Liefeng et al. | 2023
digital version
660: Human Pose as Compositional Tokens
Geng, Zigang / Wang, Chunyu / Wei, Yixuan / Liu, Ze / Li, Houqiang / Hu, Han et al. | 2023
digital version
672: PoseExaminer: Automated Testing of Out-of-Distribution Robustness in Human Pose and Shape Estimation
Liu, Qihao / Kortylewski, Adam / Yuille, Alan et al. | 2023
digital version
682: SLOPER4D: A Scene-Aware Dataset for Global 4D Human Pose Estimation in Urban Environments
Dai, Yudi / Lin, Yitai / Lin, Xiping / Wen, Chenglu / Xu, Lan / Yi, Hongwei / Shen, Siqi / Ma, Yuexin / Wang, Cheng et al. | 2023
digital version
693: Semi-Supervised 2D Human Pose Estimation Driven by Position Inconsistency Pseudo Label Correction Module
Huang, Linzhi / Li, Yulong / Tian, Hongbo / Yang, Yue / Li, Xiangang / Deng, Weihong / Ye, Jieping et al. | 2023
digital version
704: Human Pose Estimation in Extremely Low-Light Conditions
Lee, Sohyun / Rim, Jaesung / Jeong, Boseung / Kim, Geonu / Woo, Byungju / Lee, Haechan / Cho, Sunghyun / Kwak, Suha et al. | 2023
digital version
715: Flexible-C^m GAN: Towards Precise 3D Dose Prediction in Radiotherapy
Gao, Riqiang / Lou, Bin / Xu, Zhoubing / Comaniciu, Dorin / Kamen, Ali et al. | 2023
digital version
726: DualRefine: Self-Supervised Depth and Pose Estimation Through Iterative Epipolar Sampling and Refinement Toward Equilibrium
Bangunharcana, Antyanta / Magd, Ahmed / Kim, Kyung-Soo et al. | 2023
digital version
739: A Rotation-Translation-Decoupled Solution for Robust and Efficient Visual-Inertial Initialization
He, Yijia / Xu, Bo / Ouyang, Zhanpeng / Li, Hongdong et al. | 2023
digital version
749: Semidefinite Relaxations for Robust Multiview Triangulation
Harenstam-Nielsen, Linus / Zeller, Niclas / Cremers, Daniel et al. | 2023
digital version
758: A Probabilistic Attention Model with Occlusion-aware Texture Regression for 3D Hand Reconstruction from a Single RGB Image
Jiang, Zheheng / Rahmani, Hossein / Black, Sue / Williams, Bryan M. et al. | 2023
digital version
768: Instant Multi-View Head Capture through Learnable Registration
Bolkart, Timo / Li, Tianye / Black, Michael J. et al. | 2023
digital version
780: On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks
Jung, HyunJun / Ruhkamp, Patrick / Zhai, Guangyao / Brasch, Nikolas / Li, Yitong / Verdie, Yannick / Song, Jifei / Zhou, Yiren / Armagan, Anil / Ilic, Slobodan et al. | 2023
digital version
792: Learning 3D Scene Priors with 2D Supervision
Nie, Yinyu / Dai, Angela / Han, Xiaoguang / NieBner, Matthias et al. | 2023
digital version
803: OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation
Wu, Tong / Zhang, Jiarui / Fu, Xiao / Wang, Yuxin / Ren, Jiawei / Pan, Liang / Wu, Wayne / Yang, Lei / Wang, Jiaqi / Qian, Chen et al. | 2023
digital version
815: OpenScene: 3D Scene Understanding with Open Vocabularies
Peng, Songyou / Genova, Kyle / Jiang, Chiyu / Tagliasacchi, Andrea / Pollefeys, Marc / Funkhouser, Thomas et al. | 2023
digital version
825: Multi-View Azimuth Stereo via Tangent Space Consistency
Cao, Xu / Santo, Hiroaki / Okura, Fumio / Matsushita, Yasuyuki et al. | 2023
digital version
835: Progressive Transformation Learning for Leveraging Virtual Images in Training
Shen, Yi-Ting / Lee, Hyungtae / Kwon, Heesung / Bhattacharyya, Shuvra S. et al. | 2023
digital version
845: Connecting the Dots: Floorplan Reconstruction Using Two-Level Queries
Yue, Yuanwen / Kontogianni, Theodora / Schindler, Konrad / Engelmann, Francis et al. | 2023
digital version
855: NeRF-Supervised Deep Stereo
Tosi, Fabio / Tonioni, Alessio / De Gregorio, Daniele / Poggi, Matteo et al. | 2023
digital version
867: Semantic Scene Completion with Cleaner Self
Wang, Fengyun / Zhang, Dong / Zhang, Hanwang / Tang, Jinhui / Sun, Qianru et al. | 2023
digital version
878: PanelNet: Understanding 360 Indoor Environment via Panel Representation
Yu, Haozheng / He, Lu / Jian, Bing / Feng, Weiwei / Liu, Shan et al. | 2023
digital version
888: Implicit View-Time Interpolation of Stereo Videos Using Multi-Plane Disparities and Non-Uniform Coordinates
Paliwal, Avinash / Tsarov, Andrii / Kalantari, Nima Khademi et al. | 2023
digital version
899: Depth Estimation from Indoor Panoramas with Neural Scene Representation
Chang, Wenjie / Zhang, Yueyi / Xiong, Zhiwei et al. | 2023
digital version
909: NeuralPCI: Spatio-Temporal Neural Field for 3D Point Cloud Multi-Frame Non-Linear Interpolation
Zheng, Zehan / Wu, Danni / Lu, Ruisi / Lu, Fan / Chen, Guang / Jiang, Changjun et al. | 2023
digital version
919: RIAV-MVS: Recurrent-Indexing an Asymmetric Volume for Multi-View Stereo
Cai, Changjiang / Ji, Pan / Yan, Qingan / Xu, Yi et al. | 2023
digital version
929: NeuMap: Neural Coordinate Mapping by Auto-Transdecoder for Camera Localization
Tang, Shitao / Tang, Sicong / Tagliasacchi, Andrea / Tan, Ping / Furukawa, Yasutaka et al. | 2023
digital version
940: MACARONS: Mapping and Coverage Anticipation with RGB Online Self-Supervision
Guedon, Antoine / Monnier, Tom / Monasse, Pascal / Lepetit, Vincent et al. | 2023
digital version
952: vMAP: Vectorised Object Mapping for Neural Field SLAM
Kong, Xin / Liu, Shikun / Taher, Marwan / Davison, Andrew J. et al. | 2023
digital version
962: Seeing a Rose in Five Thousand Ways
Zhang, Yunzhi / Wu, Shangzhe / Snavely, Noah / Wu, Jiajun et al. | 2023
digital version
972: Propagate and Calibrate: Real-Time Passive Non-Line-of-Sight Tracking
Wang, Yihao / Wang, Zhigang / Zhao, Bin / Wang, Dong / Chen, Mulin / Li, Xuelong et al. | 2023
digital version
982: Seeing With Sound: Long-Range Acoustic Beamforming for Multimodal Scene Understanding
Chakravarthula, Praneeth / D'Souza, Jim Aldon / Tseng, Ethan / Bartusek, Joe / Heide, Felix et al. | 2023
digital version
992: Distilling Focal Knowledge from Imperfect Expert for 3D Object Detection
Zeng, Jia / Chen, Li / Deng, Hanming / Lu, Lewei / Yan, Junchi / Qiao, Yu / Li, Hongyang et al. | 2023
digital version
1012: AShapeFormer : Semantics-Guided Object-Level Active Shape Encoding for 3D Object Detection via Transformers
Li, Zechuan / Yu, Hongshan / Yang, Zhengeng / Chen, Tongjia / Akhtar, Naveed et al. | 2023
digital version
1022: Benchmarking Robustness of 3D Object Detection to Common Corruptions in Autonomous Driving
Dong, Yinpeng / Kang, Caixin / Zhang, Jinlai / Zhu, Zijian / Wang, Yikai / Yang, Xiao / Su, Hang / Wei, Xingxing / Zhu, Jun et al. | 2023
digital version
1033: Gaussian Label Distribution Learning for Spherical Image Object Detection
Xu, Hang / Liu, Xinyuan / Zhao, Qiang / Ma, Yike / Yan, Chenggang / Dai, Feng et al. | 2023
digital version
1043: Deep Depth Estimation from Thermal Image
Shin, Ukcheol / Park, Jinsun / Kweon, In So et al. | 2023
digital version
1054: LidarGait: Benchmarking 3D Gait Recognition with Point Clouds
Shen, Chuanfu / Chao, Fan / Wu, Wei / Wang, Rui / Huang, George Q. / Yu, Shiqi et al. | 2023
digital version
1064: Generalized UAV Object Detection via Frequency Domain Disentanglement
Wang, Kunyu / Fu, Xueyang / Huang, Yukun / Cao, Chengzhi / Shi, Gege / Zha, Zheng-Jun et al. | 2023
digital version
1074: Learning Compact Representations for LiDAR Completion and Generation
Xiong, Yuwen / Ma, Wei-Chiu / Wang, Jingkang / Urtasun, Raquel et al. | 2023
digital version
1084: CXTrack: Improving 3D Point Cloud Tracking with Contextual Information
Xu, Tian-Xing / Guo, Yuan-Chen / Lai, Yu-Kun / Zhang, Song-Hai et al. | 2023
digital version
1094: Multispectral Video Semantic Segmentation: A Benchmark Dataset and Baseline
Ji, Wei / Li, Jingjing / Bian, Cheng / Zhou, Zongwei / Zhao, Jiaying / Yuille, Alan / Cheng, Li et al. | 2023
digital version
1105: LinK: Linear Kernel for LiDAR-based 3D Perception
Lu, Tao / Ding, Xiang / Liu, Haisong / Wu, Gangshan / Wang, Limin et al. | 2023
digital version
1116: Point Cloud Forecasting as a Proxy for 4D Occupancy Forecasting
Khurana, Tarasha / Hu, Peiyun / Held, David / Ramanan, Deva et al. | 2023
digital version
1125: Curricular Object Manipulation in LiDAR-based Object Detection
Zhu, Ziyue / Meng, Qiang / Wang, Xiao / Wang, Ke / Yan, Liujiang / Yang, Jian et al. | 2023
digital version
1136: Delivering Arbitrary-Modal Semantic Segmentation
Zhang, Jiaming / Liu, Ruiping / Shi, Hao / Yang, Kailun / ReiB, Simon / Peng, Kunyu / Fu, Haodong / Wang, Kaiwei / Stiefelhagen, Rainer et al. | 2023
digital version
1148: Robust Outlier Rejection for 3D Registration with Variational Bayes
Jiang, Haobo / Dang, Zheng / Wei, Zhen / Xie, Jin / Yang, Jian / Salzmann, Mathieu et al. | 2023
digital version
1158: 3D Human Keypoints Estimation from Point Clouds in the Wild without Human Labels
Weng, Zhenzhen / Gorban, Alexander S. / Ji, Jingwei / Najibi, Mahyar / Zhou, Yin / Anguelov, Dragomir et al. | 2023
digital version
1168: Self-Supervised Pre-Training with Masked Shape Prediction for 3D Scene Understanding
Jiang, Li / Yang, Zetong / Shi, Shaoshuai / Golyanik, Vladislav / Dai, Dengxin / Schiele, Bernt et al. | 2023
digital version
1179: ULIP: Learning a Unified Representation of Language, Images, and Point Clouds for 3D Understanding
Xue, Le / Gao, Mingfei / Xing, Chen / Martin-Martin, Roberto / Wu, Jiajun / Xiong, Caiming / Xu, Ran / Niebles, Juan Carlos / Savarese, Silvio et al. | 2023
digital version
1190: Open-Vocabulary Point-Cloud Object Detection without 3D Annotation
Lu, Yuheng / Xu, Chenfeng / Wei, Xiaobao / Xie, Xiaodong / Tomizuka, Masayoshi / Keutzer, Kurt / Zhang, Shanghang et al. | 2023
digital version
1200: FlatFormer: Flattened Window Attention for Efficient Point Cloud Transformer
Liu, Zhijian / Yang, Xinyu / Tang, Haotian / Yang, Shang / Han, Song et al. | 2023
digital version
1212: PointCMP: Contrastive Mask Prediction for Self-supervised Learning on Point Cloud Videos
Shen, Zhiqiang / Sheng, Xiaoxiao / Wang, Longguang / Guo, Yulan / Liu, Qiong / Zhou, Xi et al. | 2023
digital version
1223: E2PN: Efficient SE(3)-Equivariant Point Network
Zhu, Minghan / Ghaffari, Maani / Clark, William A / Peng, Huei et al. | 2023
digital version
1233: Poly-PC: A Polyhedral Network for Multiple Point Cloud Tasks at Once
Xie, Tao / Wang, Shiguang / Wang, Ke / Yang, Linqi / Jiang, Zhiqiang / Zhang, Xingcheng / Dai, Kun / Li, Ruifeng / Cheng, Jian et al. | 2023
digital version
1244: Improving Graph Representation for Point Cloud Segmentation via Attentive Filtering
Zhang, Nan / Pan, Zhiyi / Li, Thomas H. / Gao, Wei / Li, Ge et al. | 2023
digital version
1255: BUFFER: Balancing Accuracy, Efficiency, and Generalizability in Point Cloud Registration
Ao, Sheng / Hu, Qingyong / Wang, Hanyun / Xu, Kai / Guo, Yulan et al. | 2023
digital version
1265: TopDiG: Class-agnostic Topological Directional Graph Extraction from Remote Sensing Images
Yang, Bingnan / Zhang, Mi / Zhang, Zhan / Zhang, Zhili / Hu, Xiangyun et al. | 2023
digital version
1275: Recognizing Rigid Patterns of Unlabeled Point Clouds by Complete and Continuous Isometry Invariants with no False Negatives and no False Positives
Widdowson, Daniel / Kurlin, Vitaliy et al. | 2023
digital version
1285: Both Style and Distortion Matter: Dual-Path Unsupervised Domain Adaptation for Panoramic Semantic Segmentation
Zheng, Xu / Zhu, Jinjing / Liu, Yexin / Cao, Zidong / Fu, Chong / Wang, Lin et al. | 2023
digital version
1296: CCuantuMM: Cycle-Consistent Quantum-Hybrid Matching of Multiple Shapes
Bhatia, Harshil / Tretschk, Edith / Lahner, Zorah / Benkner, Marcel Seelbach / Moeller, Michael / Theobalt, Christian / Golyanik, Vladislav et al. | 2023
digital version
1306: Enhancing Deformable Local Features by Jointly Learning to Detect and Describe Keypoints
Potje, Guilherme / Cadar, Felipe / Araujo, Andre / Martins, Renato / Nascimento, Erickson R. et al. | 2023
digital version
1316: Understanding and Improving Features Learned in Deep Functional Maps
Attaiki, Souhaib / Ovsjanikov, Maks et al. | 2023
digital version
1327: High-Frequency Stereo Matching Network
Zhao, Haoliang / Zhou, Huizhou / Zhang, Yongjun / Chen, Jie / Yang, Yitong / Zhao, Yong et al. | 2023
digital version
1337: Rethinking Optical Flow from Geometric Matching Consistent Perspective
Dong, Qiaole / Cao, Chenjie / Fu, Yanwei et al. | 2023
digital version
1348: Efficient Robust Principal Component Analysis via Block Krylov Iteration and CUR Decomposition
Fang, Shun / Xu, Zhengqin / Wu, Shiqian / Xie, Shoulie et al. | 2023
digital version
1358: VectorFloorSeg: Two-Stream Graph Attention Network for Vectorized Roughcast Floorplan Segmentation
Yang, Bingchen / Jiang, Haiyong / Pan, Hao / Xiao, Jun et al. | 2023
digital version
1368: TBP-Former: Learning Temporal Bird's-Eye-View Pyramid for Joint Perception and Prediction in Vision-Centric Autonomous Driving
Fang, Shaoheng / Wang, Zi / Zhong, Yiqi / Ge, Junhao / Chen, Siheng et al. | 2023
digital version
1379: Implicit Occupancy Flow Fields for Perception and Prediction in Self-Driving
Agro, Ben / Sykora, Quinlan / Casas, Sergio / Urtasun, Raquel et al. | 2023
digital version
1389: UniSim: A Neural Closed-Loop Sensor Simulator
Yang, Ze / Chen, Yun / Wang, Jingkang / Manivasagam, Sivabalan / Ma, Wei-Chiu / Yang, Anqi Joyce / Urtasun, Raquel et al. | 2023
digital version
1400: FEND: A Future Enhanced Distribution-Aware Contrastive Learning Framework for Long-Tail Trajectory Prediction
Wang, Yuning / Zhang, Pu / Bai, Lei / Xue, Jianru et al. | 2023
digital version
1410: EqMotion: Equivariant Multi-Agent Motion Prediction with Invariant Interaction Reasoning
Xu, Chenxin / Tan, Robby T. / Tan, Yuhong / Chen, Siheng / Wang, Yu Guang / Wang, Xinchao / Wang, Yanfeng et al. | 2023
digital version
1421: Lookahead Diffusion Probabilistic Models for Refining Mean Estimation
Zhang, Guoqiang / Niwa, Kenta / Kleijn, W. Bastiaan et al. | 2023
digital version
1430: Neural Volumetric Memory for Visual Locomotion Control
Yang, Ruihan / Yang, Ge / Wang, Xiaolong et al. | 2023
digital version
1441: Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed Human Attention
Mondal, Sounak / Yang, Zhibo / Ahn, Seoyoung / Samaras, Dimitris / Zelinsky, Gregory / Hoai, Minh et al. | 2023
digital version
1451: DrapeNet: Garment Generation and Self-Supervised Draping
De Luigi, Luca / Li, Ren / Guillard, Benoit / Salzmann, Mathieu / Fua, Pascal et al. | 2023
digital version
1461: Tracking Multiple Deformable Objects in Egocentric Videos
Huang, Mingzhen / Li, Xiaoxing / Hu, Jun / Peng, Honghong / Lyu, Siwei et al. | 2023
digital version
1472: Good is Bad: Causality Inspired Cloth-debiasing for Cloth-changing Person Re-identification
Yang, Zhengwei / Lin, Meng / Zhong, Xian / Wu, Yu / Wang, Zheng et al. | 2023
digital version
1482: Micron-BERT: BERT-Based Facial Micro-Expression Recognition
Nguyen, Xuan-Bac / Duong, Chi Nhan / Li, Xin / Gauch, Susan / Seo, Han-Seok / Luu, Khoa et al. | 2023
digital version
1493: MARLIN: Masked Autoencoder for facial video Representation LearnINg
Cai, Zhixi / Ghosh, Shreya / Stefanov, Kalin / Dhall, Abhinav / Cai, Jianfei / Rezatofighi, Hamid / Haffari, Reza / Hayat, Munawar et al. | 2023
digital version
1505: StyleSync: High-Fidelity Generalized and Personalized Lip Sync in Style-Based Generator
Guan, Jiazhi / Zhang, Zhanwang / Zhou, Hang / Hu, Tianshu / Wang, Kaisiyuan / He, Dongliang / Feng, Haocheng / Liu, Jingtuo / Ding, Errui / Liu, Ziwei et al. | 2023
digital version
1516: REALIMPACT: A Dataset of Impact Sound Fields for Real Objects
Clarke, Samuel / Gao, Ruohan / Wang, Mason / Rau, Mark / Xu, Julia / Wang, Jui-Hsien / James, Doug L. / Wu, Jiajun et al. | 2023
digital version
1526: STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition
Zhu, Xiaoyu / Huang, Po-Yao / Liang, Junwei / De Melo, Celso M. / Hauptmann, Alexander et al. | 2023
digital version
1537: Progressive Spatio-temporal Alignment for Efficient Event-based Motion Estimation
Huang, Xueyan / Zhang, Yueyi / Xiong, Zhiwei et al. | 2023
digital version
1547: Event-Based Shape from Polarization
Muglikar, Manasi / Bauersfeld, Leonard / Moeys, Diederik Paul / Scaramuzza, Davide et al. | 2023
digital version
1557: Learning Spatial-Temporal Implicit Neural Representations for Event-Guided Video Super-Resolution
Lu, Yunfan / Wang, Zipeng / Liu, Minjie / Wang, Hongjian / Wang, Lin et al. | 2023
digital version
1568: BiFormer: Learning Bilateral Motion Estimation via Bilateral Transformer for 4K Video Frame Interpolation
Park, Junheum / Kim, Jintae / Kim, Chang-Su et al. | 2023
digital version
1578: A Unified Pyramid Recurrent Network for Video Frame Interpolation
Jin, Xin / Wu, Longhai / Chen, Jie / Chen, Youxin / Koo, Jayoon / Hahm, Cheul-Hee et al. | 2023
digital version
1588: Event-based Blurry Frame Interpolation under Blind Exposure
Weng, Wenming / Zhang, Yueyi / Xiong, Zhiwei et al. | 2023
digital version
1599: FlowFormer++: Masked Cost Volume Autoencoding for Pretraining Optical Flow Estimation
Shi, Xiaoyu / Huang, Zhaoyang / Li, Dasong / Zhang, Manyuan / Cheung, Ka Chun / See, Simon / Qin, Hongwei / Dai, Jifeng / Li, Hongsheng et al. | 2023
digital version
1611: POTTER: Pooling Attention Transformer for Efficient Human Mesh Recovery
Zheng, Ce / Liu, Xianpeng / Qi, Guo-Jun / Chen, Chen et al. | 2023
digital version
1621: Adaptive Patch Deformation for Textureless-Resilient Multi-View Stereo
Wang, Yuesong / Zeng, Zhaojie / Guan, Tao / Yang, Wei / Chen, Zhuo / Liu, Wenkai / Xu, Luoyuan / Luo, Yawei et al. | 2023
digital version
1631: On the Difficulty of Unpaired Infrared-to-Visible Video Translation: Fine-Grained Content-Rich Patches Transfer
Yu, Zhenjie / Li, Shuang / Shen, Yirui / Liu, Chi Harold / Wang, Shuigen et al. | 2023
digital version
1641: Thermal Spread Functions (TSF): Physics-Guided Material Classification
Dashpute, Aniket / Saragadam, Vishwanath / Alexander, Emma / Willomitzer, Florian / Katsaggelos, Aggelos / Veeraraghavan, Ashok / Cossairt, Oliver et al. | 2023
digital version
1651: Better “CMOS” Produces Clearer Images: Learning Space-Variant Blur Estimation for Blind Image Super-Resolution
Chen, Xuhai / Zhang, Jiangning / Xu, Chao / Wang, Yabiao / Wang, Chengjie / Liu, Yong et al. | 2023
digital version
1662: Learning Semantic-Aware Knowledge Guidance for Low-Light Image Enhancement
Wu, Yuhui / Pan, Chen / Wang, Guoqing / Yang, Yang / Wei, Jiwei / Li, Chongyi / Shen, Heng Tao et al. | 2023
digital version
1672: CutMIB: Boosting Light Field Super-Resolution via Multi-View Image Blending
Xiao, Zeyu / Liu, Yutong / Gao, Ruisheng / Xiong, Zhiwei et al. | 2023
digital version
1683: sRGB Real Noise Synthesizing with Neighboring Correlation-Aware Noise Model
Fu, Zixuan / Guo, Lanqing / Wen, Bihan et al. | 2023
digital version
1692: Masked Image Training for Generalizable Deep Image Denoising
Chen, Haoyu / Gu, Jinjin / Liu, Yihao / Magid, Salma Abdel / Dong, Chao / Wang, Qiong / Pfister, Hanspeter / Zhu, Lei et al. | 2023
digital version
1704: DR2: Diffusion-Based Robust Degradation Remover for Blind Face Restoration
Wang, Zhixin / Zhang, Ziying / Zhang, Xiaoyun / Zheng, Huangjie / Zhou, Mingyuan / Zhang, Ya / Wang, Yanfeng et al. | 2023
digital version
1714: Learning Distortion Invariant Representation for Image Restoration from a Causality Perspective
Li, Xin / Li, Bingchen / Jin, Xin / Lan, Cuiling / Chen, Zhibo et al. | 2023
digital version
1725: Perception-Oriented Single Image Super-Resolution using Optimal Objective Estimation
Park, Seung Ho / Moon, Young Su / Cho, Nam Ik et al. | 2023
digital version
1736: Catch Missing Details: Image Reconstruction with Frequency Augmented Variational Autoencoder
Lin, Xinmiao / Li, Yikang / Hsiao, Jenhao / Ho, Chiuman / Kong, Yu et al. | 2023
digital version
1746: MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos
Zhang, Zicheng / Wu, Wei / Sun, Wei / Tu, Danyang / Lu, Wei / Min, Xiongkuo / Chen, Ying / Zhai, Guangtao et al. | 2023
digital version
1756: CABM: Content-Aware Bit Mapping for Single Image Super-Resolution Network with Large Input
Tian, Senmao / Lu, Ming / Liu, Jiaming / Guo, Yandong / Chen, Yurong / Zhang, Shunli et al. | 2023
digital version
1766: Initialization Noise in Image Gradients and Saliency Maps
Woerl, Ann-Christin / Disselhoff, Jan / Wand, Michael et al. | 2023
digital version
1776: Local Implicit Normalizing Flow for Arbitrary-Scale Image Super-Resolution
Yao, Jie-En / Tsao, Li-Yuan / Lo, Yi-Chen / Tseng, Roy / Chang, Chia-Che / Lee, Chun-Yi et al. | 2023
digital version
1786: Deep Arbitrary-Scale Image Super-Resolution via Scale-Equivariance Pursuit
Wang, Xiaohang / Chen, Xuanhong / Ni, Bingbing / Wang, Hang / Tong, Zhengyan / Liu, Yutian et al. | 2023
digital version
1796: CiaoSR: Continuous Implicit Attention-in-Attention Network for Arbitrary-Scale Image Super-Resolution
Cao, Jiezhang / Wang, Qin / Xian, Yongqin / Li, Yawei / Ni, Bingbing / Pi, Zhiming / Zhang, Kai / Zhang, Yulun / Timofte, Radu / Van Gool, Luc et al. | 2023
digital version
1808: Multiplicative Fourier Level of Detail
Dou, Yishun / Zheng, Zhong / Jin, Qiaoqiao / Ni, Bingbing et al. | 2023
digital version
1818: Document Image Shadow Removal Guided by Color-Aware Background
Zhang, Ling / He, Yinghao / Zhang, Qing / Liu, Zheng / Zhang, Xiaolong / Xiao, Chunxia et al. | 2023
digital version
1828: StyleRes: Transforming the Residuals for Real Image Editing with StyleGAN
Pehlivan, Hamza / Dalva, Yusuf / Dundar, Aysegul et al. | 2023
digital version
1838: TopNet: Transformer-Based Object Placement Network for Image Compositing
Zhu, Sijie / Lin, Zhe / Cohen, Scott / Kuen, Jason / Zhang, Zhifei / Chen, Chen et al. | 2023
digital version
1848: VecFontSDF: Learning to Reconstruct and Synthesize High-Quality Vector Fonts via Signed Distance Functions
Xia, Zeqing / Xiong, Bojun / Lian, Zhouhui et al. | 2023
digital version
1858: CF-Font: Content Fusion for Few-Shot Font Generation
Wang, Chi / Zhou, Min / Ge, Tiezheng / Jiang, Yuning / Bao, Hujun / Xu, Weiwei et al. | 2023
digital version
1868: SIEDOB: Semantic Image Editing by Disentangling Object and Background
Luo, Wuyang / Yang, Su / Zhang, Xinjian / Zhang, Weishan et al. | 2023
digital version
1879: MaskSketch: Unpaired Structure-guided Masked Image Generation
Bashkirova, Dina / Lezama, Jose / Sohn, Kihyuk / Saenko, Kate / Essa, Irfan et al. | 2023
digital version
1890: Text2Scene: Text-driven Indoor Scene Stylization with Part-Aware Details
Hwang, Inwoo / Kim, Hyeonwoo / Kim, Young Min et al. | 2023
digital version
1900: Uncovering the Disentanglement Capability in Text-to-Image Diffusion Models
Wu, Qiucheng / Liu, Yujian / Zhao, Handong / Kale, Ajinkya / Bui, Trung / Yu, Tong / Lin, Zhe / Zhang, Yang / Chang, Shiyu et al. | 2023
digital version
1911: VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models
Jain, Ajay / Xie, Amber / Abbeel, Pieter et al. | 2023
digital version
1921: Plug-and-Play Diffusion Features for Text-Driven Image-to-Image Translation
Tumanyan, Narek / Geyer, Michal / Bagon, Shai / Dekel, Tali et al. | 2023
digital version
1931: Multi-Concept Customization of Text-to-Image Diffusion
Kumari, Nupur / Zhang, Bingliang / Zhang, Richard / Shechtman, Eli / Zhu, Jun-Yan et al. | 2023
digital version
1942: Unifying Layout Generation with a Decoupled Diffusion Model
Hui, Mude / Zhang, Zhizheng / Zhang, Xiaoyi / Xie, Wenxuan / Wang, Yuwang / Lu, Yan et al. | 2023
digital version
1952: BBDM: Image-to-Image Translation with Brownian Bridge Diffusion Models
Li, Bo / Xue, Kaitao / Liu, Bin / Lai, Yu-Kun et al. | 2023
digital version
1962: Towards Practical Plug-and-Play Diffusion Models
Go, Hyojun / Lee, Yunsung / Kim, JinYoung / Lee, Seunghyun / Jeong, Myeongho / Lee, Hyun Seung / Choi, Seungtaek et al. | 2023
digital version
1972: Post-Training Quantization on Diffusion Models
Shang, Yuzhang / Yuan, Zhihang / Xie, Bin / Wu, Bingzhe / Yan, Yan et al. | 2023
digital version
1982: DiffTalk: Crafting Diffusion Models for Generalized Audio-Driven Portraits Animation
Shen, Shuai / Zhao, Wenliang / Meng, Zibin / Li, Wanhua / Zhu, Zheng / Zhou, Jie / Lu, Jiwen et al. | 2023
digital version
1992: Mask-Guided Matting in the Wild
Park, Kwanyong / Woo, Sanghyun / Oh, Seoung Wug / Kweon, In So / Lee, Joon-Young et al. | 2023
digital version
2002: Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation
Huang, Mengqi / Mao, Zhendong / Wang, Quan / Zhang, Yongdong et al. | 2023
digital version
2012: Compression-Aware Video Super-Resolution
Wang, Yingwei / Isobe, Takashi / Jia, Xu / Tao, Xin / Lu, Huchuan / Tai, Yu-Wing et al. | 2023
digital version
2022: Neural Rate Estimator and Unsupervised Learning for Efficient Distributed Image Analytics in Split-DNN models
Ahuja, Nilesh / Datta, Parual / Kanzariya, Bhavya / Somayazulu, V. Srinivasa / Tickoo, Omesh et al. | 2023
digital version
2031: DNeRV: Modeling Inherent Dynamics via Difference Neural Representation for Videos
Zhao, Qi / Asif, M. Salman / Ma, Zhan et al. | 2023
digital version
2041: Polynomial Implicit Neural Representations For Large Diverse Datasets
Singh, Rajhans / Shukla, Ankita / Turaga, Pavan et al. | 2023
digital version
2052: Learning Decorrelated Representations Efficiently Using Fast Fourier Transform
Shigeto, Yutaro / Shimbo, Masashi / Yoshikawa, Yuya / Takeuchi, Akikazu et al. | 2023
digital version
2061: SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer
Chen, Xuanyao / Liu, Zhijian / Tang, Haotian / Yi, Li / Zhao, Hang / Han, Song et al. | 2023
digital version
2071: N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution
Choi, Haram / Lee, Jeongmin / Yang, Jihoon et al. | 2023
digital version
2082: Slide-Transformer: Hierarchical Vision Transformer with Local Self-Attention
Pan, Xuran / Ye, Tianzhu / Xia, Zhuofan / Song, Shiji / Huang, Gao et al. | 2023
digital version
2092: Joint Token Pruning and Squeezing Towards More Aggressive Compression of Vision Transformers
Wei, Siyuan / Ye, Tianzhu / Zhang, Shen / Tang, Yao / Liang, Jiajun et al. | 2023
digital version
2102: Top-Down Visual Attention from Analysis by Synthesis
Shi, Baifeng / Darrell, Trevor / Wang, Xin et al. | 2023
digital version
2113: Probing Neural Representations of Scene Perception in a Hippocampally Dependent Task Using Artificial Neural Networks
Frey, Markus / Doeller, Christian F. / Barry, Caswell et al. | 2023
digital version
2122: Masked Image Modeling with Local Multi-Scale Reconstruction
Wang, Haoqing / Tang, Yehui / Wang, Yunhe / Guo, Jianyuan / Deng, Zhi-Hong / Han, Kai et al. | 2023
digital version
2132: Siamese Image Modeling for Self-Supervised Vision Representation Learning
Tao, Chenxin / Zhu, Xizhou / Su, Weijie / Huang, Gao / Li, Bin / Zhou, Jie / Qiao, Yu / Wang, Xiaogang / Dai, Jifeng et al. | 2023
digital version
2142: MAGE: MAsked Generative Encoder to Unify Representation Learning and Image Synthesis
Li, Tianhong / Chang, Huiwen / Mishra, Shlok Kumar / Zhang, Han / Katabi, Dina / Krishnan, Dilip et al. | 2023
digital version
2153: Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for Visible-Infrared Person Re-identification
Zhang, Yukang / Wang, Hanzi et al. | 2023
digital version
2163: DistilPose: Tokenized Pose Regression with Heatmap Distillation
Ye, Suhang / Zhang, Yingyi / Hu, Jie / Cao, Liujuan / Zhang, Shengchuan / Shen, Lei / Wang, Jun / Ding, Shouhong / Ji, Rongrong et al. | 2023
digital version
2173: Graph Transformer GANs for Graph-Constrained House Generation
Tang, Hao / Zhang, Zhenyu / Shi, Humphrey / Li, Bo / Shao, Ling / Sebe, Nicu / Timofte, Radu / Van Gool, Luc et al. | 2023
digital version
2183: Automatic High Resolution Wire Segmentation and Removal
Chiu, Mang Tik / Zhang, Xuaner / Wei, Zijun / Zhou, Yuqian / Shechtman, Eli / Barnes, Connelly / Lin, Zhe / Kainz, Florian / Amirghodsi, Sohrab / Shi, Humphrey et al. | 2023
digital version
2193: Tree Instance Segmentation with Temporal Contour Graph
Firoze, Adnan / Wingren, Cameron / Yeh, Raymond A. / Benes, Bedrich / Aliaga, Daniel et al. | 2023
digital version
2203: Dual-Path Adaptation from Image to Video Transformers
Park, Jungin / Lee, Jiyoung / Sohn, Kwanghoon et al. | 2023
digital version
2214: Rethinking Video ViTs: Sparse Video Tubes for Joint Image and Video Learning
Piergiovanni, AJ / Kuo, Weicheng / Angelova, Anelia et al. | 2023
digital version
2225: Modeling Video as Stochastic Processes for Fine-Grained Video Representation Learning
Zhang, Heng / Liu, Daqing / Zheng, Qi / Su, Bing et al. | 2023
digital version
2235: Masked Motion Encoding for Self-Supervised Video Representation Learning
Sun, Xinyu / Chen, Peihao / Chen, Liangwei / Li, Changhao / Li, Thomas H. / Tan, Mingkui / Gan, Chuang et al. | 2023
digital version
2246: Boosting Video Object Segmentation via Space-Time Correspondence Learning
Zhang, Yurong / Li, Liulei / Wang, Wenguan / Xie, Rong / Song, Li / Zhang, Wenjun et al. | 2023
digital version
2257: Two-shot Video Object Segmentation
Yan, Kun / Li, Xiao / Wei, Fangyun / Wang, Jinglu / Zhang, Chenbin / Wang, Ping / Lu, Yan et al. | 2023
digital version
2268: Look Before You Match: Instance Understanding Matters in Video Object Segmentation
Wang, Junke / Chen, Dongdong / Wu, Zuxuan / Luo, Chong / Tang, Chuanxin / Dai, Xiyang / Zhao, Yucheng / Xie, Yujia / Yuan, Lu / Jiang, Yu-Gang et al. | 2023
digital version
2279: Spatial-then-Temporal Self-Supervised Learning for Video Correspondence
Li, Rui / Liu, Dong et al. | 2023
digital version
2289: Few-Shot Referring Relationships in Videos
Kumar, Yogesh / Mishra, Anand et al. | 2023
digital version
2299: Vision Transformers are Parameter-Efficient Audio-Visual Learners
Lin, Yan-Bo / Sung, Yi-Lin / Lei, Jie / Bansal, Mohit / Bertasius, Gedas et al. | 2023
digital version
2310: Egocentric Video Task Translation
Xue, Zihui / Song, Yale / Grauman, Kristen / Torresani, Lorenzo et al. | 2023
digital version
2321: QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation
Yang, Sicheng / Wu, Zhiyong / Li, Minglei / Zhang, Zhensong / Hao, Lei / Bao, Weihong / Zhuang, Haolin et al. | 2023
digital version
2331: Co-speech Gesture Synthesis by Reinforcement Learning with Contrastive Pretrained Rewards
Sun, Mingyang / Zhao, Mengchen / Hou, Yaqing / Li, Minglei / Xu, Huang / Xu, Songcen / Hao, Jianye et al. | 2023
digital version
2341: TimeBalance: Temporally-Invariant and Temporally-Distinctive Video Representations for Semi-Supervised Action Recognition
Dave, Ishan Rajendrakumar / Rizve, Mamshad Nayeem / Chen, Chen / Shah, Mubarak et al. | 2023
digital version
2353: How can objects help action recognition?
Zhou, Xingyi / Arnab, Anurag / Sun, Chen / Schmid, Cordelia et al. | 2023
digital version
2363: Actionlet-Dependent Contrastive Learning for Unsupervised Skeleton-Based Action Recognition
Lin, Lilang / Zhang, Jiahang / Liu, Jiaying et al. | 2023
digital version
2373: Decomposed Cross-Modal Distillation for RGB-based Temporal Action Detection
Lee, Pilhyeon / Kim, Taeoh / Shim, Minho / Wee, Dongyoon / Byun, Hyeran et al. | 2023
digital version
2384: ASPnet: Action Segmentation with Shared-Private Representation of Multiple Data Sources
van Amsterdam, Beatrice / Kadkhodamohammadi, Abdolrahim / Luengo, Imanol / Stoyanov, Danail et al. | 2023
digital version
2394: Proposal-Based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization
Ren, Huan / Yang, Wenfei / Zhang, Tianzhu / Zhang, Yongdong et al. | 2023
digital version
2405: LOGO: A Long-Form Video Dataset for Group Action Quality Assessment
Zhang, Shiyi / Dai, Wenxun / Wang, Sujia / Shen, Xiangwei / Lu, Jiwen / Zhou, Jie / Tang, Yansong et al. | 2023
digital version
2415: Use Your Head: Improving Long-Tail Video Recognition
Perrett, Toby / Sinha, Saptarshi / Burghardt, Tilo / Mirmehdi, Majid / Damen, Dima et al. | 2023
digital version
2426: Conditional Generation of Audio from Video via Foley Analogies
Du, Yuexi / Chen, Ziyang / Salamon, Justin / Russell, Bryan / Owens, Andrew et al. | 2023
digital version
2437: Weakly Supervised Video Representation Learning with Unaligned Text for Sequential Videos
Dong, Sixun / Hu, Huazhang / Lian, Dongze / Luo, Weixin / Qian, Yicheng / Gao, Shenghua et al. | 2023
digital version
2448: You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos
Fang, Xiang / Liu, Daizong / Zhou, Pan / Nan, Guoshun et al. | 2023
digital version
2461: Connecting Vision and Language with Video Localized Narratives
Voigtlaender, Paul / Changpinyo, Soravit / Pont-Tuset, Jordi / Soricut, Radu / Ferrari, Vittorio et al. | 2023
digital version
2472: Video-Text as Game Players: Hierarchical Banzhaf Interaction for Cross-Modal Representation Learning
Jin, Peng / Huang, Jinfa / Xiong, Pengfei / Tian, Shangxuan / Liu, Chang / Ji, Xiangyang / Yuan, Li / Chen, Jie et al. | 2023
digital version
2483: Aligning Step-by-Step Instructional Diagrams to Video Demonstrations
Zhang, Jiahao / Cherian, Anoop / Liu, Yanbin / Ben-Shabat, Yizhak / Rodriguez, Cristian / Gould, Stephen et al. | 2023
digital version
2493: Make-A-Story: Visual Memory Conditioned Consistent Story Generation
Rahman, Tanzila / Lee, Hsin- Ying / Ren, Jian / Tulyakov, Sergey / Mahajan, Shweta / Sigal, Leonid et al. | 2023
digital version
2503: Test of Time: Instilling Video-Language Models with a Sense of Time
Bagad, Piyush / Tapaswi, Makarand / Snoek, Cees G.M. et al. | 2023
digital version
2517: How You Feelin’? Learning Emotions and Mental States in Movie Scenes
Srivastava, Dhruv / Singh, Aditya Kumar / Tapaswi, Makarand et al. | 2023
digital version
2529: Continuous Sign Language Recognition with Correlation Network
Hu, Lianyu / Gao, Liqing / Liu, Zekang / Feng, Wei et al. | 2023
digital version
2540: DIP: Dual Incongruity Perceiving Network for Sarcasm Detection
Wen, Changsong / Jia, Guoli / Yang, Jufeng et al. | 2023
digital version
2551: Gloss Attention for Gloss-free Sign Language Translation
Yin, Aoxiong / Zhong, Tianyun / Tang, Li / Jin, Weike / Jin, Tao / Zhao, Zhou et al. | 2023
digital version
2563: Object-Goal Visual Navigation via Effective Exploration of Relations Among Historical Navigation States
Du, Heming / Li, Lincheng / Huang, Zi / Yu, Xin et al. | 2023
digital version
2574: Behavioral Analysis of Vision-and-Language Navigation Agents
Yang, Zijiao / Majumdar, Arjun / Lee, Stefan et al. | 2023
digital version
2583: KERM: Knowledge Enhanced Reasoning for Vision-and-Language Navigation
Li, Xiangyang / Wang, Zihan / Yang, Jiahao / Wang, Yaowei / Jiang, Shuqiang et al. | 2023
digital version
2593: Where is my Wallet? Modeling Object Proposal Sets for Egocentric Visual Query Localization
Xu, Mengmeng / Li, Yanghao / Fu, Cheng-Yang / Ghanem, Bernard / Xiang, Tao / Perez-Rua, Juan-Manuel et al. | 2023
digital version
2604: Efficient Multimodal Fusion via Interactive Prompting
Li, Yaowei / Quan, Ruijie / Zhu, Linchao / Yang, Yi et al. | 2023
digital version
2614: NS3D: Neuro-Symbolic Grounding of 3D Objects and Relations
Hsu, Joy / Mao, Jiayuan / Wu, Jiajun et al. | 2023
digital version
2624: Dynamic Inference with Grounding Based Vision and Language Models
Uzkent, Burak / Garg, Amanmeet / Zhu, Wentao / Doshi, Keval / Yi, Jingru / Wang, Xiaolong / Omar, Mohamed et al. | 2023
digital version
2634: Improving Commonsense in Vision-Language Models via Knowledge Graph Riddles
Ye, Shuquan / Xie, Yujia / Chen, Dongdong / Xu, Yichong / Yuan, Lu / Zhu, Chenguang / Liao, Jing et al. | 2023
digital version
2646: S³C: Semi-Supervised VQA Natural Language Explanation via Self-Critical Learning
Suo, Wei / Sun, Mengyang / Liu, Weisong / Gao, Yiqi / Wang, Peng / Zhang, Yanning / Wu, Qi et al. | 2023
digital version
2657: Teaching Structured Vision & Language Concepts to Vision & Language Models
Doveh, Sivan / Arbelle, Assaf / Harary, Sivan / Schwartz, Eli / Herzig, Roei / Giryes, Raja / Feris, Rogerio / Panda, Rameswar / Ullman, Shimon / Karlinsky, Leonid et al. | 2023
digital version
2669: FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks
Han, Xiao / Zhu, Xiatian / Yu, Licheng / Zhang, Li / Song, Yi-Zhe / Xiang, Tao et al. | 2023
digital version
2691: Uni-Perceiver v2: A Generalist Model for Large-Scale Vision and Vision-Language Tasks
Li, Hao / Zhu, Jinguo / Jiang, Xiaohu / Zhu, Xizhou / Li, Hongsheng / Yuan, Chun / Wang, Xiaohua / Qiao, Yu / Wang, Xiaogang / Wang, Wenhai et al. | 2023
digital version
2701: Learning from Unique Perspectives: User-aware Saliency Modeling
Chen, Shi / Valliappan, Nachiappan / Shen, Shaolei / Ye, Xinyu / Kohlhoff, Kai / He, Junfeng et al. | 2023
digital version
2711: CRAFT: Concept Recursive Activation FacTorization for Explainability
Fel, Thomas / Picard, Agustin / Bethune, Louis / Boissin, Thibaut / Vigouroux, David / Colin, Julien / Cadenc, Remi / Serre, Thomas et al. | 2023
digital version
2722: Doubly Right Object Recognition: A Why Prompt for Visual Rationales
Mao, Chengzhi / Teotia, Revant / Sundar, Amrutha / Menon, Sachit / Yang, Junfeng / Wang, Xin / Vondrick, Carl et al. | 2023
digital version
2733: Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings
Bhunia, Ayan Kumar / Koley, Subhadeep / Kumar, Amandeep / Sain, Aneeshan / Chowdhury, Pinaki Nath / Xiang, Tao / Song, Yi-Zhe et al. | 2023
digital version
2744: PIP-Net: Patch-Based Intuitive Prototypes for Interpretable Image Classification
Nauta, Meike / Schlotterer, Jorg / van Keulen, Maurice / Seifert, Christin et al. | 2023
digital version
2765: CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained or Not
Sain, Aneeshan / Bhunia, Ayan Kumar / Chowdhury, Pinaki Nath / Koley, Subhadeep / Xiang, Tao / Song, Yi-Zhe et al. | 2023
digital version
2776: iCLIP: Bridging Image Classification and Contrastive Language-Image Pre-training for Visual Recognition
Wei, Yixuan / Cao, Yue / Zhang, Zheng / Peng, Houwen / Yao, Zhuliang / Xie, Zhenda / Hu, Han / Guo, Baining et al. | 2023
digital version
2787: Cross-Modal Implicit Relation Reasoning and Aligning for Text-to-Image Person Retrieval
Jiang, Ding / Ye, Mang et al. | 2023
digital version
2798: Multi-Modal Representation Learning with Text-Driven Soft Masks
Park, Jaeyoo / Han, Bohyung et al. | 2023
digital version
2808: Texts as Images in Prompt Tuning for Multi-Label Image Recognition
Guo, Zixian / Dong, Bowen / Ji, Zhilong / Bai, Jinfeng / Guo, Yiwen / Zuo, Wangmeng et al. | 2023
digital version
2818: Reproducible Scaling Laws for Contrastive Language-Image Learning
Cherti, Mehdi / Beaumont, Romain / Wightman, Ross / Wortsman, Mitchell / Ilharco, Gabriel / Gordon, Cade / Schuhmann, Christoph / Schmidt, Ludwig / Jitsev, Jenia et al. | 2023
digital version
2830: Multilateral Semantic Relations Modeling for Image Text Retrieval
Wang, Zheng / Gao, Zhenwei / Guo, Kangshuai / Yang, Yang / Wang, Xiaoming / Shen, Heng Tao et al. | 2023
digital version
2840: Smallcap: Lightweight Image Captioning Prompted with Retrieval Augmentation
Ramos, Rita / Martins, Bruno / Elliott, Desmond / Kementchedjhieva, Yova et al. | 2023
digital version
2850: Probing Sentiment-Oriented PreTraining Inspired by Human Sentiment Perception Mechanism
Feng, Tinglei / Liu, Jiaxuan / Yang, Jufeng et al. | 2023
digital version
2861: Prefix Conditioning Unifies Language and Label Supervision
Saito, Kuniaki / Sohn, Kihyuk / Zhang, Xiang / Li, Chun-Liang / Lee, Chen-Yu / Saenko, Kate / Pfister, Tomas et al. | 2023
digital version
2871: Crossing the Gap: Domain Generalization for Image Captioning
Ren, Yuchen / Mao, Zhendong / Fang, Shancheng / Lu, Yan / He, Tong / Du, Hao / Zhang, Yongdong / Ouyang, Wanli et al. | 2023
digital version
2881: A Bag-of-Prototypes Representation for Dataset-Level Applications
Tu, Weijie / Deng, Weijian / Gedeon, Tom / Zheng, Liang et al. | 2023
digital version
2893: CrowdCLIP: Unsupervised Crowd Counting via Vision-Language Model
Liang, Dingkang / Xie, Jiahao / Zou, Zhikang / Ye, Xiaoqing / Xu, Wei / Bai, Xiang et al. | 2023
digital version
2904: D²Former: Jointly Learning Hierarchical Detectors and Contextual Descriptors via Agent-Based Transformers
He, Jianfeng / Gao, Yuan / Zhang, Tianzhu / Zhang, Zhe / Wu, Feng et al. | 2023
digital version
2915: Learning to Generate Language-Supervised and Open-Vocabulary Scene Graph Using Pre-Trained Visual-Semantic Space
Zhang, Yong / Pan, Yingwei / Yao, Ting / Huang, Rui / Mei, Tao / Chen, Chang-Wen et al. | 2023
digital version
2925: Relational Context Learning for Human-Object Interaction Detection
Kim, Sanghyun / Jung, Deunsol / Cho, Minsu et al. | 2023
digital version
2935: Learning Open-Vocabulary Semantic Segmentation Models From Natural Language Supervision
Xu, Jilan / Hou, Junlin / Zhang, Yuejie / Feng, Rui / Wang, Yi / Qiao, Yu / Xie, Weidi et al. | 2023
digital version
2945: Side Adapter Network for Open-Vocabulary Semantic Segmentation
Xu, Mengde / Zhang, Zheng / Wei, Fangyun / Hu, Han / Bai, Xiang et al. | 2023
digital version
2955: Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models
Xu, Jiarui / Liu, Sifei / Vahdat, Arash / Byeon, Wonmin / Wang, Xiaolong / De Mello, Shalini et al. | 2023
digital version
2967: IFSeg: Image-free Semantic Segmentation via Vision-Language Model
Yun, Sukmin / Park, Seong Hyeon / Seo, Paul Hongsuck / Shin, Jinwoo et al. | 2023
digital version
2978: PartManip: Learning Cross-Category Generalizable Part Manipulation Policy from Point Cloud Observations
Geng, Haoran / Li, Ziming / Geng, Yiran / Chen, Jiayi / Dong, Hao / Wang, He et al. | 2023
digital version
2989: OneFormer: One Transformer to Rule Universal Image Segmentation
Jain, Jitesh / Li, Jiachen / Chiu, MangTik / Hassani, Ali / Orlov, Nikita / Shi, Humphrey et al. | 2023
digital version
2999: Delving into Shape-aware Zero-shot Semantic Segmentation
Liu, Xinyu / Tian, Beiwen / Wang, Zhen / Wang, Rui / Sheng, Kehua / Zhang, Bo / Zhao, Hao / Zhou, Guyue et al. | 2023
digital version
3010: CoMFormer: Continual Learning in Semantic and Panoptic Segmentation
Cermelli, Fabio / Cord, Matthieu / Douillard, Arthur et al. | 2023
digital version
3021: Learning to Segment Every Referring Object Point by Point
Qu, Mengxue / Wu, Yu / Wei, Yunchao / Liu, Wu / Liang, Xiaodan / Zhao, Yao et al. | 2023
digital version
3031: Unsupervised Continual Semantic Adaptation Through Neural Rendering
Liu, Zhizheng / Milano, Francesco / Frey, Jonas / Siegwart, Roland / Blum, Hermann / Cadena, Cesar et al. | 2023
digital version
3041: Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation
Li, Feng / Zhang, Hao / Xu, Huaizhe / Liu, Shilong / Zhang, Lei / Ni, Lionel M. / Shum, Heung-Yeung et al. | 2023
digital version
3051: Transformer Scale Gate for Semantic Segmentation
Shi, Hengcan / Hayat, Munawar / Cai, Jianfei et al. | 2023
digital version
3061: Style Projected Clustering for Domain Generalized Semantic Segmentation
Huang, Wei / Chen, Chang / Li, Yong / Li, Jiacheng / Li, Cheng / Song, Fenglong / Yan, Youliang / Xiong, Zhiwei et al. | 2023
digital version
3072: Rethinking Few-Shot Medical Segmentation: A Vector Quantization View
Huang, Shiqi / Xu, Tingfa / Shen, Ning / Mu, Feng / Li, Jianan et al. | 2023
digital version
3082: Continual Semantic Segmentation with Automatic Memory Sample Selection
Zhu, Lanyun / Chen, Tianrun / Yin, Jianxiong / See, Simon / Liu, Jun et al. | 2023
digital version
3093: Token Contrast for Weakly-Supervised Semantic Segmentation
Ru, Lixiang / Zheng, Heliang / Zhan, Yibing / Du, Bo et al. | 2023
digital version
3103: Multi-Granularity Archaeological Dating of Chinese Bronze Dings Based on a Knowledge-Guided Relation Graph
Zhou, Rixin / Wei, Jiafu / Zhang, Qian / Qi, Ruihua / Yang, Xi / Li, Chuntao et al. | 2023
digital version
3114: Hunting Sparsity: Density-Guided Contrastive Learning for Semi-Supervised Semantic Segmentation
Wang, Xiaoyang / Zhang, Bingfeng / Yu, Limin / Xiao, Jimin et al. | 2023
digital version
3124: Cut and Learn for Unsupervised Object Detection and Instance Segmentation
Wang, Xudong / Girdhar, Rohit / Yu, Stella X. / Misra, Ishan et al. | 2023
digital version
3135: Extracting Class Activation Maps from Non-Discriminative Features as well
Chen, Zhaozheng / Sun, Qianru et al. | 2023
digital version
3145: BoxTeacher: Exploring High-Quality Pseudo Labels for Weakly Supervised Instance Segmentation
Cheng, Tianheng / Wang, Xinggang / Chen, Shaoyu / Zhang, Qian / Liu, Wenyu et al. | 2023
digital version
3155: Hierarchical Fine-Grained Image Forgery Detection and Localization
Guo, Xiao / Liu, Xiaohong / Ren, Zhiyuan / Grosz, Steven / Masi, Iacopo / Liu, Xiaoming et al. | 2023
digital version
3166: Towards Professional Level Crowd Annotation of Expert Domain Data
Wang, Pei / Vasconcelos, Nuno et al. | 2023
digital version
3176: Unsupervised Object Localization: Observing the Background to Discover Objects
Simeoni, Oriane / Sekkat, Chloe / Puy, Gilles / Vobecky, Antonin / Zablocki, Eloi / Perez, Patrick et al. | 2023
digital version
3187: Semi-supervised learning made simple with self-supervised clustering
Fini, Enrico / Astolfi, Pietro / Alahari, Karteek / Alameda-Pineda, Xavier / Mairal, Julien / Nabi, Moin / Ricci, Elisa et al. | 2023
digital version
3198: Unbalanced Optimal Transport: A Unified Framework for Object Detection
De Plaen, Henri / De Plaen, Pierre-Francois / Suykens, Johan A. K. / Proesmans, Marc / Tuytelaars, Tinne / Van Gool, Luc et al. | 2023
digital version
3208: DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot Object Detection
Ma, Jiawei / Niu, Yulei / Xu, Jincheng / Huang, Shiyuan / Han, Guangxing / Chang, Shih-Fu et al. | 2023
digital version
3219: CLIP the Gap: A Single Domain Generalization Approach for Object Detection
Vidit, Vidit / Engilberge, Martin / Salzmann, Mathieu et al. | 2023
digital version
3230: Unknown Sniffer for Object Detection: Don't Turn a Blind Eye to Unknown Objects
Liang, Wenteng / Xue, Feng / Liu, Yihao / Zhong, Guofeng / Ming, Anlong et al. | 2023
digital version
3240: Consistent-Teacher: Towards Reducing Inconsistent Pseudo-Targets in Semi-Supervised Object Detection
Wang, Xinjiang / Yang, Xingyi / Zhang, Shilong / Li, Yijiang / Feng, Litong / Fang, Shijie / Lyu, Chengqi / Chen, Kai / Zhang, Wayne et al. | 2023
digital version
3250: Optimal Proposal Learning for Deployable End-to-End Pedestrian Detection
Song, Xiaolin / Chen, Binghui / Li, Pengyu / He, Jun-Yan / Wang, Biao / Geng, Yifeng / Xie, Xuansong / Zhang, Honggang et al. | 2023
digital version
3261: AsyFOD: An Asymmetric Adaptation Paradigm for Few-Shot Domain Adaptive Object Detection
Gao, Yipeng / Lin, Kun-Yu / Yan, Junkai / Wang, Yaowei / Zheng, Wei-Shi et al. | 2023
digital version
3272: Where is My Spot? Few-shot Image Generation via Latent Subspace Optimization
Zheng, Chenxi / Liu, Bangzhen / Zhang, Huaidong / Xu, Xuemiao / He, Shengfeng et al. | 2023
digital version
3282: Uncertainty-Aware Optimal Transport for Semantically Coherent Out-of-Distribution Detection
Lu, Fan / Zhu, Kai / Zhai, Wei / Zheng, Kecheng / Cao, Yang et al. | 2023
digital version
3292: MAESTER: Masked Autoencoder Guided Segmentation at Pixel Resolution for Accurate, Self-Supervised Subcellular Structure Recognition
Xie, Ronald / Pang, Kuan / Bader, Gary D. / Wang, Bo et al. | 2023
digital version
3302: Orthogonal Annotation Benefits Barely-supervised Medical Image Segmentation
Cai, Heng / Li, Shumeng / Qi, Lei / Yu, Qian / Shi, Yinghuan / Gao, Yang et al. | 2023
digital version
3312: RepMode: Learning to Re-Parameterize Diverse Experts for Subcellular Structure Prediction
Zhou, Donghao / Gu, Chunbin / Xu, Junde / Liu, Furui / Wang, Qiong / Chen, Guangyong / Heng, Pheng-Ann et al. | 2023
digital version
3323: Topology-Guided Multi-Class Cell Context Generation for Digital Pathology
Abousamra, Shahira / Gupta, Rajarsi / Kurc, Tahsin / Samaras, Dimitris / Saltz, Joel / Chen, Chao et al. | 2023
digital version
3334: Dynamic Graph Enhanced Contrastive Learning for Chest X-Ray Report Generation
Li, Mingjie / Lin, Bingqian / Chen, Zicong / Lin, Haokun / Liang, Xiaodan / Chang, Xiaojun et al. | 2023
digital version
3344: Benchmarking Self-Supervised Learning on Diverse Pathology Datasets
Kang, Mingu / Song, Heon / Park, Seonwook / Yoo, Donggeun / Pereira, Sergio et al. | 2023
digital version
3355: Multiple Instance Learning via Iterative Self-Paced Supervised Contrastive Learning
Liu, Kangning / Zhu, Weicheng / Shen, Yiqiu / Liu, Sheng / Razavian, Narges / Geras, Krzysztof J. / Fernandez-Granda, Carlos et al. | 2023
digital version
3366: Learning Expressive Prompting With Residuals for Vision Transformers
Das, Rajshekhar / Dukler, Yonatan / Ravichandran, Avinash / Swaminathan, Ashwin et al. | 2023
digital version
3378: Detection of Out-of-Distribution Samples Using Binary Neuron Activation Patterns
Olber, Bartlomiej / Radlak, Krystian / Popowicz, Adam / Szczepankiewicz, Michal / Chachula, Krystian et al. | 2023
digital version
3388: Decoupling MaxLogit for Out-of-Distribution Detection
Zhang, Zihan / Xiang, Xiang et al. | 2023
digital version
3398: Exploring Structured Semantic Prior for Multi Label Recognition with Incomplete Labels
Ding, Zixuan / Wang, Ao / Chen, Hui / Zhang, Qiang / Liu, Pengzhang / Bao, Yongjun / Yan, Weipeng / Han, Jungong et al. | 2023
digital version
3408: Bridging the Gap Between Model Explanations in Partially Annotated Multi-Label Classification
Kim, Youngwook / Kim, Jae Myung / Jeong, Jieun / Schmid, Cordelia / Akata, Zeynep / Lee, Jungwoo et al. | 2023
digital version
3418: DivClust: Controlling Diversity in Deep Clustering
Metaxas, Ioannis Maniadis / Tzimiropoulos, Georgios / Patras, Ioannis et al. | 2023
digital version
3429: Deep Semi-Supervised Metric Learning with Mixed Label Propagation
Zhuang, Furen / Moulin, Pierre et al. | 2023
digital version
3439: Leveraging Inter-Rater Agreement for Classification in the Presence of Noisy Labels
Bucarelli, Maria Sofia / Cassano, Lucas / Siciliano, Federico / Mantrach, Amin / Silvestri, Fabrizio et al. | 2023
digital version
3449: Modeling Inter-Class and Intra-Class Constraints in Novel Class Discovery
Li, Wenbin / Fan, Zhichen / Huo, Jing / Gao, Yang et al. | 2023
digital version
3459: Bootstrap Your Own Prior: Towards Distribution-Agnostic Novel Class Discovery
Yang, Muli / Wang, Liancheng / Deng, Cheng / Zhang, Hanwang et al. | 2023
digital version
3469: Towards Realistic Long-Tailed Semi-Supervised Learning: Consistency is All You Need
Wei, Tong / Gan, Kai et al. | 2023
digital version
3479: PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for Generalized Novel Category Discovery
Zhang, Sheng / Khan, Salman / Shen, Zhiqiang / Naseer, Muzammal / Chen, Guangyi / Khan, Fahad Shahbaz et al. | 2023
digital version
3489: Probabilistic Knowledge Distillation of Face Ensembles
Xu, Jianqing / Li, Shen / Deng, Ailin / Xiong, Miao / Wu, Jiaying / Wu, Jiaxiang / Ding, Shouhong / Hooi, Bryan et al. | 2023
digital version
3499: Class-Conditional Sharpness-Aware Minimization for Deep Long-Tailed Recognition
Zhou, Zhipeng / Li, Lanqing / Zhao, Peilin / Heng, Pheng-Ann / Gong, Wei et al. | 2023
digital version
3510: Promoting Semantic Connectivity: Dual Nearest Neighbors Contrastive Learning for Unsupervised Domain Generalization
Liu, Yuchen / Wang, Yaoming / Chen, Yabo / Dai, Wenrui / Li, Chenglin / Zou, Junni / Xiong, Hongkai et al. | 2023
digital version
3520: Instance Relation Graph Guided Source-Free Domain Adaptive Object Detection
VS, Vibashan / Oza, Poojan / Patel, Vishal M. et al. | 2023
digital version
3531: MOT: Masked Optimal Transport for Partial Domain Adaptation
Luo, You-Wei / Ren, Chuan-Xian et al. | 2023
digital version
3541: TOPLight: Lightweight Neural Networks with Task-Oriented Pretraining for Visible-Infrared Recognition
Yu, Hao / Cheng, Xu / Peng, Wei et al. | 2023
digital version
3551: OSAN: A One-Stage Alignment Network to Unify Multimodal Alignment and Unsupervised Domain Adaptation
Liu, Ye / Qiao, Lingfeng / Lu, Changchong / Yin, Di / Lin, Chen / Peng, Haoyuan / Ren, Bo et al. | 2023
digital version
3561: Patch-Mix Transformer for Unsupervised Domain Adaptation: A Game Perspective
Zhu, Jinjing / Bai, Haotian / Wang, Lin et al. | 2023
digital version
3572: ARO-Net: Learning Implicit Fields from Anchored Radial Observations
Wang, Yizhi / Huang, Zeyu / Shamir, Ariel / Huang, Hui / Zhang, Hao / Hu, Ruizhen et al. | 2023
digital version
3582: A Probabilistic Framework for Lifelong Test-Time Adaptation
Brahma, Dhanajit / Rai, Piyush et al. | 2023
digital version
3592: Distribution Shift Inversion for Out-of-Distribution Prediction
Yu, Runpeng / Liu, Songhua / Yang, Xingyi / Wang, Xinchao et al. | 2023
digital version
3603: Learning Joint Latent Space EBM Prior Model for Multi-layer Generator
Cui, Jiali / Wu, Ying Nian / Han, Tian et al. | 2023
digital version
3613: A Data-Based Perspective on Transfer Learning
Jain, Saachi / Salman, Hadi / Khaddaj, Alaa / Wong, Eric / Park, Sung Min / Madry, Aleksander et al. | 2023
digital version
3623: A Meta-Learning Approach to Predicting Performance and Data Requirements
Jain, Achin / Swaminathan, Gurumurthy / Favaro, Paolo / Yang, Hao / Ravichandran, Avinash / Harutyunyan, Hrayr / Achille, Alessandro / Dabeer, Onkar / Schiele, Bernt / Swaminathan, Ashwin et al. | 2023
digital version
3633: Guided Recommendation for Model Fine-Tuning
Li, Hao / Fowlkes, Charless / Yang, Hao / Dabeer, Onkar / Tu, Zhuowen / Soatto, Stefano et al. | 2023
digital version
3643: EMT-NAS: Transferring architectural knowledge between tasks from different datasets
Liao, Peng / Jin, Yaochu / Du, Wenli et al. | 2023
digital version
3654: AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning
Wang, Runqi / Duan, Xiaoyue / Kang, Guoliang / Liu, Jianzhuang / Lin, Shaohui / Xu, Songcen / Lv, Jinhu / Zhang, Baochang et al. | 2023
digital version
3664: Batch Model Consolidation: A Multi-Task Model Consolidation Framework
Fostiropoulos, Iordanis / Zhu, Jiaye / Itti, Laurent et al. | 2023
digital version
3677: SmartAssign:Learning A Smart Knowledge Assignment Strategy for Deraining and Desnowing
Wang, Yinglong / Ma, Chao / Liu, Jianzhuang et al. | 2023
digital version
3687: TinyMIM: An Empirical Study of Distilling MIM Pre-trained Models
Ren, Sucheng / Wei, Fangyun / Zhang, Zheng / Hu, Han et al. | 2023
digital version
3698: Computationally Budgeted Continual Learning: What Does Matter?
Prabhu, Ameya / Al Kader Hammoud, Hasan Abed / Dokania, Puneet / Torr, Philip H.S. / Lim, Ser-Nam / Ghanem, Bernard / Bibi, Adel et al. | 2023
digital version
3708: GradMA: A Gradient-Memory-based Accelerated Federated Learning with Alleviated Catastrophic Forgetting
Luo, Kangyang / Li, Xiang / Lan, Yunshi / Gao, Ming et al. | 2023
digital version
3718: Rethinking Gradient Projection Continual Learning: Stability/Plasticity Feature Space Decoupling
Zhao, Zhen / Zhang, Zhizhong / Tan, Xin / Liu, Jun / Qu, Yanyun / Xie, Yuan / Ma, Lizhuang et al. | 2023
digital version
3728: Neuro-Modulated Hebbian Learning for Fully Test-Time Adaptation
Tang, Yushun / Zhang, Ce / Xu, Heng / Chen, Shuoshuo / Cheng, Jie / Leng, Luziwei / Guo, Qinghai / He, Zhihai et al. | 2023
digital version
3739: Generalizing Dataset Distillation via Deep Generative Prior
Cazenavette, George / Wang, Tongzhou / Torralba, Antonio / Efros, Alexei A. / Zhu, Jun-Yan et al. | 2023
digital version
3749: Minimizing the Accumulated Trajectory Error to Improve Dataset Distillation
Du, Jiawei / Jiang, Yidi / Tan, Vincent Y.F. / Zhou, Joey Tianyi / Li, Haizhou et al. | 2023
digital version
3759: Slimmable Dataset Condensation
Liu, Songhua / Ye, Jingwen / Yu, Runpeng / Wang, Xinchao et al. | 2023
digital version
3769: Sharpness-Aware Gradient Matching for Domain Generalization
Wang, Pengfei / Zhang, Zhaoxiang / Lei, Zhen / Zhang, Lei et al. | 2023
digital version
3779: Dynamic Neural Network for Multi-Task Learning Searching across Diverse Network Topologies
Choi, Wonhyeok / Im, Sunghoon et al. | 2023
digital version
3789: SplineCam: Exact Visualization and Characterization of Deep Network Geometry and Decision Boundaries
Humayun, Ahmed Imtiaz / Balestriero, Randall / Balakrishnan, Guha / Baraniuk, Richard et al. | 2023
digital version
3799: VNE: An Effective Method for Improving Deep Representation by Manipulating Eigenvalue Distribution
Kim, Jaeill / Kang, Suhyun / Hwang, Duhun / Shin, Jungwook / Rhee, Wonjong et al. | 2023
digital version
3811: Efficient On-Device Training via Gradient Filtering
Yang, Yuedong / Li, Guihong / Marculescu, Radu et al. | 2023
digital version
3821: Are Data-Driven Explanations Robust Against Out-of-Distribution Data?
Li, Tang / Qiao, Fengchun / Ma, Mengmeng / Peng, Xi et al. | 2023
digital version
3832: BiasAdv: Bias-Adversarial Augmentation for Model Debiasing
Lim, Jongin / Kim, Youngdong / Kim, Byungjai / Ahn, Chanho / Shin, Jinwoo / Yang, Eunho / Han, Seungju et al. | 2023
digital version
3842: Q-DETR: An Efficient Low-Bit Quantized Detection Transformer
Xu, Sheng / Li, Yanjing / Lin, Mingbao / Gao, Peng / Guo, Guodong / Lu, Jinhu / Zhang, Baochang et al. | 2023
digital version
3852: NIPQ: Noise proxy-based Integrated Pseudo-Quantization
Shin, Juncheol / So, Junhyuk / Park, Sein / Kang, Seungyeop / Yoo, Sungjoo / Park, Eunhyeok et al. | 2023
digital version
3862: CUDA: Convolution-Based Unlearnable Datasets
Sadasivan, Vinu Sankar / Soltanolkotabi, Mahdi / Feizi, Soheil et al. | 2023
digital version
3872: KD-DLGAN: Data Limited Image Generation via Knowledge Distillation
Cui, Kaiwen / Yu, Yingchen / Zhan, Fangneng / Liao, Shengcai / Lu, Shijian / Xing, Eric et al. | 2023
digital version
3883: Spider GAN: Leveraging Friendly Neighbors to Accelerate GAN Training
Asokan, Siddarth / Seelamantula, Chandra Sekhar et al. | 2023
digital version
3894: Efficient Verification of Neural Networks Against LVM-Based Specifications
Hanspal, Harleen / Lomuscio, Alessio et al. | 2023
digital version
3904: Bi-directional Feature Fusion Generative Adversarial Network for Ultra-high Resolution Pathological Image Virtual Re-staining
Sun, Kexin / Chen, Zhineng / Wang, Gongwei / Liu, Jun / Ye, Xiongjun / Jiang, Yu-Gang et al. | 2023
digital version
3914: DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly Detection
Zhang, Xuan / Li, Shiyu / Li, Xi / Huang, Ping / Shan, Jiulong / Chen, Ting et al. | 2023
digital version
3924: OmniAL: A Unified CNN Framework for Unsupervised Anomaly Localization
Zhao, Ying et al. | 2023
digital version
3934: Federated Incremental Semantic Segmentation
Dong, Jiahua / Zhang, Duzhen / Cong, Yang / Cong, Wei / Ding, Henghui / Dai, Dengxin et al. | 2023
digital version
3944: Re-Thinking Federated Active Learning Based on Inter-Class Diversity
Kim, SangMook / Bae, Sangmin / Song, Hwanjun / Yun, Se-Young et al. | 2023
digital version
3954: Federated Domain Generalization with Generalization Adjustment
Zhang, Ruipeng / Xu, Qinwei / Yao, Jiangchao / Zhang, Ya / Tian, Qi / Wang, Yanfeng et al. | 2023
digital version
3964: On the Effectiveness of Partial Variance Reduction in Federated Learning with Heterogeneous Data
Li, Bo / Schmidt, Mikkel N. / Alstrom, Tommy S. / Stich, Sebastian U. et al. | 2023
digital version
3974: The Resource Problem of Using Linear Layer Leakage Attack in Federated Learning
Zhao, Joshua C. / Elkordy, Ahmed Roushdy / Sharma, Atul / Ezzeldin, Yahya H. / Avestimehr, Salman / Bagchi, Saurabh et al. | 2023
digital version
3984: Unlearnable Clusters: Towards Label-Agnostic Unlearnable Examples
Zhang, Jiaming / Ma, Xingjun / Yi, Qi / Sang, Jitao / Jiang, Yu-Gang / Wang, Yaowei / Xu, Changsheng et al. | 2023
digital version
3994: Implicit Identity Leakage: The Stumbling Block to Improving Deepfake Detection Generalization
Dong, Shichao / Wang, Jin / Ji, Renhe / Liang, Jiajun / Fan, Haoqiang / Ge, Zheng et al. | 2023
digital version
4005: Backdoor Defense via Adaptively Splitting Poisoned Dataset
Gao, Kuofeng / Bai, Yang / Gu, Jindong / Yang, Yong / Xia, Shu-Tao et al. | 2023
digital version
4015: How to Backdoor Diffusion Models?
Chou, Sheng-Yen / Chen, Pin-Yu / Ho, Tsung-Yi et al. | 2023
digital version
4025: TrojViT: Trojan Insertion in Vision Transformers
Zheng, Mengxin / Lou, Qian / Jiang, Lei et al. | 2023
digital version
4035: TrojDiff: Trojan Attacks on Diffusion Models with Diverse Targets
Chen, Weixin / Song, Dawn / Li, Bo et al. | 2023
digital version
4045: Ensemble-based Blackbox Attacks on Dense Prediction
Cai, Zikui / Tan, Yaoteng / Asif, M. Salman et al. | 2023
digital version
4056: Efficient Loss Function by Minimizing the Detrimental Effect of Floating-Point Errors on Gradient-Based Attacks
Yu, Yunrui / Xu, Cheng-Zhong et al. | 2023
digital version
4067: The Best Defense is a Good Offense: Adversarial Augmentation Against Adversarial Attacks
Frosio, Iuri / Kautz, Jan et al. | 2023
digital version
4077: Adversarial Robustness via Random Projection Filters
Dong, Minjing / Xu, Chang et al. | 2023
digital version
4087: Jedi: Entropy-Based Localization and Removal of Adversarial Patches
Tarchoun, Bilel / Khalifa, Anouar Ben / Mahjoub, Mohamed Ali / Abu-Ghazaleh, Nael / Alouani, Ihsen et al. | 2023
digital version
4096: Exploring the Relationship Between Architectural Design and Adversarially Robust Generalization
Liu, Aishan / Tang, Shiyu / Liang, Siyuan / Gong, Ruihao / Wu, Boxi / Liu, Xianglong / Tao, Dacheng et al. | 2023
digital version
4108: Improving Robustness of Vision Transformers by Reducing Sensitivity to Patch Corruptions
Guo, Yong / Stutz, David / Schiele, Bernt et al. | 2023
digital version
4119: Towards Effective Adversarial Textured 3D Meshes on Physical Face Recognition
Yang, Xiao / Liu, Chang / Xu, Longlong / Wang, Yikai / Dong, Yinpeng / Chen, Ning / Su, Hang / Zhu, Jun et al. | 2023
digital version
4129: AltFreezing for More General Video Face Forgery Detection
Wang, Zhendong / Bao, Jianmin / Zhou, Wengang / Wang, Weilun / Li, Houqiang et al. | 2023
digital version
4139: Passive Micron-Scale Time-of-Flight with Sunlight Interferometry
Kotwal, Alankar / Levin, Anat / Gkioulekas, Ioannis et al. | 2023
digital version
4150: F²-NeRF: Fast Neural Radiance Field Training with Free Camera Trajectories
Wang, Peng / Liu, Yuan / Chen, Zhaoxi / Liu, Lingjie / Liu, Ziwei / Komura, Taku / Theobalt, Christian / Wang, Wenping et al. | 2023
digital version
4160: NoPe-NeRF: Optimising Neural Radiance Field with No Pose Prior
Bian, Wenjing / Wang, Zirui / Li, Kejie / Bian, Jia-Wang et al. | 2023
digital version
4170: BAD-NeRF: Bundle Adjusted Deblur Neural Radiance Fields
Wang, Peng / Zhao, Lingzhe / Ma, Ruijie / Liu, Peidong et al. | 2023
digital version
4180: DiffusioNeRF: Regularizing Neural Radiance Fields with Denoising Diffusion Models
Wynn, Jamie / Turmukhambetov, Daniyar et al. | 2023
digital version
4190: SPARF: Neural Radiance Fields from Sparse and Noisy Poses
Truong, Prune / Rakotosaona, Marie-Julie / Manhardt, Fabian / Tombari, Federico et al. | 2023
digital version
4201: Interactive Segmentation of Radiance Fields
Goel, Rahul / Sirikonda, Dhawal / Saini, Saurabh / Narayanan, P J et al. | 2023
digital version
4212: Temporal Interpolation is all You Need for Dynamic Neural Radiance Fields
Park, Sungheon / Son, Minjung / Jang, Seokhwan / Ahn, Young Chun / Kim, Ji-Yeon / Kang, Nahyup et al. | 2023
digital version
4222: Compressing Volumetric Radiance Fields to 1 MB
Li, Lingzhi / Shen, Zhen / Wang, Zhongshu / Shen, Li / Bo, Liefeng et al. | 2023
digital version
4232: Multiscale Tensor Decomposition and Rendering Equation Encoding for View Synthesis
Han, Kang / Xiang, Wei et al. | 2023
digital version
4242: Ref-NPR: Reference-Based Non-Photorealistic Radiance Fields for Controllable Scene Stylization
Zhang, Yuechen / He, Zexin / Xing, Jinbo / Yao, Xufeng / Jia, Jiaya et al. | 2023
digital version
4252: Representing Volumetric Videos as Dynamic MLP Maps
Peng, Sida / Yan, Yunzhi / Shuai, Qing / Bao, Hujun / Zhou, Xiaowei et al. | 2023
digital version
4263: Fast Monocular Scene Reconstruction with Global-Sparse Local-Dense Grids
Dong, Wei / Choy, Chris / Loop, Charles / Litany, Or / Zhu, Yuke / Anandkumar, Anima et al. | 2023
digital version
4273: DynIBaR: Neural Dynamic Image-Based Rendering
Li, Zhengqi / Wang, Qianqian / Cole, Forrester / Tucker, Richard / Snavely, Noah et al. | 2023
digital version
4285: Plateau-Reduced Differentiable Path Tracing
Fischer, Michael / Ritschel, Tobias et al. | 2023
digital version
4295: NeFII: Inverse Rendering for Reflectance Decomposition with Near-Field Indirect Illumination
Wu, Haoqian / Hu, Zhipeng / Li, Lincheng / Zhang, Yongqiang / Fan, Changjie / Yu, Xin et al. | 2023
digital version
4305: WildLight: In-the-wild Inverse Rendering with a Flashlight
Cheng, Ziang / Li, Junxuan / Li, Hongdong et al. | 2023
digital version
4315: Relightable Neural Human Assets from Multi-view Gradient Illuminations
Zhou, Taotao / He, Kai / Wu, Di / Xu, Teng / Zhang, Qixuan / Shao, Kuixiang / Chen, Wenzheng / Xu, Lan / Yu, Jingyi et al. | 2023
digital version
4328: DiffRF: Rendering-Guided 3D Radiance Field Diffusion
Muller, Norman / Siddiqui, Yawar / Porzi, Lorenzo / Bulo, Samuel Rota / Kontschieder, Peter / NieBner, Matthias et al. | 2023
digital version
4339: Analyzing Physical Impacts Using Transient Surface Wave Imaging
Zhang, Tianyuan / Sheinin, Mark / Chan, Dorian / Rau, Mark / O'Toole, Matthew / Narasimhan, Srinivasa G. et al. | 2023
digital version
4349: Neural Kaleidoscopic Space Sculpting
Ahn, Byeongjoo / De Zeeuw, Michael / Gkioulekas, Ioannis / Sankaranarayanan, Aswin C. et al. | 2023
digital version
4359: Towards Unbiased Volume Rendering of Neural Implicit Surfaces with Geometry Priors
Zhang, Yongqiang / Hu, Zhipeng / Wu, Haoqian / Zhao, Minda / Li, Lincheng / Zou, Zhengxia / Fan, Changjie et al. | 2023
digital version
4369: Neural Kernel Surface Reconstruction
Huang, Jiahui / Gojcic, Zan / Atzmon, Matan / Litany, Or / Fidler, Sanja / Williams, Francis et al. | 2023
digital version
4380: MM-3DScene: 3D Scene Understanding by Customizing Masked Modeling with Informative-Preserved Reconstruction and Self-Distilled Consistency
Xu, Mingye / Xu, Mutian / He, Tong / Ouyang, Wanli / Wang, Yali / Han, Xiaoguang / Qiao, Yu et al. | 2023
digital version
4391: Shape, Pose, and Appearance from a Single Image via Bootstrapped Radiance Field Inversion
Pavllo, Dario / Tan, David Joseph / Rakotosaona, Marie-Julie / Tombari, Federico et al. | 2023
digital version
4402: DisCoScene: Spatially Disentangled Generative Radiance Fields for Controllable 3D-aware Scene Synthesis
Xu, Yinghao / Chai, Menglei / Shi, Zifan / Peng, Sida / Skorokhodov, Ivan / Siarohin, Aliaksandr / Yang, Ceyuan / Shen, Yujun / Lee, Hsin-Ying / Zhou, Bolei et al. | 2023
digital version
4413: Heat Diffusion Based Multi-Scale and Geometric Structure-Aware Transformer for Mesh Segmentation
Wong, Chi-Chong et al. | 2023
digital version
4423: Learning Detailed Radiance Manifolds for High-Fidelity and 3D-Consistent Portrait Synthesis from Monocular Image
Deng, Yu / Wang, Baoyuan / Shum, Heung-Yeung et al. | 2023
digital version
4434: 3D-aware Conditional Image Synthesis
Deng, Kangle / Yang, Gengshan / Ramanan, Deva / Zhu, Jun-Yan et al. | 2023
digital version
4446: VIVE3D: Viewpoint-Independent Video Editing using 3D-Aware GANs
Fruhstuck, Anna / Sarafianos, Nikolaos / Xu, Yuanlu / Wonka, Peter / Tung, Tony et al. | 2023
digital version
4456: SDFusion: Multimodal 3D Shape Completion, Reconstruction, and Generation
Cheng, Yen-Chi / Lee, Hsin-Ying / Tulyakov, Sergey / Schwing, Alexander / Gui, Liangyan et al. | 2023
digital version
4466: Generating Part-Aware Editable 3D Shapes without 3D Supervision
Tertikas, Konstantinos / Paschalidou, Despoina / Pan, Boxiao / Park, Jeong Joon / Uy, Mikaela Angelina / Emiris, Ioannis / Avrithis, Yannis / Guibas, Leonidas et al. | 2023
digital version
4479: NeuralLift-360: Lifting an in-the-Wild 2D Photo to A 3D Object with 360° Views
Xu, Dejia / Jiang, Yifan / Wang, Peihao / Fan, Zhiwen / Wang, Yi / Wang, Zhangyang et al. | 2023
digital version
4490: Implicit Identity Driven Deepfake Face Swapping Detection
Huang, Baojin / Wang, Zhongyuan / Yang, Jifan / Ai, Jiaxin / Zou, Qin / Wang, Qian / Ye, Dengpan et al. | 2023
digital version
4500: Canonical Fields: Self-Supervised Learning of Pose-Canonicalized Neural Fields
Agaram, Rohith / Dewan, Shaurya / Sajnani, Rahul / Poulenard, Adrien / Krishna, Madhava / Sridhar, Srinath et al. | 2023
digital version
4511: Improving Fairness in Facial Albedo Estimation via Visual-Textual Cues
Ren, Xingyu / Deng, Jiankang / Ma, Chao / Yan, Yichao / Yang, Xiaokang et al. | 2023
digital version
4521: High-fidelity 3D Face Generation from Natural Language Descriptions
Wu, Menghua / Zhu, Hao / Huang, Linjia / Zhuang, Yiyu / Lu, Yuanxun / Cao, Xun et al. | 2023
digital version
4531: DSFNet: Dual Space Fusion Network for Occlusion-Robust 3D Dense Face Alignment
Li, Heyuan / Wang, Bo / Cheng, Yu / Kankanhalli, Mohan / Tan, Robby T. et al. | 2023
digital version
4541: High-fidelity Facial Avatar Reconstruction from Monocular Video with Generative Priors
Bai, Yunpeng / Fan, Yanbo / Wang, Xuan / Zhang, Yong / Sun, Jingxiang / Yuan, Chun / Shan, Ying et al. | 2023
digital version
4552: 3DAvatarGAN: Bridging Domains for Personalized Editable Avatars
Abdal, Rameen / Lee, Hsin-Ying / Zhu, Peihao / Chai, Menglei / Siarohin, Aliaksandr / Wonka, Peter / Tulyakov, Sergey et al. | 2023
digital version
4563: RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion
Wang, Tengfei / Zhang, Bo / Zhang, Ting / Gu, Shuyang / Bao, Jianmin / Baltrusaitis, Tadas / Shen, Jingjing / Chen, Dong / Wen, Fang / Chen, Qifeng et al. | 2023
digital version
4574: Instant Volumetric Head Avatars
Zielonka, Wojciech / Bolkart, Timo / Thies, Justus et al. | 2023
digital version
4585: Synthesizing Photorealistic Virtual Humans Through Cross-Modal Disentanglement
Ravichandran, Siddarth / Texler, Ondrej / Dinev, Dimitar / Kang, Hyun Jae et al. | 2023
digital version
4595: 3D Cinemagraphy from a Single Image
Li, Xingyi / Cao, Zhiguo / Sun, Huiqiang / Zhang, Jianming / Xian, Ke / Lin, Guosheng et al. | 2023
digital version
4606: TryOnDiffusion: A Tale of Two UNets
Zhu, Luyang / Yang, Dawei / Zhu, Tyler / Reda, Fitsum / Chan, William / Saharia, Chitwan / Norouzi, Mohammad / Kemelmacher-Shlizerman, Ira et al. | 2023
digital version
4616: Diverse 3D Hand Gesture Prediction from Body Dynamics by Bilateral Hand Disentanglement
Qi, Xingqun / Liu, Chen / Sun, Muyi / Li, Lincheng / Fan, Changjie / Yu, Xin et al. | 2023
digital version
4627: Normal-guided Garment UV Prediction for Human Re-texturing
Jafarian, Yasamin / Wang, Tuanfeng Y. / Ceylan, Duygu / Yang, Jimei / Carr, Nathan / Zhou, Yi / Park, Hyun Soo et al. | 2023
digital version
4637: REC-MV: REconstructing 3D Dynamic Cloth from Monocular Videos
Qiu, Lingteng / Chen, Guanying / Zhou, Jiapeng / Xu, Mutian / Wang, Junle / Han, Xiaoguang et al. | 2023
digital version
4647: SeSDF: Self-Evolved Signed Distance Field for Implicit 3D Clothed Human Reconstruction
Cao, Yukang / Han, Kai / Wong, Kwan-Yee K. et al. | 2023
digital version
4670: Handy: Towards a High Fidelity 3D Hand Shape and Appearance Model
Potamias, Rolandos Alexandros / Ploumpis, Stylianos / Moschoglou, Stylianos / Triantafyllou, Vasileios / Zafeiriou, Stefanos et al. | 2023
digital version
4681: Fantastic Breaks: A Dataset of Paired 3D Scans of Real-World Broken Objects and Their Complete Counterparts
Lamb, Nikolas / Palmer, Cameron / Molloy, Benjamin / Banerjee, Sean / Banerjee, Natasha Kholgade et al. | 2023
digital version
4692: Distilling Neural Fields for Real-Time Articulated Shape Reconstruction
Tan, Jeff / Yang, Gengshan / Ramanan, Deva et al. | 2023
digital version
4702: GANmouflage: 3D Object Nondetection with Texture Fields
Guo, Rui / Collins, Jasmine / de Lima, Oscar / Owens, Andrew et al. | 2023
digital version
4713: 3D Human Pose Estimation via Intuitive Physics
Tripathi, Shashank / Muller, Lea / Huang, Chun-Hao P. / Taheri, Omid / Black, Michael J. / Tzionas, Dimitrios et al. | 2023
digital version
4726: Object pop-up: Can we infer 3D objects and their poses from human interactions alone?
Petrov, Ilya A. / Marin, Riccardo / Chibane, Julian / Pons-Moll, Gerard et al. | 2023
digital version
4737: UniDexGrasp: Universal Robotic Dexterous Grasping via Learning Diverse Proposal Generation and Goal-Conditioned Policy
Xu, Yinzhen / Wan, Weikang / Zhang, Jialiang / Liu, Haoran / Shan, Zikang / Shen, Hao / Wang, Ruicheng / Geng, Haoran / Weng, Yijia / Chen, Jiayi et al. | 2023
digital version
4747: Constrained Evolutionary Diffusion Filter for Monocular Endoscope Tracking
Luo, Xiongbiao et al. | 2023
digital version
4757: Visibility Aware Human-Object Interaction Tracking from Single RGB Camera
Xie, Xianghui / Bhatnagar, Bharat Lal / Pons-Moll, Gerard et al. | 2023
digital version
4769: Transformer-based Unified Recognition of Two Hands Manipulating Objects
Cho, Hoseong / Kim, Chanwoo / Kim, Jihyeon / Lee, Seongyeong / Ismayilzada, Elkhan / Baek, Seungryul et al. | 2023
digital version
4779: HuManiFlow: Ancestor-Conditioned Normalising Flows on SO(3) Manifolds for Human Pose and Shape Distribution Estimation
Sengupta, Akash / Budvytis, Ignas / Cipolla, Roberto et al. | 2023
digital version
4790: 3D Human Pose Estimation with Spatio-Temporal Criss-Cross Attention
Tang, Zhenhua / Qiu, Zhaofan / Hao, Yanbin / Hong, Richang / Yao, Ting et al. | 2023
digital version
4800: GFPose: Learning 3D Human Pose Prior with Gradient Fields
Ci, Hai / Wu, Mingdong / Zhu, Wentao / Ma, Xiaoxuan / Dong, Hao / Zhong, Fangwei / Wang, Yizhou et al. | 2023
digital version
4811: JRDB-Pose: A Large-Scale Dataset for Multi-Person Pose Estimation and Tracking
Vendrow, Edward / Le, Duy Tho / Cai, Jianfei / Rezatofighi, Hamid et al. | 2023
digital version
4821: Analyzing and Diagnosing Pose Estimation with Attributions
He, Qiyuan / Yang, Linlin / Gu, Kerui / Lin, Qiuxia / Yao, Angela et al. | 2023
digital version
4831: Shape-Constraint Recurrent Flow for 6D Object Pose Estimation
Hai, Yang / Song, Rui / Li, Jiaojiao / Hu, Yinlin et al. | 2023
digital version
4841: TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose Estimation
Chen, Hanzhi / Manhardt, Fabian / Navab, Nassir / Busam, Benjamin et al. | 2023
digital version
4853: Hi-LASSIE: High-Fidelity Articulated Shape and Skeleton Discovery from Sparse Image Ensemble
Yao, Chun-Han / Hung, Wei-Chih / Li, Yuanzhen / Rubinstein, Michael / Yang, Ming-Hsuan / Jampani, Varun et al. | 2023
digital version
4863: Revisiting Rolling Shutter Bundle Adjustment: Toward Accurate and Fast Solution
Liao, Bangyan / Qu, Delin / Xue, Yifei / Zhang, Huiqing / Lao, Yizhen et al. | 2023
digital version
4872: Revisiting the P3P Problem
Ding, Yaqing / Yang, Jian / Larsson, Viktor / Olsson, Carl / Astrom, Kalle et al. | 2023
digital version
4881: Common Pets in 3D: Dynamic New-View Synthesis of Real-Life Deformable Categories
Sinha, Samarth / Shapovalov, Roman / Reizenstein, Jeremy / Rocco, Ignacio / Neverova, Natalia / Vedaldi, Andrea / Novotny, David et al. | 2023
digital version
4892: MobileBrick: Building LEGO for 3D Reconstruction on Mobile Devices
Li, Kejie / Bian, Jia-Wang / Castle, Robert / Torr, Philip H.S. / Prisacariu, Victor Adrian et al. | 2023
digital version
4902: EFEM: Equivariant Neural Field Expectation Maximization for 3D Object Segmentation Without Scene Supervision
Lei, Jiahui / Deng, Congyue / Schmeckpeper, Karl / Guibas, Leonidas / Daniilidis, Kostas et al. | 2023
digital version
4913: GINA-3D: Learning to Generate Implicit Neural Assets in the Wild
Shen, Bokui / Yan, Xinchen / Qi, Charles R. / Najibi, Mahyar / Deng, Boyang / Guibas, Leonidas / Zhou, Yin / Anguelov, Dragomir et al. | 2023
digital version
4927: Habitat-Matterport 3D Semantics Dataset
Yadav, Karmesh / Ramrakhya, Ram / Ramakrishnan, Santhosh Kumar / Gervet, Theo / Turner, John / Gokaslan, Aaron / Maestre, Noah / Chang, Angel Xuan / Batra, Dhruv / Savva, Manolis et al. | 2023
digital version
4937: BUOL: A Bottom-Up Framework with Occupancy-Aware Lifting for Panoptic 3D Scene Reconstruction From a Single Image
Chu, Tao / Zhang, Pan / Liu, Qiong / Wang, Jiaqi et al. | 2023
digital version
4947: Panoptic Compositional Feature Field for Editable Scene Rendering with Network-Inferred Labels via Metric Learning
Cheng, Xinhua / Wu, Yanmin / Jia, Mengxi / Wang, Qian / Zhang, Jian et al. | 2023
digital version
4958: A Light Touch Approach to Teaching Transformers Multi-view Geometry
Bhalgat, Yash / Henriques, Joao F. / Zisserman, Andrew et al. | 2023
digital version
4970: Learning to Render Novel Views from Wide-Baseline Stereo Pairs
Du, Yilun / Smith, Cameron / Tewari, Ayush / Sitzmann, Vincent et al. | 2023
digital version
4981: Spring: A High-Resolution High-Detail Dataset and Benchmark for Scene Flow, Optical Flow and Stereo
Mehl, Lukas / Schmalfuss, Jenny / Jahedi, Azin / Nalivayko, Yaroslava / Bruhn, Andres et al. | 2023
digital version
4992: EventNeRF: Neural Radiance Fields from a Single Colour Event Camera
Rudnev, Viktor / Elgharib, Mohamed / Theobalt, Christian / Golyanik, Vladislav et al. | 2023
digital version
5003: LightedDepth: Video Depth Estimation in Light of Limited Inference View Angles
Zhu, Shengjie / Liu, Xiaoming et al. | 2023
digital version
5013: Generating Aligned Pseudo-Supervision from Non-Aligned Data for Image Restoration in Under-Display Camera
Feng, Ruicheng / Li, Chongyi / Chen, Huaijin / Li, Shuai / Gu, Jinwei / Loy, Chen Change et al. | 2023
digital version
5023: Spatio-Focal Bidirectional Disparity Estimation from a Dual-Pixel Image
Kim, Donggun / Jang, Hyeonjoong / Kim, Inchul / Kim, Min H. et al. | 2023
digital version
5033: Trap Attention: Monocular Depth Estimation with Manual Traps
Ning, Chao / Gan, Hongping et al. | 2023
digital version
5044: Accelerated Coordinate Encoding: Learning to Relocalize in Minutes Using RGB and Poses
Brachmann, Eric / Cavallari, Tommaso / Prisacariu, Victor Adrian et al. | 2023
digital version
5054: Energy-Efficient Adaptive 3D Sensing
Tilmon, Brevin / Sun, Zhanghao / Koppal, Sanjeev J. / Wu, Yicheng / Evangelidis, Georgios / Zahreddine, Ramzi / Krishnan, Gurunandan / Ma, Sizhuo / Wang, Jian et al. | 2023
digital version
5064: Incremental 3D Semantic Scene Graph Prediction from RGB Sequences
Wu, Shun-Cheng / Tateno, Keisuke / Navab, Nassir / Tombari, Federico et al. | 2023
digital version
5075: Consistent Direct Time-of-Flight Video Depth Super-Resolution
Sun, Zhanghao / Ye, Wei / Xiong, Jinhui / Choe, Gyeongmin / Wang, Jialiang / Su, Shuochen / Ranjan, Rakesh et al. | 2023
digital version
5086: Learning to Zoom and Unzoom
Thavamani, Chittesh / Li, Mengtian / Ferroni, Francesco / Ramanan, Deva et al. | 2023
digital version
5096: FrustumFormer: Adaptive Instance-aware Resampling for Multi-view 3D Detection
Wang, Yuqi / Chen, Yuntao / Zhang, Zhaoxiang et al. | 2023
digital version
5106: 3D Video Object Detection with Learnable Object-Centric Global Optimization
He, Jiawei / Chen, Yuntao / Wang, Naiyan / Zhang, Zhaoxiang et al. | 2023
digital version
5116: UniDistill: A Universal Cross-Modality Knowledge Distillation Framework for 3D Object Detection in Bird's-Eye View
Zhou, Shengchao / Liu, Weizhou / Hu, Chen / Zhou, Shuchang / Ma, Chao et al. | 2023
digital version
5126: ARKitTrack: A New Diverse Dataset for Tracking Using Mobile RGB-D Data
Zhao, Haojie / Chen, Junsong / Wang, Lijun / Lu, Huchuan et al. | 2023
digital version
5136: Deep Dive into Gradients: Better Optimization for 3D Object Detection with Gradient-Corrected IoU Supervision
Ming, Qi / Miao, Lingjuan / Ma, Zhe / Zhao, Lin / Zhou, Zhiqiang / Huang, Xuhui / Chen, Yuanpei / Guo, Yufei et al. | 2023
digital version
5146: SlowLiDAR: Increasing the Latency of LiDAR-Based Detection Using Adversarial Examples
Liu, Han / Wu, Yuhao / Yu, Zhiyuan / Vorobeychik, Yevgeniy / Zhang, Ning et al. | 2023
digital version
5156: Normalizing Flow based Feature Synthesis for Outlier-Aware Object Detection
Kumar, Nishant / Segvic, Sinisa / Eslami, Abouzar / Gumhold, Stefan et al. | 2023
digital version
5166: OcTr: Octree-Based Transformer for 3D Object Detection
Zhou, Chao / Zhang, Yanan / Chen, Jiaxin / Huang, Di et al. | 2023
digital version
5176: HypLiLoc: Towards Effective LiDAR Pose Regression with Hyperbolic Fusion
Wang, Sijie / Kang, Qiyu / She, Rui / Wang, Wei / Zhao, Kai / Song, Yang / Tay, Wee Peng et al. | 2023
digital version

How to get this title?

Check access

Download

Commercial Copyright fee: €30.47 Basic fee: €4.00 Total price: €34.47

Academic Copyright fee: €30.47 Basic fee: €2.00 Total price: €32.47

Quicklinks

Borrowing & Ordering

Quicklinks

Search & discover

Quicklinks

Learning & working

Quicklinks

Publishing & Archiving

Quicklinks

About the TIB

Quicklinks

Research & Development

PartManip: Learning Cross-Category Generalizable Part Manipulation Policy from Point Cloud Observations (English)

How to get this title?

Export, share and cite

More details on this result

Table of contents

Table of contents conference proceedings

Similar titles

How to get this title?

Export, share and cite