Unifying Event Detection and Captioning as Sequence Generation via Pre-training (English)

Zhang, Qi / Song, Yuqing / Jin, Qin

In: Computer vision – ECCV 2022 ; Part 36 ; 363-379 ; 2022

ISBN:

9783031200588

Conference paper / Print

How to get this title?

Local TIB services

Contain in:

RN 2835(13696)

Order copy

LUH Campus collection

TIB document delivery Purchase

Pricing information

Alternative Version

Electronic version available

Export, share and cite

Title:

Unifying Event Detection and Captioning as Sequence Generation via Pre-training
Contributors:

Zhang, Qi ( author ) / Song, Yuqing ( author ) / Jin, Qin ( author )
Conference:

ECCV ; 17. ; 2022 ; Tel Aviv; Online
Published in:

Computer vision – ECCV 2022 ; Part 36 ; 363-379
Publisher:

Springer

Place of publication:

Cham
Publication date:

2022
ISBN:

9783031200588
DOI:

https://doi.org/10.1007/978-3-031-20059-5_21
Type of media:

Conference paper
Type of material:

Print
Language:

English

Keywords:

Maschinelles Lernen , Bildanalyse , Computervision , Objekterkennung

Classification:

BKL:

54.74 Maschinelles Sehen

Source:

TIBKAT

The tables of contents are generated automatically and are based on the data records of the individual contributions available in the index of the TIB portal. The display of the Tables of Contents may therefore be incomplete.

1: Making the Most of Text Semantics to Improve Biomedical Vision-Language Processing
Boecking, Benedikt / Usuyama, Naoto / Bannur, Shruthi / Castro, Daniel C. / Schwaighofer, Anton / Hyland, Stephanie / Wetscherek, Maria / Naumann, Tristan / Nori, Aditya / Alvarez-Valle, Javier et al. | 2022
print version
22: Generative Negative Text Replay for Continual Vision-Language Pretraining
Yan, Shipeng / Hong, Lanqing / Xu, Hang / Han, Jianhua / Tuytelaars, Tinne / Li, Zhenguo / He, Xuming et al. | 2022
print version
39: Video Graph Transformer for Video Question Answering
Xiao, Junbin / Zhou, Pan / Chua, Tat-Seng / Yan, Shuicheng et al. | 2022
print version
59: Trace Controlled Text to Image Generation
Yan, Kun / Ji, Lei / Wu, Chenfei / Bao, Jianmin / Zhou, Ming / Duan, Nan / Ma, Shuai et al. | 2022
print version
76: Video Question Answering with Iterative Video-Text Co-tokenization
Piergiovanni, AJ / Morton, Kairo / Kuo, Weicheng / Ryoo, Michael S. / Angelova, Anelia et al. | 2022
print version
95: Rethinking Data Augmentation for Robust Visual Question Answering
Chen, Long / Zheng, Yuhang / Xiao, Jun et al. | 2022
print version
113: Explicit Image Caption Editing
Wang, Zhen / Chen, Long / Ma, Wenbo / Han, Guangxing / Niu, Yulei / Shao, Jian / Xiao, Jun et al. | 2022
print version
130: Can Shuffling Video Benefit Temporal Bias Problem: A Novel Training Framework for Temporal Grounding
Hao, Jiachang / Sun, Haifeng / Ren, Pengfei / Wang, Jingyu / Qi, Qi / Liao, Jianxin et al. | 2022
print version
148: Reliable Visual Question Answering: Abstain Rather Than Answer Incorrectly
Whitehead, Spencer / Petryk, Suzanne / Shakib, Vedaad / Gonzalez, Joseph / Darrell, Trevor / Rohrbach, Anna / Rohrbach, Marcus et al. | 2022
print version
167: GRIT: Faster and Better Image Captioning Transformer Using Dual Visual Features
Nguyen, Van-Quang / Suganuma, Masanori / Okatani, Takayuki et al. | 2022
print version
185: Selective Query-Guided Debiasing for Video Corpus Moment Retrieval
Yoon, Sunjae / Hong, Ji Woo / Yoon, Eunseop / Kim, Dahyun / Kim, Junyeong / Yoon, Hee Suk / Yoo, Chang D. et al. | 2022
print version
201: Spatial and Visual Perspective-Taking via View Rotation and Relation Reasoning for Embodied Reference Understanding
Shi, Cheng / Yang, Sibei et al. | 2022
print version
219: Object-Centric Unsupervised Image Captioning
Meng, Zihang / Yang, David / Cao, Xuefei / Shah, Ashish / Lim, Ser-Nam et al. | 2022
print version
236: Contrastive Vision-Language Pre-training with Limited Resources
Cui, Quan / Zhou, Boyan / Guo, Yu / Yin, Weidong / Wu, Hao / Yoshie, Osamu / Chen, Yubo et al. | 2022
print version
254: Learning Linguistic Association Towards Efficient Text-Video Retrieval
Fang, Sheng / Wang, Shuhui / Zhuo, Junbao / Han, Xinzhe / Huang, Qingming et al. | 2022
print version
271: ASSISTER: Assistive Navigation via Conditional Instruction Generation
Huang, Zanming / Shangguan, Zhongkai / Zhang, Jimuyang / Bar, Gilad / Boyd, Matthew / Ohn-Bar, Eshed et al. | 2022
print version
290: X-DETR: A Versatile Architecture for Instance-wise Vision-Language Tasks
Cai, Zhaowei / Kwon, Gukyeong / Ravichandran, Avinash / Bas, Erhan / Tu, Zhuowen / Bhotika, Rahul / Soatto, Stefano et al. | 2022
print version
309: Learning Disentanglement with Decoupled Labels for Vision-Language Navigation
Cheng, Wenhao / Dong, Xingping / Khan, Salman / Shen, Jianbing et al. | 2022
print version
330: Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input
Guo, Qingpei / Yao, Kaisheng / Chu, Wei et al. | 2022
print version
347: Word-Level Fine-Grained Story Visualization
Li, Bowen et al. | 2022
print version
363: Unifying Event Detection and Captioning as Sequence Generation via Pre-training
Zhang, Qi / Song, Yuqing / Jin, Qin et al. | 2022
print version
380: Multimodal Transformer with Variable-Length Memory for Vision-and-Language Navigation
Lin, Chuang / Jiang, Yi / Cai, Jianfei / Qu, Lizhen / Haffari, Gholamreza / Yuan, Zehuan et al. | 2022
print version
398: Fine-Grained Visual Entailment
Thomas, Christopher / Zhang, Yipeng / Chang, Shih-Fu et al. | 2022
print version
417: Bottom Up Top Down Detection Transformers for Language Grounding in Images and Point Clouds
Jain, Ayush / Gkanatsios, Nikolaos / Mediratta, Ishita / Fragkiadaki, Katerina et al. | 2022
print version
434: New Datasets and Models for Contextual Reasoning in Visual Dialog
Zhang, Yifeng / Jiang, Ming / Zhao, Qi et al. | 2022
print version
452: VisageSynTalk: Unseen Speaker Video-to-Speech Synthesis via Speech-Visage Feature Selection
Hong, Joanna / Kim, Minsu / Ro, Yong Man et al. | 2022
print version
469: Classification-Regression for Chart Comprehension
Levy, Matan / Ben-Ari, Rami / Lischinski, Dani et al. | 2022
print version
485: AssistQ: Affordance-Centric Question-Driven Task Completion for Egocentric Assistant
Wong, Benita / Chen, Joya / Wu, You / Lei, Stan Weixian / Mao, Dongxing / Gao, Difei / Shou, Mike Zheng et al. | 2022
print version
502: FindIt: Generalized Localization with Natural Language Queries
Kuo, Weicheng / Bertsch, Fred / Li, Wei / Piergiovanni, A. J. / Saffar, Mohammad / Angelova, Anelia et al. | 2022
print version
521: UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling
Yang, Zhengyuan / Gan, Zhe / Wang, Jianfeng / Hu, Xiaowei / Ahmed, Faisal / Liu, Zicheng / Lu, Yumao / Wang, Lijuan et al. | 2022
print version
540: Scaling Open-Vocabulary Image Segmentation with Image-Level Labels
Ghiasi, Golnaz / Gu, Xiuye / Cui, Yin / Lin, Tsung-Yi et al. | 2022
print version
558: The Abduction of Sherlock Holmes: A Dataset for Visual Abductive Reasoning
Hessel, Jack / Hwang, Jena D. / Park, Jae Sung / Zellers, Rowan / Bhagavatula, Chandra / Rohrbach, Anna / Saenko, Kate / Choi, Yejin et al. | 2022
print version
576: Speaker-Adaptive Lip Reading with User-Dependent Padding
Kim, Minsu / Kim, Hyunjun / Ro, Yong Man et al. | 2022
print version
594: TISE: Bag of Metrics for Text-to-Image Synthesis Evaluation
Dinh, Tan M. / Nguyen, Rang / Hua, Binh-Son et al. | 2022
print version
610: SemAug: Semantically Meaningful Image Augmentations for Object Detection Through Language Grounding
Heisler, Morgan / Banitalebi-Dehkordi, Amin / Zhang, Yong et al. | 2022
print version
627: Referring Object Manipulation of Natural Images with Conditional Classifier-Free Guidance
Choi, Myungsub et al. | 2022
print version
644: NewsStories: Illustrating Articles with Visual Summaries
Tan, Reuben / Plummer, Bryan A. / Saenko, Kate / Lewis, JP / Sud, Avneesh / Leung, Thomas et al. | 2022
print version
662: Webly Supervised Concept Expansion for General Purpose Vision Models
Kamath, Amita / Clark, Christopher / Gupta, Tanmay / Kolve, Eric / Hoiem, Derek / Kembhavi, Aniruddha et al. | 2022
print version
682: FedVLN: Privacy-Preserving Federated Vision-and-Language Navigation
Zhou, Kaiwen / Wang, Xin Eric et al. | 2022
print version
700: CODER: Coupled Diversity-Sensitive Momentum Contrastive Learning for Image-Text Retrieval
Wang, Haoran / He, Dongliang / Wu, Wenhao / Xia, Boyang / Yang, Min / Li, Fu / Yu, Yunlong / Ji, Zhong / Ding, Errui / Wang, Jingdong et al. | 2022
print version
717: Language-Driven Artistic Style Transfer
Fu, Tsu-Jui / Wang, Xin Eric / Wang, William Yang et al. | 2022
print version
735: Single-Stream Multi-level Alignment for Vision-Language Pretraining
Khan, Zaid / Vijay Kumar, B. G. / Yu, Xiang / Schulter, Samuel / Chandraker, Manmohan / Fu, Yun et al. | 2022
print version

How to get this title?

Local TIB services

Contain in:

RN 2835(13696)

Order copy

LUH Campus collection

TIB document delivery Purchase

Pricing information

Alternative Version

Electronic version available

Quicklinks

Borrowing & Ordering

Quicklinks

Search & discover

Quicklinks

Learning & working

Quicklinks

Publishing & Archiving

Quicklinks

About the TIB

Quicklinks

Research & Development

Unifying Event Detection and Captioning as Sequence Generation via Pre-training (English)

How to get this title?

Export, share and cite

More details on this result

Table of contents

Similar titles

How to get this title?

Export, share and cite