benty-fields - Search paper

Interest in physical therapy and individual exercises such as yoga/dance has increased alongside the well-being trend. However, such exercises are hard to follow without expert guidance (which is impossible to scale for personalized feedback to every trainee remotely). Thus, automated pose correction systems are required more than ever, and we introduce a new captioning dataset named FixMyPose to address this need. We collect descriptions of correcting a "current" pose to look like a "target" pose (in both English and Hindi). The collected descriptions have interesting linguistic properties such as egocentric relations to environment objects, analogous references, etc., requiring an understanding of spatial relations and commonsense knowledge about postures. Further, to avoid ML biases, we maintain a balance across characters with diverse demographics, who perform a variety of movements in several interior environments (e.g., homes, offices). From our dataset, we introduce the pose-correctional-captioning task and its reverse target-pose-retrieval task. During the correctional-captioning task, models must generate descriptions of how to move from the current to target pose image, whereas in the retrieval task, models should select the correct target pose given the initial pose and correctional description. We present strong cross-attention baseline models (uni/multimodal, RL, multilingual) and also show that our baselines are competitive with other models when evaluated on other image-difference datasets. We also propose new task-specific metrics (object-match, body-part-match, direction-match) and conduct human evaluation for more reliable evaluation, and we demonstrate a large human-model performance gap suggesting room for promising future work. To verify the sim-to-real transfer of our FixMyPose dataset, we collect a set of real images and show promising performance on these images.
Authors' comments: AAAI 2021 (18 pages, 16 figures; webpage: https://fixmypose-unc.github.io/)

Vote

Add to Library

Recommend

4055. Instance-level Image Retrieval using Reranking Transformers

Fuwen Tan, Jiangbo Yuan, Vicente Ordonez

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.12236v3

Vote

Add to Library

Recommend

4056. MDMMT: Multidomain Multimodal Transformer for Video Retrieval

Maksim Dzabraev, Maksim Kalashnikov, Stepan Komkov, Aleksandr Petiushko

CVPR Workshops 2021: 3354-3363

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.10699v1

Vote

Add to Library

Recommend

4057. On Semantic Similarity in Video Retrieval

Michael Wray, Hazel Doughty, Dima Damen

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.10095v1

Vote

Add to Library

Recommend

4058. Weakly-Supervised Open-Retrieval Conversational Question Answering

Chen Qu, Liu Yang, Cen Chen, W. Bruce Croft, Kalpesh Krishna, Mohit Iyyer

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.02537v1

Vote

Add to Library

Recommend

4059. Scene Retrieval for Contextual Visual Mapping

William H. B. Smith, Michael Milford, Klaus D. McDonald-Maier, Shoaib Ehsan

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2102.12728v1

Vote

Add to Library

Recommend

4060. Retrieval Augmentation for Deep Neural Networks

Rita Parada Ramos, Patrícia Pereira, Helena Moniz, Joao Paulo Carvalho, Bruno Martins

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2102.13030v2

Vote

Add to Library

Recommend

Benty-search

4041. Deconfounded Video Moment Retrieval with Causal Intervention

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2106.01534v1

4042. Retrieval Enhanced Model for Commonsense Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.11174v1

4043. Multi-Frequency Phase Retrieval for Antenna Measurements

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.09928v2

4044. Towards Unsupervised Sketch-based Image Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.08237v4

4045. Chord Recognition- Music and Audio Information Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.07019v2

4046. Video Corpus Moment Retrieval with Contrastive Learning

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.06247v1

4047. Introducing Information Retrieval for Biomedical Informatics Students

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.02746v1

4048. Audio Retrieval with Natural Language Queries

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2105.02192v2

4049. Efficient Retrieval Optimized Multi-task Learning

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.10129v1

4050. Self-supervised Video Retrieval Transformer Network

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.07993v1

4051. Retrieval Augmentation Reduces Hallucination in Conversation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.07567v1

4052. Continual learning in cross-modal retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.06806v2

4053. A Replication Study of Dense Passage Retriever

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.05740v1

4054. FixMyPose: Pose Correctional Captioning and Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2104.01703v1

4055. Instance-level Image Retrieval using Reranking Transformers

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2103.12236v3

4056. MDMMT: Multidomain Multimodal Transformer for Video Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2103.10699v1

4057. On Semantic Similarity in Video Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2103.10095v1

4058. Weakly-Supervised Open-Retrieval Conversational Question Answering

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2103.02537v1

4059. Scene Retrieval for Contextual Visual Mapping

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2102.12728v1

4060. Retrieval Augmentation for Deep Neural Networks

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2102.13030v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2106.01534v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.11174v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.09928v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.08237v4

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.07019v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.06247v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.02746v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2105.02192v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.10129v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.07993v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.07567v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.06806v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.05740v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2104.01703v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.12236v3

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.10699v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.10095v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2103.02537v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2102.12728v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2102.13030v2