benty-fields - Search paper

Robot learning is witnessing a significant increase in the size, diversity, and complexity of pre-collected datasets, mirroring trends in domains such as natural language processing and computer vision. Many robot learning methods treat such datasets as multi-task expert data and learn a multi-task, generalist policy by training broadly across them. Notably, while these generalist policies can improve the average performance across many tasks, the performance of generalist policies on any one task is often suboptimal due to negative transfer between partitions of the data, compared to task-specific specialist policies. In this work, we argue for the paradigm of training policies during deployment given the scenarios they encounter: rather than deploying pre-trained policies to unseen problems in a zero-shot manner, we non-parametrically retrieve and train models directly on relevant data at test time. Furthermore, we show that many robotics tasks share considerable amounts of low-level behaviors and that retrieval at the "sub"-trajectory granularity enables significantly improved data utilization, generalization, and robustness in adapting policies to novel problems. In contrast, existing full-trajectory retrieval methods tend to underutilize the data and miss out on shared cross-task content. This work proposes STRAP, a technique for leveraging pre-trained vision foundation models and dynamic time warping to retrieve sub-sequences of trajectories from large training corpora in a robust fashion. STRAP outperforms both prior retrieval algorithms and multi-task learning methods in simulated and real experiments, showing the ability to scale to much larger offline datasets in the real world as well as the ability to learn robust control policies with just a handful of real-world demonstrations.
Authors' comments: Project website at https://weirdlabuw.github.io/strap/

Vote

Add to Library

Recommend

5618. Dehallucinating Parallel Context Extension for Retrieval-Augmented Generation

Zexiong Ma, Shengnan An, Zeqi Lin, Yanzhen Zou, Jian-Guang Lou, Bing Xie

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14905v1

Vote

Add to Library

Recommend

5619. Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering

Peize Li, Qingyi Si, Peng Fu, Zheng Lin, Yan Wang

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14880v1

Vote

Add to Library

Recommend

5620. MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval

Junjie Zhou, Zheng Liu, Ze Liu, Shitao Xiao, Yueze Wang, Bo Zhao, Chen Jason Zhang, Defu Lian et al.

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14475v1

Vote

Add to Library

Recommend

Benty-search

5601. ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.19289v3

5602. Optimizing Multi-Stage Language Models for Effective Text Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.19265v1

5603. Improving Generated and Retrieved Knowledge Combination Through Zero-shot Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18800v1

5604. FOR: Finetuning for Object Level Open Vocabulary Image Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18806v1

5605. GeAR: Graph-enhanced Agent for Retrieval-augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18431v1

5606. On the Robustness of Generative Information Retrieval Models

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18768v1

5607. Efficient Long Context Language Model Retrieval with Compression

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18232v2

5608. Leveraging Memory Retrieval to Enhance LLM-based Generative Recommendation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.17593v1

5609. SyNeg: LLM-Driven Synthetic Hard-Negatives for Dense Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.17250v1

5610. COBRA: COmBinatorial Retrieval Augmentation for Few-Shot Adaptation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.17684v1

5611. A Reality Check on Context Utilisation for Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.17031v1

5612. GME: Improving Universal Multimodal Retrieval by Multimodal LLMs

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.16855v1

5613. Formal Language Knowledge Corpus for Retrieval Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.16689v1

5614. TimeRAG: BOOSTING LLM Time Series Forecasting via Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.16643v1

5615. Speech Retrieval-Augmented Generation without Automatic Speech Recognition

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.16500v2

5616. Know2Vec: A Black-Box Proxy for Neural Network Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.16251v1

5617. STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.15182v1

5618. Dehallucinating Parallel Context Extension for Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.14905v1

5619. Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.14880v1

5620. MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.14475v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.19289v3

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.19265v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18800v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18806v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18431v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18768v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18232v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.17593v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.17250v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.17684v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.17031v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.16855v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.16689v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.16643v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.16500v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.16251v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.15182v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14905v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14880v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.14475v1