benty-fields - Search paper

5041. MonSTeR: a Unified Model for Motion, Scene, Text Retrieval

Luca Collorone, Matteo Gioia, Massimiliano Pappa, Paolo Leoni, Giovanni Ficarra, Or Litany, Indro Spinelli, Fabio Galasso

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.03200v1

Vote

Add to Library

Recommend

5042. Transport of Event Equation: Phase Retrieval from Defocus Events

Kaito Hori, Chihiro Tsutake, Keita Takahashi, Toshiaki Fujii

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02989v1

Vote

Add to Library

Recommend

5043. External Data Extraction Attacks against Retrieval-Augmented Large Language Models

Yu He, Yifei Chen, Yiming Li, Shuo Shao, Leyi Qi, Boheng Li, Dacheng Tao, Zhan Qin

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02964v1

In recent years, RAG has emerged as a key paradigm for enhancing large language models (LLMs). By integrating externally retrieved information, RAG alleviates issues like outdated knowledge and, crucially, insufficient domain expertise. While effective, RAG introduces new risks of external data extraction attacks (EDEAs), where sensitive or copyrighted data in its knowledge base may be extracted verbatim. These risks are particularly acute when RAG is used to customize specialized LLM applications with private knowledge bases. Despite initial studies exploring these risks, they often lack a formalized framework, robust attack performance, and comprehensive evaluation, leaving critical questions about real-world EDEA feasibility unanswered. In this paper, we present the first comprehensive study to formalize EDEAs against retrieval-augmented LLMs. We first formally define EDEAs and propose a unified framework decomposing their design into three components: extraction instruction, jailbreak operator, and retrieval trigger, under which prior attacks can be considered instances within our framework. Guided by this framework, we develop SECRET: a Scalable and EffeCtive exteRnal data Extraction aTtack. Specifically, SECRET incorporates (1) an adaptive optimization process using LLMs as optimizers to generate specialized jailbreak prompts for EDEAs, and (2) cluster-focused triggering, an adaptive strategy that alternates between global exploration and local exploitation to efficiently generate effective retrieval triggers. Extensive evaluations across 4 models reveal that SECRET significantly outperforms previous attacks, and is highly effective against all 16 tested RAG instances. Notably, SECRET successfully extracts 35% of the data from RAG powered by Claude 3.7 Sonnet for the first time, whereas other attacks yield 0% extraction. Our findings call for attention to this emerging threat.

Vote

Add to Library

Recommend

5044. Understanding Retrieval Augmentation for Long-Form Question Answering

Hung-Ting Chen, Fangyuan Xu, Shane Arora, Eunsol Choi

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2310.12150v2

Vote

Add to Library

Recommend

5045. Study on LLMs for Promptagator-Style Dense Retriever Training

Daniel Gwon, Nour Jedidi, Jimmy Lin

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02241v1

Vote

Add to Library

Recommend

5046. Contrastive Retrieval Heads Improve Attention-Based Re-Ranking

Linh Tran, Yulong Li, Radu Florian, Wei Sun

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02219v1

Vote

Add to Library

Recommend

5047. Cluster-based Adaptive Retrieval: Dynamic Context Selection for RAG Applications

Yifan Xu, Vipul Gupta, Rohit Aggarwal, Varsha Mahadevan, Bhaskar Krishnamachari

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2511.14769v1

Vote

Add to Library

Recommend

5048. Milco: Learned Sparse Retrieval Across Languages via a Multilingual Connector

Thong Nguyen, Yibin Lei, Jia-Huei Ju, Eugene Yang, Andrew Yates

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.00671v1

Vote

Add to Library

Recommend

5049. Retrieval-Augmented Framework for LLM-Based Clinical Decision Support

Leon Garza, Anantaa Kotal, Michael A. Grasso, Emre Umucu

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.01363v1

Vote

Add to Library

Recommend

5050. Optimizing What Matters: AUC-Driven Learning for Robust Neural Retrieval

Nima Sheikholeslami, Erfan Hosseini, Patrice Bechard, Srivatsava Daruru, Sai Rajeswar

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.00137v1

Vote

Add to Library

Recommend

5051. RAGferee: Building Contextual Reward Models for Retrieval-Augmented Generation

Andrei C. Coman, Ionut-Teodor Sorodoc, Leonardo F. R. Ribeiro, Bill Byrne, James Henderson, Adrià de Gispert

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.26011v1

Vote

Add to Library

Recommend

5052. ReTAG: Retrieval-Enhanced, Topic-Augmented Graph-Based Global Sensemaking

Boyoung Kim, Dosung Lee, Sumin An, Jinseong Jeong, Paul Hongsuck Seo

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25814v1

Vote

Add to Library

Recommend

5053. DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation

Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25716v1

Vote

Add to Library

Recommend

5054. Retro: Optimizing LLMs for Reasoning-Intensive Document Retrieval*

Junwei Lan, Jianlyu Chen, Zheng Liu, Chaofan Li, Siqi Bao, Defu Lian

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.24869v1

Vote

Add to Library

Recommend

5055. Investigating Multi-layer Representations for Dense Passage Retrieval

Zhongbin Xie, Thomas Lukasiewicz

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23861v1

Vote

Add to Library

Recommend

5056. Retrieval-Constrained Decoding Reveals Underestimated Parametric Knowledge in Language Models

Rajaa El Hamdani, Samy Haffoudhi, Nils Holzenberger, Fabian Suchanek, Thomas Bonald, Fragkiskos D. Malliaros

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23417v1

Vote

Add to Library

Recommend

5057. GRAPE: Let GPRO Supervise Query Rewriting by Ranking for Retrieval

Zhaohua Zhang, Jianhuan Zhuo, Muxi Chen, Chenchen Zhao, Wenyu Jiang, Tianwen Jiang, Mingyang Chen, Yu Tang et al.

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23370v1

Vote

Add to Library

Recommend

5058. Your Dense Retriever is Secretly an Expeditious Reasoner

Yichi Zhang, Jun Bai, Zhixin Cai, Shuhan Qin, Zhuofan Chen, Jinghua Guan, Wenge Rong

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.21727v1

Vote

Add to Library

Recommend

5059. RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval

Pratik Shah, Rajat Ghosh, Aryan Singhal, Debojyoti Dutta

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25257v1

Vote

Add to Library

Recommend

5060. PRIME: Planning and Retrieval-Integrated Memory for Enhanced Reasoning

Hieu Tran, Zonghai Yao, Nguyen Luong Tran, Zhichao Yang, Feiyun Ouyang, Shuo Han, Razieh Rahimi, Hong Yu

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.22315v1

Vote

Add to Library

Recommend

Benty-search

5041. MonSTeR: a Unified Model for Motion, Scene, Text Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.03200v1

5042. Transport of Event Equation: Phase Retrieval from Defocus Events

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.02989v1

5043. External Data Extraction Attacks against Retrieval-Augmented Large Language Models

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.02964v1

5044. Understanding Retrieval Augmentation for Long-Form Question Answering

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2310.12150v2

5045. Study on LLMs for Promptagator-Style Dense Retriever Training

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.02241v1

5046. Contrastive Retrieval Heads Improve Attention-Based Re-Ranking

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.02219v1

5047. Cluster-based Adaptive Retrieval: Dynamic Context Selection for RAG Applications

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2511.14769v1

5048. Milco: Learned Sparse Retrieval Across Languages via a Multilingual Connector

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.00671v1

5049. Retrieval-Augmented Framework for LLM-Based Clinical Decision Support

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.01363v1

5050. Optimizing What Matters: AUC-Driven Learning for Robust Neural Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.00137v1

5051. RAGferee: Building Contextual Reward Models for Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.26011v1

5052. ReTAG: Retrieval-Enhanced, Topic-Augmented Graph-Based Global Sensemaking

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.25814v1

5053. DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.25716v1

5054. Retro*: Optimizing LLMs for Reasoning-Intensive Document Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.24869v1

5055. Investigating Multi-layer Representations for Dense Passage Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.23861v1

5056. Retrieval-Constrained Decoding Reveals Underestimated Parametric Knowledge in Language Models

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.23417v1

5057. GRAPE: Let GPRO Supervise Query Rewriting by Ranking for Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.23370v1

5058. Your Dense Retriever is Secretly an Expeditious Reasoner

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2510.21727v1

5059. RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.25257v1

5060. PRIME: Planning and Retrieval-Integrated Memory for Enhanced Reasoning

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2509.22315v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.03200v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02989v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02964v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2310.12150v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02241v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.02219v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2511.14769v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.00671v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.01363v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.00137v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.26011v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25814v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25716v1

5054. Retro: Optimizing LLMs for Reasoning-Intensive Document Retrieval*

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.24869v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23861v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23417v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.23370v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2510.21727v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.25257v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2509.22315v1