benty-fields - Search paper

Large language model (LLM) agents are increasingly employing retrieval-augmented generation (RAG) to improve the factuality of their responses. However, in practice, these systems often need to handle ambiguous user queries and potentially conflicting information from multiple sources while also suppressing inaccurate information from noisy or irrelevant documents. Prior work has generally studied and addressed these challenges in isolation, considering only one aspect at a time, such as handling ambiguity or robustness to noise and misinformation. We instead consider multiple factors simultaneously, proposing (i) RAMDocs (Retrieval with Ambiguity and Misinformation in Documents), a new dataset that simulates complex and realistic scenarios for conflicting evidence for a user query, including ambiguity, misinformation, and noise; and (ii) MADAM-RAG, a multi-agent approach in which LLM agents debate over the merits of an answer over multiple rounds, allowing an aggregator to collate responses corresponding to disambiguated entities while discarding misinformation and noise, thereby handling diverse sources of conflict jointly. We demonstrate the effectiveness of MADAM-RAG using both closed and open-source models on AmbigDocs -- which requires presenting all valid answers for ambiguous queries -- improving over strong RAG baselines by up to 11.40% and on FaithEval -- which requires suppressing misinformation -- where we improve by up to 15.80% (absolute) with Llama3.3-70B-Instruct. Furthermore, we find that RAMDocs poses a challenge for existing RAG baselines (Llama3.3-70B-Instruct only obtains 32.60 exact match score). While MADAM-RAG begins to address these conflicting factors, our analysis indicates that a substantial gap remains especially when increasing the level of imbalance in supporting evidence and misinformation.
Authors' comments: Our data and code is available at: https://github.com/HanNight/RAMDocs

Vote

Add to Library

Recommend

3606. TMCIR: Token Merge Benefits Composed Image Retrieval

Chaoyang Wang, Zeyu Zhang, Long Teng, Zijun Li, Shichao Kan

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.10995v1

Vote

Add to Library

Recommend

3607. Benchmarking Biopharmaceuticals Retrieval-Augmented Generation Evaluation

Hanmeng Zhong, Linqing Chen, Weilei Wang, Wentao Wu

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.12342v1

Vote

Add to Library

Recommend

3608. Practical Poisoning Attacks against Retrieval-Augmented Generation

Baolei Zhang, Yuxi Chen, Minghong Fang, Zhuqing Liu, Lihai Nie, Tong Li, Zheli Liu

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.03957v1

Vote

Add to Library

Recommend

3609. Authenticated Sublinear Quantum Private Information Retrieval

Fengxia Liu, Zhiyong Zheng, Kun Tian, Yi Zhang, Heng Guo, Zhe Hu, Oleksiy Zhedanov, Zixian Gong

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.04041v2

Vote

Add to Library

Recommend

3610. Efficient Constant-Space Multi-Vector Retrieval

Sean MacAvaney, Antonio Mallia, Nicola Tonellotto

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01818v1

Vote

Add to Library

Recommend

3611. LRAGE: Legal Retrieval Augmented Generation Evaluation Tool

Minhu Park, Hongseok Oh, Eunkyung Choi, Wonseok Hwang

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01840v2

Vote

Add to Library

Recommend

3612. Sign retrieval in spaces of variable bandwidth

Philippe Jaming, Rolando Perez Iii

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.22443v1

Vote

Add to Library

Recommend

3613. Context-Efficient Retrieval with Factual Decomposition

Yanhong Li, David Yunis, David McAllester, Jiawei Zhou

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.19574v1

Vote

Add to Library

Recommend

3614. EqualizeIR: Mitigating Linguistic Biases in Retrieval Models

Jiali Cheng, Hadi Amiri

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.07115v1

Vote

Add to Library

Recommend

3615. Dense Passage Retrieval in Conversational Search

Ahmed H. Salamah, Pierre McWhannel, Nicole Yan

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.17507v1

Vote

Add to Library

Recommend

3616. Retrieval-Augmented Generation with Hierarchical Knowledge

Haoyu Huang, Yongfeng Huang, Junjie Yang, Zhenyu Pan, Yongqiang Chen, Kaili Ma, Hongzhi Chen, James Cheng

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.10150v1

Vote

Add to Library

Recommend

3617. StableFusion: Continual Video Retrieval via Frame Adaptation

Zecheng Zhao, Zhi Chen, Zi Huang, Shazia Sadiq, Tong Chen

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.10111v1

Vote

Add to Library

Recommend

3618. Representation Retrieval Learning for Heterogeneous Data Integration

Qi Xu, Annie Qu

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09494v1

Vote

Add to Library

Recommend

3619. Revisiting Medical Image Retrieval via Knowledge Consolidation

Yang Nan, Huichi Zhou, Xiaodan Xing, Giorgos Papanastasiou, Lei Zhu, Zhifan Gao, Alejandro F Fangi, Guang Yang

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09370v1

Vote

Add to Library

Recommend

3620. Considering Length Diversity in Retrieval-Augmented Summarization

Juseon-Do, Jaesung Hwang, Jingun Kwon, Hidetaka Kamigaito, Manabu Okumura

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09249v1

Vote

Add to Library

Recommend

Benty-search

3601. Retrieval Augmented Generation Evaluation for Health Documents

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2505.04680v1

3602. A Reasoning-Focused Legal Retrieval Benchmark

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2505.03970v1

3603. ReasonIR: Training Retrievers for Reasoning Tasks

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.20595v1

3604. Leveraging Decoder Architectures for Learned Sparse Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.18151v1

3605. Retrieval-Augmented Generation with Conflicting Evidence

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.13079v1

3606. TMCIR: Token Merge Benefits Composed Image Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.10995v1

3607. Benchmarking Biopharmaceuticals Retrieval-Augmented Generation Evaluation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.12342v1

3608. Practical Poisoning Attacks against Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.03957v1

3609. Authenticated Sublinear Quantum Private Information Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.04041v2

3610. Efficient Constant-Space Multi-Vector Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.01818v1

3611. LRAGE: Legal Retrieval Augmented Generation Evaluation Tool

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.01840v2

3612. Sign retrieval in spaces of variable bandwidth

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.22443v1

3613. Context-Efficient Retrieval with Factual Decomposition

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.19574v1

3614. EqualizeIR: Mitigating Linguistic Biases in Retrieval Models

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.07115v1

3615. Dense Passage Retrieval in Conversational Search

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.17507v1

3616. Retrieval-Augmented Generation with Hierarchical Knowledge

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.10150v1

3617. StableFusion: Continual Video Retrieval via Frame Adaptation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.10111v1

3618. Representation Retrieval Learning for Heterogeneous Data Integration

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.09494v1

3619. Revisiting Medical Image Retrieval via Knowledge Consolidation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.09370v1

3620. Considering Length Diversity in Retrieval-Augmented Summarization

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.09249v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2505.04680v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2505.03970v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.20595v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.18151v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.13079v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.10995v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.12342v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.03957v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.04041v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01818v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01840v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.22443v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.19574v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.07115v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.17507v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.10150v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.10111v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09494v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09370v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.09249v1