benty-fields - Search paper

In book search, relevant book information should be returned in response to a query. Books contain complex, multi-faceted information such as metadata, outlines, and main text, where the outline provides hierarchical information between chapters and sections. Generative retrieval (GR) is a new retrieval paradigm that consolidates corpus information into a single model to generate identifiers of documents that are relevant to a given query. How can GR be applied to book search? Directly applying GR to book search is a challenge due to the unique characteristics of book search: The model needs to retain the complex, multi-faceted information of the book, which increases the demand for labeled data. Splitting book information and treating it as a collection of separate segments for learning might result in a loss of hierarchical information. We propose an effective Generative retrieval framework for Book Search (GBS) that features two main components: data augmentation and outline-oriented book encoding. For data augmentation, GBS constructs multiple query-book pairs for training; it constructs multiple book identifiers based on the outline, various forms of book contents, and simulates real book retrieval scenarios with varied pseudo-queries. This includes coverage-promoting book identifier augmentation, allowing the model to learn to index effectively, and diversity-enhanced query augmentation, allowing the model to learn to retrieve effectively. Outline-oriented book encoding improves length extrapolation through bi-level positional encoding and retentive attention mechanisms to maintain context over long sequences. Experiments on a proprietary Baidu dataset demonstrate that GBS outperforms strong baselines, achieving a 9.8\% improvement in terms of MRR@20, over the state-of-the-art RIPOR method...
Authors' comments: Accepted at KDD ADS 2025

Vote

Add to Library

Recommend

3276. RaSeRec: Retrieval-Augmented Sequential Recommendation

Xinping Zhao, Baotian Hu, Yan Zhong, Shouzheng Huang, Zihao Zheng, Meng Wang, Haofen Wang, Min Zhang

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18378v2

Vote

Add to Library

Recommend

3277. Retrieval Augmented Time Series Forecasting

Kutay Tire, Ege Onur Taga, Muhammed Emrullah Ildiz, Samet Oymak

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2411.08249v1

Vote

Add to Library

Recommend

3278. Retrieval-Enhanced Named Entity Recognition

Enzo Shiraishi, Raphael Y. de Camargo, Henrique L. P. Silva, Ronaldo C. Prati

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.13118v1

Vote

Add to Library

Recommend

3279. Phase retrieval via media diversity

Yan Cheng, Kui Ren, Nathan Soedjak

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.12767v2

Vote

Add to Library

Recommend

3280. Performance Evaluation in Multimedia Retrieval

Loris Sauter, Ralph Gasser, Heiko Schuldt, Abraham Bernstein, Luca Rossetto

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.06654v1

Vote

Add to Library

Recommend

Benty-search

3261. Retrieval Augmented Comic Image Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2506.12517v1

3262. Graph-Embedding Empowered Entity Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2506.03895v1

3263. QuARI: Query Adaptive Retrieval Improvement

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2505.21647v1

3264. MIRB: Mathematical Information Retrieval Benchmark

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2505.15585v1

3265. Retrieval Augmented Time Series Forecasting

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2505.04163v1

3266. Causal Retrieval with Semantic Consideration

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.04700v1

3267. CoRAG: Collaborative Retrieval-Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.01883v1

3268. Information Retrieval for Climate Impact

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2504.01162v1

3269. RARE: Retrieval-Augmented Reasoning Modeling

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.23513v1

3270. RASD: Retrieval-Augmented Speculative Decoding

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.03434v1

3271. Hierarchical Re-ranker Retriever (HRR)

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2503.02401v1

3272. Towards Text-Image Interleaved Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2502.12799v1

3273. Hypencoder: Hypernetworks for Information Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2502.05364v2

3274. Chain-of-Retrieval Augmented Generation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2501.14342v1

3275. Generative Retrieval for Book search

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2501.11034v1

3276. RaSeRec: Retrieval-Augmented Sequential Recommendation

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2412.18378v2

3277. Retrieval Augmented Time Series Forecasting

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2411.08249v1

3278. Retrieval-Enhanced Named Entity Recognition

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2410.13118v1

3279. Phase retrieval via media diversity

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2410.12767v2

3280. Performance Evaluation in Multimedia Retrieval

Show abstract | Show figures | Show BibTeX | Show discussion 0 | View PDF | 2410.06654v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2506.12517v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2506.03895v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2505.21647v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2505.15585v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2505.04163v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.04700v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01883v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2504.01162v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.23513v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.03434v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2503.02401v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2502.12799v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2502.05364v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2501.14342v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2501.11034v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2412.18378v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2411.08249v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.13118v1

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.12767v2

Show abstract | Show figures | Show BibTeX | Show discussion | View PDF | 2410.06654v1