Retrieval Augmented Generation
Retrieval Augmented Generation
Определение
Retrieval Augmented Generation (RAG) — это подход к построению генеративных моделей, при котором перед формированием ответа выполняется извлечение наиболее релевантных фрагментов из внешнего хранилища (например, базы знаний или истории диалога) и добавление их в контекст. Это позволяет модели опираться на актуальные и точные данные, а не только на свои внутренние параметры. В частности, при каждом новом запросе выполняются RAG-извлечение наиболее релевантных фрагментов истории, которые затем передаются модели вместе с запросом для генерации ответа.
Где встречается
- 912. Что такое TF-IDF и BM25? Почему BM25 до сих пор используется в гибридном поиске,
- 936. Как вы храните историю чата для long-term памяти агента (сжатие, суммаризация, векторная память)?