Compression memory

Compression memory

Определение

Compression memory — это техника управления контекстом диалогового агента, при которой старые сообщения не хранятся в исходном виде, а заменяются сгенерированной моделью краткой выжимкой (суммаризацией). Такой подход позволяет сохранить ключевую информацию из предыдущих витков беседы, не перегружая окно контекста. Compression memory часто используется в системах долговременной памяти для экономии токенов и улучшения релевантности ответов.

Где встречается

Навигация