Prompt compression

Определение

Техники уменьшения количества входных токенов промпта (например, LLMLingua, Selective Context) для снижения затрат и уменьшения задержки.