Поиск
- wikimemory compression
# memory compression ## Определение Механизм сжатия долговременной памяти агента, позволяющий хранить информацию из прошлых взаимодействий, не выходя за лимит контекстного окна…
- wikiCompression ratio
…Как работает memory compression для агентов (long-term memory)]] - [[800+ вопросов|800+ вопросов]] - [[189. Реализовать compression сообщений|189. Реализовать compression…
- wikiCompression
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikigzip compression
# gzip compression ## Определение Алгоритм сжатия данных без потерь, применяемый для уменьшения размера сообщений при передаче по сети. ## Где встречается - [[Практика…
- wikisemantic compression
# semantic compression ## Определение Использование специальных промптов для сжатия содержимого без потери смысла. ## Где встречается - [[181. В чем проблема «natural language…
- wikiKV cache compression
# KV cache compression ## Определение Методы уменьшения размера кэша ключей и значений (GQA, MQA, квантование, обрезание) для снижения потребления памяти и…
- wikiattention compression
# attention compression ## Определение Эффект, при котором агент забывает ранние шаги из-за ограничений механизма внимания на длинных горизонтах (более 10…
- wikiGradient compression
# Gradient compression ## Определение Метод уменьшения объёма данных, передаваемых между узлами при распределённом обучении, путём сжатия градиентов. ## Где встречается - [[623. Что…
- wikiInput compression
# Input compression ## Определение Сокращение длины промпта путём удаления стоп-слов или перефразирования для снижения задержки и затрат на инференс. ## Где…
- wikiKV-cache compression
# KV-cache compression ## Определение Метод сжатия KV-кэша для уменьшения потребления памяти при инференсе LLM. ## Где встречается - [[441. EAGLE-3…
- wikiSelective memory
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiscapy
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiContent-Encoding
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiWireshark
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiemulator
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiRTT
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikitcpdump
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikithread pool
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikidistributed AI system
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikitransport layer
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiPrompt compression
# Prompt compression ## Определение Техники уменьшения количества входных токенов промпта (например, LLMLingua, Selective Context) для снижения затрат и уменьшения задержки. ## Где…
- wikiToken efficiency
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] ## Навигация…
- wikiCRC32
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiHierarchical memory
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiZSTD
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать compression сообщений
…Реализовать compression сообщений ## 1. Цель задачи Разработать механизм сжатия ([[Вики/Compression\|compression]]) для больших сообщений (>1KB), которыми обмениваются [[Вики/AI…
- wikiEpisodic memory
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiVirtual contexts
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] ## Навигация…
- wikiConversationSummaryMemory
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] ## Навигация…
- wikimemory consolidation
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] ## Навигация…
- wikiMemGPT
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiсемантическая память
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikipsutil
…Реализовать compression сообщений|189. Реализовать compression сообщений]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiflake8
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[227. RAG с гибридным поиском|227. RAG с гибридным поиском]] - [[272. Настроить data…
- answerКак работает memory compression для агентов (long-term memory)?
…Compression ratio (коэффициент сжатия) **[[Вики/Compression ratio\|Compression ratio]]** = (размер исходного лога) / (размер сжатого представления). Для **[[Вики/summarization\|summarization]]** обычно…
- wikiPEP 8
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[190. Написать тесты для меж-агентской коммуникации|190. Написать тесты для меж-агентской…
- wikipushgateway
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[237. Агент с cost tracking|237. Агент с cost tracking]] - [[254. Реализовать SLO…
- wikiCounter
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[246. Агент с наблюдаемостью (OpenTelemetry)|246. Агент с наблюдаемостью (OpenTelemetry)]] - [[250. Полный production…
- wikistate summarization
# state summarization ## Определение Метод уменьшения нагрузки на память агента путём сжатия истории взаимодействий, чтобы избежать деградации на длинных горизонтах. ## Где…
- wikiRAPTOR
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiСжатие эмбеддингов
# Сжатие эмбеддингов ## Определение Уменьшение размерности эмбеддингов с минимальной потерей качества для экономии памяти векторной базы данных. ## Где встречается - [[15. Какие…
- wikiHistogram
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[238. RAG с incremental update|238. RAG с incremental update]] - [[246. Агент с…
- wikisummarization
…Как работает memory compression для агентов (long-term memory)|894. Как работает memory compression для агентов (long-term memory)]] - [[800…
- wikiinter-agent messages
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[198. Настроить multi-region active-passive|198. Настроить multi-region active-passive]] - [[217…
- wikicompressed memory
# compressed memory ## Определение Механизм памяти в Infini-attention, агрегирующий информацию из предыдущих сегментов через ассоциативное обновление и хранящий ключи/значения…
- answerКак вы реализуете KV cache для 1M токенов на 8x H100?
…Тогда применяют [[Вики/KV cache compression\|KV cache compression]]. --- ## 7. Метод 5: KV cache compression (H2O, SnapKV, StreamingLLM) Методы сжатия…
- wikiPrometheus client
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[196. Настроить backpressure в ingestion|196. Настроить backpressure в ingestion]] - [[202. Настроить health…
- wikiMiddleware
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[196. Настроить backpressure в ingestion|196. Настроить backpressure в ingestion]] - [[217. Реализовать streaming…
- wikiaiohttp
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[203. Реализовать retry storm mitigation|203. Реализовать retry storm mitigation]] - [[206. Развернуть vLLM…
- wikiLoad balancer
…Реализовать compression сообщений|189. Реализовать compression сообщений]] - [[195. Реализовать blue-green deployment для RAG|195. Реализовать blue-green deployment для…