Поиск
- wikiСобытийная архитектура
# Событийная архитектура ## Определение Архитектурный стиль, в котором компоненты системы асинхронно реагируют на события (например, через Kafka), обеспечивая real-time обработку…
- wikiHorizontal Pod Autoscaler
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiRediSearch
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiHAProxy
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiEKS
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiAudio RAG
# Audio RAG ## Определение Архитектура RAG, адаптированная для обработки аудиоданных: аудио транскрибируется в текст, который индексируется и используется для поиска с…
- wikiMulti-agent RAG
# Multi-agent RAG ## Определение Децентрализованная система RAG, где несколько retrieval-агентов взаимодействуют для поиска и агрегации информации, однако такая архитектура…
- wikiLlama-3-70B
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikimasked language modeling
…Как LLM применяются для protein folding (AlphaFold 3, ESM3) Архитектура и отличия]] - [[279. Настроить adversarial evaluation для RAG|279. Настроить…
- wikiMulti-region deployment
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiTerraform
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiRewrite-Retrieve-Read
# Rewrite-Retrieve-Read ## Определение Архитектура RAG, включающая этапы переписывания запроса, поиска документов и чтения для генерации ответа. ## Где встречается - [[374…
- wikiSpark Structured Streaming
# Spark Structured Streaming ## Определение Модуль Spark для обработки потоковых данных в real-time, используемый в архитектурах real-time RAG. ## Где…
- wikimulti-tenant RAG
# multi-tenant RAG ## Определение Архитектура RAG, обслуживающая несколько клиентов с полной изоляцией данных. Обязательна фильтрация по tenant_id при поиске…
- wikiGlobal load balancer
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiCRNN
# CRNN ## Определение Архитектура нейронной сети, комбинирующая свёрточные и рекуррентные слои, применяемая в OCR для распознавания текста. ## Где встречается - [[550. Как…
- wikiMulti-vector index
# Multi-vector index ## Определение Архитектура индексации, где эмбеддинги разных модальностей (аудио, видео) хранятся в отдельных индексах с меткой модальности. Позволяет…
- wikiShadow mode
…для RAG системы с zero downtime]] - [[399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs…
- wikiSemantic Caching
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiQueue length
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiself-healing pipeline
# self-healing pipeline ## Определение Архитектура пайплайна, включающая мониторинг, оценку и автоматическое восстановление, например, переключение на fallback-схему при обнаружении дрейфа…
- wikiMemory Networks
# Memory Networks ## Определение Архитектура нейронных сетей с явным модулем долговременной памяти и механизмом внимания для чтения и записи. Альтернатива RAG…
- wikiTimeSformer
# TimeSformer ## Определение Архитектура vision transformer для видео, разделяющая attention на пространственный (внутри кадра) и временной (между кадрами). ## Где встречается - [[549…
- wikiDETR
# DETR ## Определение Архитектура детекции объектов на основе Transformer, используемая в Table Transformer и grounding. ## Где встречается - [[542. Как вы парсите…
- wikiрандомизация
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiPrometheus
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiTinyLlama
…Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[289. Как работает…
- wikiMicroservice architecture
…registry|186. Настроить message schema registry]] - [[247. RAG с distributed tracing|247. RAG с distributed tracing]] - [[263. Реализовать автоматический postmortem…
- wikiRedis
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiprefix caching
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiselective pruning
…Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[216. Как вы…
- wikiVLLM
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiGrafana
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiLatency
…В чем разница между Naive RAG, Adaptive RAG и Agentic RAG|141. В чем разница между Naive RAG, Adaptive RAG…
- wikiHNSW
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- answerКак вы обновляете документы в существующей RAG-системе?
…Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой\|1]] | RAG архитектура (индексация документов) | | [[4. Какую…
- wikiViT
# ViT ## Определение Архитектура нейронной сети на основе Transformer для обработки изображений. Используется в качестве vision encoder в моделях GPT-4V…
- answerNVIDIA Grace Hopper: CPU-GPU unified memory, как это меняет LLM serving?
…Архитектура Agentic RAG: как спроектировать систему с агентами?\|708]] | Общая архитектура agentic RAG, где GH200 упрощает инфраструктуру | | [[710. Как управлять…
- wikiGPU utilization
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiмультимодальный RAG
# мультимодальный RAG ## Определение Архитектура RAG, объединяющая текстовые и визуальные эмбеддинги для поиска и генерации ответов по данным разных типов (текст…
- wikimulti-tenant
# multi-tenant ## Определение Архитектура, при которой одна инстанция ПО обслуживает несколько логических клиентов (тенантов). Каждому тенанту может выделяться гарантированная доля…
- wikithroughput
…Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[201. Что такое…
- wikiBi-encoder
# Bi-encoder ## Определение Архитектура с двумя независимыми кодировщиками (для запроса и документа), сворачивающими вход в один вектор, что обеспечивает быстрый…
- wikiPaged Attention
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikibatch size
…Как вы обновляете документы в существующей RAG-системе|9. Как вы обновляете документы в существующей RAG-системе]] - [[13. Как вы…
- wikicontinuous batching
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikiLocust
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…
- wikitarget model
…Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[212. Как работает…
- wikiSuccess rate
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[393. Как вы…
- answerЧто такое Self-RAG и когда его использовать?
…Как работает Self-RAG (архитектура) ### 2.1 Обучение Self-RAG [[Вики/Self-RAG\|Self-RAG]] требует специального обучения ([[Вики/fine…