Поиск

  • wikiСобытийная архитектура

    # Событийная архитектура ## Определение Архитектурный стиль, в котором компоненты системы асинхронно реагируют на события (например, через Kafka), обеспечивая real-time обработку…

  • wikiHorizontal Pod Autoscaler

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiRediSearch

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiHAProxy

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiEKS

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiAudio RAG

    # Audio RAG ## Определение Архитектура RAG, адаптированная для обработки аудиоданных: аудио транскрибируется в текст, который индексируется и используется для поиска с…

  • wikiMulti-agent RAG

    # Multi-agent RAG ## Определение Децентрализованная система RAG, где несколько retrieval-агентов взаимодействуют для поиска и агрегации информации, однако такая архитектура

  • wikiLlama-3-70B

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikimasked language modeling

    …Как LLM применяются для protein folding (AlphaFold 3, ESM3) Архитектура и отличия]] - [[279. Настроить adversarial evaluation для RAG|279. Настроить…

  • wikiMulti-region deployment

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiTerraform

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiRewrite-Retrieve-Read

    # Rewrite-Retrieve-Read ## Определение Архитектура RAG, включающая этапы переписывания запроса, поиска документов и чтения для генерации ответа. ## Где встречается - [[374…

  • wikiSpark Structured Streaming

    # Spark Structured Streaming ## Определение Модуль Spark для обработки потоковых данных в real-time, используемый в архитектурах real-time RAG. ## Где…

  • wikimulti-tenant RAG

    # multi-tenant RAG ## Определение Архитектура RAG, обслуживающая несколько клиентов с полной изоляцией данных. Обязательна фильтрация по tenant_id при поиске…

  • wikiGlobal load balancer

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiCRNN

    # CRNN ## Определение Архитектура нейронной сети, комбинирующая свёрточные и рекуррентные слои, применяемая в OCR для распознавания текста. ## Где встречается - [[550. Как…

  • wikiMulti-vector index

    # Multi-vector index ## Определение Архитектура индексации, где эмбеддинги разных модальностей (аудио, видео) хранятся в отдельных индексах с меткой модальности. Позволяет…

  • wikiShadow mode

    …для RAG системы с zero downtime]] - [[399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs…

  • wikiSemantic Caching

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiQueue length

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiself-healing pipeline

    # self-healing pipeline ## Определение Архитектура пайплайна, включающая мониторинг, оценку и автоматическое восстановление, например, переключение на fallback-схему при обнаружении дрейфа…

  • wikiMemory Networks

    # Memory Networks ## Определение Архитектура нейронных сетей с явным модулем долговременной памяти и механизмом внимания для чтения и записи. Альтернатива RAG

  • wikiTimeSformer

    # TimeSformer ## Определение Архитектура vision transformer для видео, разделяющая attention на пространственный (внутри кадра) и временной (между кадрами). ## Где встречается - [[549…

  • wikiDETR

    # DETR ## Определение Архитектура детекции объектов на основе Transformer, используемая в Table Transformer и grounding. ## Где встречается - [[542. Как вы парсите…

  • wikiрандомизация

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiPrometheus

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiTinyLlama

    …Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[289. Как работает…

  • wikiMicroservice architecture

    …registry|186. Настроить message schema registry]] - [[247. RAG с distributed tracing|247. RAG с distributed tracing]] - [[263. Реализовать автоматический postmortem…

  • wikiRedis

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiprefix caching

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiselective pruning

    …Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[216. Как вы…

  • wikiVLLM

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiGrafana

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiLatency

    …В чем разница между Naive RAG, Adaptive RAG и Agentic RAG|141. В чем разница между Naive RAG, Adaptive RAG

  • wikiHNSW

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • answerКак вы обновляете документы в существующей RAG-системе?

    …Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой\|1]] | RAG архитектура (индексация документов) | | [[4. Какую…

  • wikiViT

    # ViT ## Определение Архитектура нейронной сети на основе Transformer для обработки изображений. Используется в качестве vision encoder в моделях GPT-4V…

  • answerNVIDIA Grace Hopper: CPU-GPU unified memory, как это меняет LLM serving?

    Архитектура Agentic RAG: как спроектировать систему с агентами?\|708]] | Общая архитектура agentic RAG, где GH200 упрощает инфраструктуру | | [[710. Как управлять…

  • wikiGPU utilization

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiмультимодальный RAG

    # мультимодальный RAG ## Определение Архитектура RAG, объединяющая текстовые и визуальные эмбеддинги для поиска и генерации ответов по данным разных типов (текст…

  • wikimulti-tenant

    # multi-tenant ## Определение Архитектура, при которой одна инстанция ПО обслуживает несколько логических клиентов (тенантов). Каждому тенанту может выделяться гарантированная доля…

  • wikithroughput

    …Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[201. Что такое…

  • wikiBi-encoder

    # Bi-encoder ## Определение Архитектура с двумя независимыми кодировщиками (для запроса и документа), сворачивающими вход в один вектор, что обеспечивает быстрый…

  • wikiPaged Attention

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikibatch size

    …Как вы обновляете документы в существующей RAG-системе|9. Как вы обновляете документы в существующей RAG-системе]] - [[13. Как вы…

  • wikicontinuous batching

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikiLocust

    …Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.|403. Как вы проектируете RAG для 10k RPS…

  • wikitarget model

    …Какие trade-offs между разными архитектурами speculative decoding|164. Какие trade-offs между разными архитектурами speculative decoding]] - [[212. Как работает…

  • wikiSuccess rate

    …Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[393. Как вы…

  • answerЧто такое Self-RAG и когда его использовать?

    …Как работает Self-RAG (архитектура) ### 2.1 Обучение Self-RAG [[Вики/Self-RAG\|Self-RAG]] требует специального обучения ([[Вики/fine…