Поиск

wikiLLM pipeline
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[800+ вопросов|800+ вопросов]] - [[248…
wikiпайплайн
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне]] - [[305. Как вы профилируете GPU utilization для LLM serving (nsys…
wikiStorage costs
# Storage costs ## Определение Расходы, связанные с хранением данных (векторных индексов, кэша, логов), которые влияют на общую стоимость эксплуатации LLM-пайплайна…
wikiper-feature cost breakdown
# per-feature cost breakdown ## Определение Разбивка затрат на выполнение каждого компонента LLM-пайплайна, например, retrieval, генерация, постобработка, для оценки cost…
wikiVector indexes
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiClaude 3 Haiku
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikigRPC RESOURCE_EXHAUSTED
…Что такое end-to-end backpressure в LLM пайплайне и как его реализовать|429. Что такое end-to-end backpressure…
wikiCost per good answer
# Cost per good answer ## Определение Метрика cost-effectiveness LLM-пайплайна: отношение общих затрат на LLM к количеству ответов с faithfulness…
wikiSLO
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[532. Что такое data contract…
wikiGreat Expectations
…Как реализовать onlineoffline feature consistency для LLM]] - [[861. Как проектировать data contracts для RAG пайплайна|861. Как проектировать data contracts…
wikiPrompt compression
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[219. Что такое prompt caching…
wikiAPI costs
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiLatency costs
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiexact match caching
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiLatency p50/p95
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiData pipeline
# Data pipeline ## Определение Пайплайн обработки данных для RAG, включающий этапы сбора, очистки, обновления и подачи в базу знаний. ## Где встречается…
wikiHuman evaluation costs
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikidynamic context
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiPagerDuty
…queue для failed LLM инференс запросов]] - [[273. Как вы обрабатываете corrupted или empty документы в ingestion пайплайне|273. Как вы…
wikiCompute costs
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiSelective Context
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
wikiBoundedSemaphore
…Что такое end-to-end backpressure в LLM пайплайне и как его реализовать|429. Что такое end-to-end backpressure…
wikiSelf-hosted models
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
wikiDead Letter Queue
…Как вы делаете асинхронную обработку long-running (30s) LLM задач]] - [[256. Как вы проектируете ETL пайплайн для 1M документовдень в…
wikiQoS
…Что такое end-to-end backpressure в LLM пайплайне и как его реализовать|429. Что такое end-to-end backpressure…
wikiLLMLingua
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[219. Что такое prompt caching…
answerКак вы оцениваете cost-effectiveness LLM-пайплайна?
…Как вы оцениваете cost-effectiveness LLM-пайплайна? ## Краткий тезис [[Вики/Efficiency\|Cost-effectiveness]] LLM-пайплайна — это отношение полученного качества ([[Вики…
wikiNLI model
…Как вы организуете CICD для RAG-пайплайна|69. Как вы организуете CICD для RAG-пайплайна]] - [[133. Альтернативы LLM-as-Judge…
wikiconfluent_kafka
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне]] - [[407. Как вы проектируете dead letter queue для failed LLM…
wikiKafka
…Как вы делаете асинхронную обработку long-running (30s) LLM задач]] - [[256. Как вы проектируете ETL пайплайн для 1M документовдень в…
wikiProtobuf
…Что такое data contract между сервисами в RAG пайплайне|532. Что такое data contract между сервисами в RAG пайплайне]] - [[816…
wikiHTTP 429
…Как вы проектируете backpressure в LLM serving системе]] - [[429. Что такое end-to-end backpressure в LLM пайплайне и как…
answerКак вы проверяете, что новая версия модели не сломала старые кейсы?
…Как вы оцениваете cost-effectiveness LLM-пайплайна\|139]] | Как вы оцениваете качество ответов LLM? | | [[141. В чем разница между Naive…
wikiEfficiency
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[165. Как тест-тайм компьютинг…
wikiAWS SQS
…Как вы деплоите LLM на spot instances в облаке]] - [[528. Как вы обрабатываете corrupted или empty документы в ingestion пайплайне…
wikiServer-Sent Events
…Что такое end-to-end backpressure в LLM пайплайне и как его реализовать|429. Что такое end-to-end backpressure…
wikiOpenAI Embeddings
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[738. Назовите 12+ слоёв эталонной…
wikibounded queue
…Как вы проектируете backpressure в LLM serving системе]] - [[429. Что такое end-to-end backpressure в LLM пайплайне и как…
wikiMinIO
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне]] - [[418. Как вы деплоите LLM на spot instances в облаке…
wikitrade-off
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[800+ вопросов|800+ вопросов]] - [[13…
wikiAgentic chunking
…LLM-агент принимает решение о границах разделения для повышения качества последующего поиска. ## Где встречается - [[256. Как вы проектируете ETL пайплайн…
wikiGrafana
…Как вы оцениваете cost-effectiveness LLM-пайплайна|139. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[205. Как вы деплоите LLM…
wikiAirflow
…ETL пайплайн для 1M документовдень в RAG систему]] - [[262. Как вы проектируете feature store для ML фичей, используемых LLM|262…
wikiGPT-3.5
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[697. Как вы масштабируете синтетическую…
answerКак вы интегрируете DSPy с RAG-пайплайном? Приведите пример сигнатуры.
…Мульти-шаговый RAG Можно построить [[Вики/пайплайн\|пайплайн]], где [[Вики/GPT-4o\|LLM]] сама решает, какие [[Вики/Query\|запросы]] делать…
wikiavailability
…Как вы определяете SLO и SLA для LLM сервиса]] - [[532. Что такое data contract между сервисами в RAG пайплайне|532…
wikiWeaviate
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[521. Как вы делаете incremental…
wikidspy.ProgramOfThought
…Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.|104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример…
wikiOllama
# Ollama ## Определение Инструмент для запуска локальных LLM, упрощающий развертывание и интеграцию моделей в пет-проектах. ## Где встречается - [[11. Что такое…
wikiSlack
…Как вы обрабатываете corrupted или empty документы в ingestion пайплайне]] - [[846. Как дебажить memory fragmentation в LLM сервере|846. Как…