Поиск
- wikicontinuous learning
# continuous learning ## Определение Парадигма обучения, при которой модель непрерывно адаптируется к новым данным без катастрофического забывания. Используются техники вроде EWC…
- wikiFisher Information Matrix
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiUndersampling
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiHot-swap
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiexplicit feedback
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiImplicit feedback
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikireplay buffer
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikifeedback embeddings
# feedback embeddings ## Определение Эмбеддинги пользовательских фидбеков для организации continuous learning агента. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikigolden examples
# golden examples ## Определение Отборные примеры взаимодействий агента, используемые для continuous learning без катастрофического забывания и шума. ## Где встречается - [[800+ вопросов…
- answerКак вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофического забывания?
…Continuous Learning (непрерывное обучение) **[[Вики/continuous learning\|Continuous learning]]** — это парадигма, при которой [[Вики/model\|модель]] улучшается на данных, поступающих…
- wikiModel registry
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikifeature store
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiIsolation Forest
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiHugging Face TRL
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiuser satisfaction
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikicatastrophic forgetting
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiHoldout set
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikitoken bucket
…Что такое continuous batching и как оно отличается от static batching Как это реализовано в vLLMTGI|201. Что такое continuous…
- wikiParameter-Efficient Fine-Tuning
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikidata drift
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiOutlier detection
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiVLLM
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiLLM distillation
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiconfidence score
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…LoRA]]. [[Вики/EWC\|EWC]] чаще применяется в [[Вики/continuous learning\|continuous learning]], но может быть комбинирован с [[Вики/LoRA\|LoRA…
- wikiROUGE
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiBLEU
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerКак вы деплоите LLM с TensorRT-LLM в production?
…Ключевые преимущества — низкая [[Вики/Latency\|latency]], высокая [[Вики/throughput\|throughput]] и поддержка продвинутых оптимизаций ([[Вики/Quantization\|квантизация]], [[Вики/continuous batching…
- answerЧто такое learning-to-rank (LTR) и как он применяется к retrieval для LLM?
…Что такое Learning-to-Rank (LTR) **[[Вики/learning-to-rank\|Learning-to-rank]]** — это [[Вики/Task\|задача]] обучения с учителем…
- wikiPrometheus
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать latent reasoning (COCONUT)
…Цель задачи Реализовать подход COCONUT (Chain of Continuous Thought) — метод рассуждения, при котором модель не генерирует токены, а использует непрерывные…
- answerКак работает tensor parallelism для LLM инференса? В чем отличие от pipeline parallelism?
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiGrafana
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerЧто вы видите следующим горизонтом после language representation?
…Что такое continuous batching и как оно отличается от static batching Как это реализовано в vLLMTGI\|201]] | Как оценивать качество…
- wikiUser feedback
# User feedback ## Определение Механизм сбора сигналов от пользователя (лайки, дизлайки, явные оценки) для оценки и улучшения качества ответов агента; часто…
- wikifallback model
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerЧто такое AI for materials science (GNoME, MatterGen) и как это отличается от text LLM?
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerКак вы проектируете агента, который может работать непрерывно (24/7) без дрейфа поведения?
…Архитектура непрерывного обучения (continual learning) Чтобы агент не забывал старые паттерны при перекалибровке, применяются техники [[Вики/continuous learning\|continual learning…
- answerЧто такое packing sequences и зачем он нужен?
…Альтернативы и дополнения - **[[Вики/continuous batching\|Dynamic batching]]** ([[Вики/continuous batching\|динамическое батчирование]]): последовательности группируются по длине на лету, но…
- answerКак работает ∇-Reasoner (градиентный спуск в пространстве токенов на этапе теста)?
…аналогично [[Вики/Gumbel-Softmax\|Gumbel-Softmax]] или [[Вики/Continuous relaxation\|continuous relaxation]] в нейронном машинном переводе). - Во время [[Вики/backpropagation…
- answerКак вы переносите агента из прототипа в production (MLOps)?
…CI/CD пайплайн (Continuous Integration / Continuous Deployment) CI/CD гарантирует, что каждое изменение (промпта, кода, инструмента) проходит тесты и автоматически…
- answerКак вы уменьшаете latency RAG-системы (время ответа)?
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerЧто такое Chain-of-Thought без токенов (latent CoT, COCONUT)?
…Для обучения использовать технику [[Вики/Imitation learning\|imitation learning]]: сначала сгенерировать правильные CoT-рассуждения с помощью большой модели (GPT-4…
- answerКак вы делаете data quality monitoring для RAG корпуса?
…3. [[Вики/continuous monitoring\|Continuous monitoring]] потоковая [[Вики/Validation set\|валидация]] при добавлении документов через [[Вики/API\|API]]. Пример с…
- indexИндекс разборов
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- wikiИндекс терминов
…Вики/Continuous Backup|Continuous Backup]] - [[Вики/continuous batching|continuous batching]] - [[Вики/continuous learning|continuous learning]] - [[Вики/continuous monitoring|continuous monitoring…
- indexОглавление
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerКак вы версионируете агента целиком (prompts, tools, memory schema, orchestration graph)?
…Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения…
- answerКак работает agent replay для улучшения качества (анализ failed траекторий)?
…Инструменты Python, LangChain (или чистый OpenAI API), SQLite для хранения траекторий, DPO через библиотеку `trl` (Transformers Reinforcement Learning). **Шаги:** 1…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…A/B тест агентов | Q 149, Pet 248 | | 400 | Continuous learning | H 111, Pet 223, Q 146 | --- ## Часть 28: Harness…