Поиск

wikiFull fine-tuning
# Full fine-tuning ## Определение Метод дообучения, при котором обновляются все параметры модели; требует больших вычислительных ресурсов и большого датасета, склонен…
wikiParameter-Efficient Fine-Tuning
# Parameter-Efficient Fine-Tuning ## Определение Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных…
wikiFine-tuning cost
# Fine-tuning cost ## Определение Суммарные затраты на GPU, подготовку датасета и инженерные ресурсы для выполнения fine-tuning модели. ## Где встречается…
wikiLoRA
…Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…
wikiData-efficient fine-tuning
# Data-efficient fine-tuning ## Определение Подход, использующий 50–200 примеров и активное обучение для снижения стоимости датасета. ## Где встречается - [[780…
wikiQLoRA
# QLoRA ## Определение Метод параметро-эффективного fine-tuning, объединяющий 4-битную квантизацию весов модели и Low-Rank Adaptation (LoRA) для значительного…
wikifine-tuning
…Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…
wikicatastrophic forgetting
…Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…
answerКогда вы выбираете fine-tuning вместо RAG, а когда — наоборот?
…Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот? ## Краткий тезис Выбор между **[[Вики/SFT\|fine-tuning]]** ([[Вики/SFT…
answerКак измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)?
…Если [[Вики/Horizon\|горизонт]] 3–6 месяцев, [[Вики/fine-tuning\|fine-tuning]] окупается быстро. Если [[Вики/Fine-tuning cost\|Cost…
wikifine-tuning embedding model
# fine-tuning embedding model ## Определение Адаптация векторных представлений под доменную область через дообучение модели эмбеддингов (часто с triplet loss) для…
wikiHugging Face PEFT
# Hugging Face PEFT ## Определение Библиотека с единым API для PEFT-методов (LoRA, ReFT и др.), упрощающая fine-tuning больших моделей…
wikiSanity check
# Sanity check ## Определение Простой тест для проверки корректности пайплайна (например, дообучение на одном примере) или обнаружения катастрофического забывания после fine…
wikiback-translation
…Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[25. Как вы оцениваете качество…
answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…Сравнение [[Вики/LoRA\|LoRA]] и [[Вики/full compatibility\|Full]] [[Вики/SFT\|fine-tuning]]: | Характеристика | Full fine-tuning | LoRA | |------------------------------|------------------|---------------------| | Число обучаемых…
wikiAxolotl
# Axolotl ## Определение Конфигурационный фреймворк для fine-tuning LLM на основе YAML. Поддерживает synthetic data и используется для production конфигураций fine…
wikiHugging Face Trainer
# Hugging Face Trainer ## Определение Класс из библиотеки Transformers для обучения и fine-tuning моделей. Интегрирован с PEFT и поддерживает early…
answerКакой размер датасета нужен для fine-tuning?
…Fine-tuning, LoRA, Full fine-tuning [[Вики/SFT\|Fine-tuning]] — [[Вики/SFT\|дообучение]] предобученной модели на новом датасете для адаптации…
wikiDP-Fine-tuning
# DP-Fine-tuning ## Определение Применение дифференциальной приватности только на этапе дообучения для сохранения качества модели. ## Где встречается - [[620. Что такое…
wikiDoRA
# DoRA ## Определение Улучшение LoRA, разлагающее веса на magnitude и direction, что повышает качество fine-tuning на 2-5% без увеличения…
wikiReFT
# ReFT ## Определение Метод параметро-эффективного fine-tuning, который обучает интервенции на скрытых представлениях модели, добавляя условные векторы к эмбеддингам. ## Где…
wikidropout
…Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[25. Как вы оцениваете качество…
wikiFine-tuning loop
# Fine-tuning loop ## Определение Цикл дообучения, в котором фидбэк от оператора используется для улучшения агентов через fine-tuning. Обычно включает…
answerКакие методы fine-tuning вы знаете и какой используете чаще всего?
…от полного обновления всех весов ([[Вики/Full fine-tuning\|full fine-tuning]]) до параметро-эффективных методов ([[Вики/Parameter-Efficient Fine…
wikiChain-of-Thought fine-tuning
# Chain-of-Thought fine-tuning ## Определение Дообучение модели с использованием примеров, содержащих цепочку рассуждений. Учит агента генерировать объяснения, которые действительно…
wikiSFTTrainer
# SFTTrainer ## Определение Компонент библиотеки Hugging Face TRL для supervised fine-tuning LLM на парах инструкция-ответ. ## Где встречается - [[28. Какие…
answerКакие фреймворки для fine-tuning вы используете?
…fine-tuning|Полный fine-tuning (update всех весов) дорог и не всегда нужен. **PEFT (Fine-Tuning|Parameter-Efficient Fine-Tuning…
wikiROI
…Рассчитать ROI для fine-tuning|75. Рассчитать ROI для fine-tuning]] - [[135. Рассчитать ROI от fine-tuning|135. Рассчитать ROI…
answerКак вы проверяете, что fine-tuned модель не сломала базовые способности?
…Почему fine-tuning может ломать способности Основные причины ухудшения: - Дисбаланс датасета если данные для [[Вики/fine-tuning\|fine-tuning]] слишком…
wikiPrefix-tuning
# Prefix-tuning ## Определение Метод fine-tuning, добавляющий обучаемые префиксные векторы к слоям self-attention; требует мало ресурсов. ## Где встречается - [[22…
wikiRegularization
…Как вы предотвращаете catastrophic forgetting при fine-tuning|26. Как вы предотвращаете catastrophic forgetting при fine-tuning]] - [[356. Что такое…
wikigenerative model
…Используется для weak supervision при разметке данных для fine-tuning. ## Где встречается - [[258. Что такое weak supervision для разметки данных…
wikiAdaLoRA
…Какие методы fine-tuning вы знаете и какой используете чаще всего|22. Какие методы fine-tuning вы знаете и какой…
wikiweak supervision
…Используется для быстрого создания размеченных наборов данных при fine-tuning. ## Где встречается - [[258. Что такое weak supervision для разметки данных…
wikiMemory Tuning
# Memory Tuning ## Определение Механизм Lamini для запоминания фактов из контекста, используемый при fine-tuning. ## Где встречается - [[33. Какие фреймворки для…
wikiInstruction tuning
…Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами]] - [[33. Какие фреймворки для fine…
answerЧто такое adversarial fine-tuning для защиты от jailbreak?
…3. [[Вики/SFT\|Fine-tuning]]: - Используется [[Вики/SFT\|supervised fine-tuning]] ([[Вики/fine-tuning\|SFT]]) на смешанном датасете. - Возможно применение…
wikiLamini
# Lamini ## Определение Lamini — платформа для enterprise fine-tuning LLM, предоставляющая дашборды мониторинга и инструменты memory tuning. ## Где встречается - [[33. Какие…
wikiPrompt Tuning
…Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA|484. Что такое ReFT (Representation Fine-Tuning) и когда…
answerКакая у вас была самая сложная проблема при fine-tuning и как вы её решили?
…Потеря attention mask при fine-tuning BERT для QA [[Вики/Task\|Задача]] [[Вики/fine-tuning\|Fine-tuning]] [[Вики/Transformer\|BERT…
wikiSLURM
# SLURM ## Определение Система управления заданиями на кластере, используемая для распределённого выполнения задач, таких как fine-tuning моделей. Обеспечивает планирование ресурсов…
wikiEWC
# EWC ## Определение Регуляризационный метод, добавляющий штраф за изменение важных весов, чтобы сохранить знания при fine-tuning. ## Где встречается - [[26. Как…
wikiBootstrap estimation
# Bootstrap estimation ## Определение Метод оценки достаточности данных для fine-tuning, основанный на обучении модели на подвыборках данных. Позволяет определить минимальный…
wikidata labeling
…Затраты на разметку учитываются при расчете ROI fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] - [[135. Рассчитать ROI от fine…
wikiOnline fine-tuning
# Online fine-tuning ## Определение Непрерывное дообучение модели на потоке данных с сохранением checkpoint'ов для восстановления после сбоев. ## Где встречается…
wikipyreft
# pyreft ## Определение Библиотека Stanford NLP для Representation Fine-Tuning (ReFT) — метода тонкой настройки, изменяющего представления модели вместо весов. ## Где встречается…
wikilearning curve experiment
…Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[699. Как вы оцениваете, сколько…
wikiKrum
# Krum ## Определение Алгоритм робастной агрегации градиентов, выбирающий градиент, наиболее близкий к остальным, для защиты от атак отравления данных при fine…
wikicost model
# cost model ## Определение Математическая или вычислительная модель, описывающая затраты на fine-tuning и inference (например, ft_cost и fs_cost…
wikiLoReFT
# LoReFT ## Определение Low-rank Representation Fine-Tuning — метод дообучения, использующий низкоранговые матрицы для модификации внутренних представлений модели, альтернатива LoRA. ## Где…