Поиск

answerЧто такое LoRA для training (инференс уже знаем)?
…Позволяет обучать [[Вики/LoRA\|LoRA]] на моделях 70B на одной [[Вики/GPU\|GPU]] с 48 ГБ. - [[Вики/LoRA merging\|LoRA…
wikiLoRA merging
# LoRA merging ## Определение Техника объединения нескольких LoRA-адаптеров в единый адаптер, что позволяет выполнять инференс без накладных расходов на переключение…
wikiLoraConfig
# LoraConfig ## Определение Класс из библиотеки PEFT для настройки параметров LoRA, включая rank, alpha и target_modules. ## Где встречается - [[29. Как…
wikilora_alpha
# lora_alpha ## Определение Гиперпараметр LoRA, масштабирующий вклад адаптера в исходную модель; часто задаётся как lora_alpha=16. ## Где встречается - [[244…
answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?
…LoRA, квантование, QLoRA **[[Вики/LoRA\|LoRA]] (Low‑[[Вики/LoRA rank\|Rank]] Adaptation)** — метод параметро-эффективного [[Вики/fine-tuning\|fine-tuning…
answerКак работает QLoRA (Quantized LoRA) для training?
…Добавить LoRA-адаптеры через PEFT: ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig(r=8, lora_alpha…
answerКак работает DoRA (Weight-Decomposed LoRA) и чем лучше LoRA?
…LoRA (Low-Rank Adaptation) — основа для понимания DoRA [[Вики/LoRA\|LoRA]] — это метод параметро-эффективного [[Вики/fine-tuning\|fine-tuning…
answerКакие методы fine-tuning вы знаете и какой используете чаще всего?
…Сравнение с [[Вики/LoRA\|LoRA]] [[Вики/Prefix-tuning\|Prefix-tuning]] менее стабилен и часто уступает [[Вики/LoRA\|LoRA]] по качеству…
wikiLoRA rank
# LoRA rank ## Определение Гиперпараметр LoRA (обычно 8-16), определяющий ранг матрицы адаптера и количество обучаемых параметров; малый ранг снижает риск…
answerЧто такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA?
…Параметров может быть в 10–100 раз меньше, чем у [[Вики/LoRA\|LoRA]]. --- ## 2. Как работает LoRA (напоминание) [[Вики/LoRA…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune LoRA для стиля
…Fine-tune LoRA для стиля ## 1. Цель задачи Научиться применять параметро-эффективное [[Вики/fine-tuning\|дообучение]] ([[Вики/LoRA\|LoRA]]) для…
answerСколько эпох достаточно для LoRA fine-tuning?
…Сколько эпох достаточно для LoRA fine-tuning? ## Краткий тезис Количество эпох для [[Вики/LoRA\|LoRA]] [[Вики/fine-tuning\|fine-tuning…
answerКак вы подбираете гиперпараметры для LoRA?
…Как вы подбираете гиперпараметры для LoRA? ## Краткий тезис [[Вики/LoRA\|LoRA]] ([[Вики/LoRA\|Low-Rank Adaptation]]) — эффективный метод [[Вики/fine…
answerКакой размер датасета нужен для fine-tuning?
…Практическое правило для [[Вики/LoRA\|LoRA]] количество примеров ≈ (число обучаемых параметров [[Вики/LoRA\|LoRA]]) × 10–100. Например, для [[Вики/LoRA…
wikiAlpaca-LoRA
# Alpaca-LoRA ## Определение Датасет из 52 000 синтетических инструкций, созданных с помощью Self-Instruct из seed-подсказок, широко применяемый для…
wikiParameter-Efficient Fine-Tuning
…Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…
wikiQLoRA
# QLoRA ## Определение Метод параметро-эффективного fine-tuning, объединяющий 4-битную квантизацию весов модели и Low-Rank Adaptation (LoRA) для значительного…
wikiIA3
…Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA]] - [[800+ вопросов|800+ вопросов]] - [[235. LoRA для function calling…
wikitarget_modules
# target_modules ## Определение Параметр в LoRA, задающий список модулей трансформера (например, q_lin, k_lin, v_lin), к которым применяются…
wikiAccelerate
…Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…
wikiHugging Face Inference API
# Hugging Face Inference API ## Определение API для развёртывания и вызова моделей Hugging Face, включая LoRA-модели для function calling. ## Где…
wikiPeftMixedModel
# PeftMixedModel ## Определение Класс в библиотеке PEFT для одновременного применения нескольких адаптеров (например, LoRA) на разных слоях модели. ## Где встречается - [[40…
wikiPrompt Tuning
…Что такое LoRA для training (инференс уже знаем)|481. Что такое LoRA для training (инференс уже знаем)]] - [[484. Что такое…
wikiDoRA
# DoRA ## Определение Улучшение LoRA, разлагающее веса на magnitude и direction, что повышает качество fine-tuning на 2-5% без увеличения…
wikiLoRA
…Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…
wikiscale-and-add
# scale-and-add ## Определение Модификация метода сложения с масштабированием, применяемая при объединении нескольких LoRA-адаптеров. ## Где встречается - [[40. Как вы…
wikiLow-rank decomposition
# Low-rank decomposition ## Определение Аппроксимация матрицы обновления весов произведением двух низкоранговых матриц, лежащая в основе метода LoRA для эффективного fine…
wikitask vector
# task vector ## Определение Вектор, представляющий разность весов адаптера (например, LoRA) и базовой модели. Используется в методах объединения нескольких адаптеров через…
wikiattention projections
# attention projections ## Определение Линейные слои Q, K, V, O в механизме внимания; часто к ним добавляют LoRA-адаптеры для эффективной…
wikiLoReFT
# LoReFT ## Определение Low-rank Representation Fine-Tuning — метод дообучения, использующий низкоранговые матрицы для модификации внутренних представлений модели, альтернатива LoRA. ## Где…
wikiadapter conflict
# adapter conflict ## Определение Проблема, возникающая при объединении нескольких LoRA-адаптеров: их обновления могут иметь противоположные знаки, что приводит к ухудшению…
wikidelta weights
…В параметр-эффективном дообучении (PEFT) хранятся как отдельные адаптеры, например в LoRA. ## Где встречается - [[40. Как вы объединяете несколько LoRA…
answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…LoRA (Low-Rank Adaptation) как основной инструмент [[Вики/LoRA\|LoRA]] — метод параметрически эффективного дообучения ([[Вики/Parameter-Efficient Fine-Tuning\|PEFT…
wikiSLERP
# SLERP ## Определение Метод интерполяции для плавного смешивания весов адаптеров (например, LoRA) на гиперсфере, позволяющий комбинировать знания без катастрофического забывания. ## Где…
wikitask prompt routing
# task prompt routing ## Определение Метод выбора подходящего адаптера (LoRA) на основе входного промпта или специального токена. Позволяет динамически переключаться между…
wikiTask vector arithmetic
# Task vector arithmetic ## Определение Метод объединения нескольких адаптеров (например, LoRA) путём сложения их task vectors как векторов. Позволяет комбинировать навыки…
wikiTIES-Merging
# TIES-Merging ## Определение Алгоритм объединения нескольких адаптеров (например, LoRA), который уменьшает конфликты знаков между ними за счёт этапов обрезки (trim…
answerЧто такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете?
…LoRA (Low-Rank Adaptation) – самый популярный метод ### Идея [[Вики/LoRA\|LoRA]] (Hu et al., 2021) исходит из гипотезы, что изменение…
wikiHugging Face PEFT
# Hugging Face PEFT ## Определение Библиотека с единым API для PEFT-методов (LoRA, ReFT и др.), упрощающая fine-tuning больших моделей…
wikiAdaLoRA
# AdaLoRA ## Определение Вариант LoRA с адаптивным выбором ранга для каждого слоя, что позволяет эффективно распределять параметры и улучшать качество дообучения…
wikilow-rank matrices
# low-rank matrices ## Определение Матрицы малого ранга, используемые для сжатия представлений, например, в LoRA или в линейных вариациях attention (Linformer…
wikiSFTTrainer
…Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…
wikiGit LFS
…Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: LoRA для function calling
…Настроить [[Вики/LoRA\|LoRA]] через `[[Вики/Parameter-Efficient Fine-Tuning\|peft]].[[Вики/LoraConfig\|LoraConfig]]`: - `r=8`, `[[Вики/lora_alpha\|lora…
answerКак вы избегаете переобучения при fine-tuning на маленьком датасете?
…Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…
answerКак вы объединяете несколько LoRA адаптеров для разных задач?
…Как вы объединяете несколько LoRA адаптеров для разных задач? ## Краткий тезис [[Вики/LoRA\|LoRA]] ([[Вики/LoRA\|Low-Rank Adaptation]]) позволяет…
wikistop_token
…завершения генерации текста моделью. ## Где встречается - [[235. LoRA для function calling|235. LoRA для function calling]] ## Навигация - [[00. Индекс терминов…
wikiPeftModel
…Как вы объединяете несколько LoRA адаптеров для разных задач|40. Как вы объединяете несколько LoRA адаптеров для разных задач]] ## Навигация…
wikiDouble Quantization
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
answerКак вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофического забывания?
…Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…