Поиск

  • answerЧто такое LoRA для training (инференс уже знаем)?

    …Позволяет обучать [[Вики/LoRA\|LoRA]] на моделях 70B на одной [[Вики/GPU\|GPU]] с 48 ГБ. - [[Вики/LoRA merging\|LoRA

  • wikiLoRA merging

    # LoRA merging ## Определение Техника объединения нескольких LoRA-адаптеров в единый адаптер, что позволяет выполнять инференс без накладных расходов на переключение…

  • wikiLoraConfig

    # LoraConfig ## Определение Класс из библиотеки PEFT для настройки параметров LoRA, включая rank, alpha и target_modules. ## Где встречается - [[29. Как…

  • wikilora_alpha

    # lora_alpha ## Определение Гиперпараметр LoRA, масштабирующий вклад адаптера в исходную модель; часто задаётся как lora_alpha=16. ## Где встречается - [[244…

  • answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?

    LoRA, квантование, QLoRA **[[Вики/LoRA\|LoRA]] (Low‑[[Вики/LoRA rank\|Rank]] Adaptation)** — метод параметро-эффективного [[Вики/fine-tuning\|fine-tuning…

  • answerКак работает QLoRA (Quantized LoRA) для training?

    …Добавить LoRA-адаптеры через PEFT: ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig(r=8, lora_alpha…

  • answerКак работает DoRA (Weight-Decomposed LoRA) и чем лучше LoRA?

    LoRA (Low-Rank Adaptation) — основа для понимания DoRA [[Вики/LoRA\|LoRA]] — это метод параметро-эффективного [[Вики/fine-tuning\|fine-tuning…

  • answerКакие методы fine-tuning вы знаете и какой используете чаще всего?

    …Сравнение с [[Вики/LoRA\|LoRA]] [[Вики/Prefix-tuning\|Prefix-tuning]] менее стабилен и часто уступает [[Вики/LoRA\|LoRA]] по качеству…

  • wikiLoRA rank

    # LoRA rank ## Определение Гиперпараметр LoRA (обычно 8-16), определяющий ранг матрицы адаптера и количество обучаемых параметров; малый ранг снижает риск…

  • answerЧто такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA?

    …Параметров может быть в 10–100 раз меньше, чем у [[Вики/LoRA\|LoRA]]. --- ## 2. Как работает LoRA (напоминание) [[Вики/LoRA

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune LoRA для стиля

    …Fine-tune LoRA для стиля ## 1. Цель задачи Научиться применять параметро-эффективное [[Вики/fine-tuning\|дообучение]] ([[Вики/LoRA\|LoRA]]) для…

  • answerСколько эпох достаточно для LoRA fine-tuning?

    …Сколько эпох достаточно для LoRA fine-tuning? ## Краткий тезис Количество эпох для [[Вики/LoRA\|LoRA]] [[Вики/fine-tuning\|fine-tuning…

  • answerКак вы подбираете гиперпараметры для LoRA?

    …Как вы подбираете гиперпараметры для LoRA? ## Краткий тезис [[Вики/LoRA\|LoRA]] ([[Вики/LoRA\|Low-Rank Adaptation]]) — эффективный метод [[Вики/fine…

  • answerКакой размер датасета нужен для fine-tuning?

    …Практическое правило для [[Вики/LoRA\|LoRA]] количество примеров ≈ (число обучаемых параметров [[Вики/LoRA\|LoRA]]) × 10–100. Например, для [[Вики/LoRA

  • wikiAlpaca-LoRA

    # Alpaca-LoRA ## Определение Датасет из 52 000 синтетических инструкций, созданных с помощью Self-Instruct из seed-подсказок, широко применяемый для…

  • wikiParameter-Efficient Fine-Tuning

    …Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…

  • wikiQLoRA

    # QLoRA ## Определение Метод параметро-эффективного fine-tuning, объединяющий 4-битную квантизацию весов модели и Low-Rank Adaptation (LoRA) для значительного…

  • wikiIA3

    …Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA]] - [[800+ вопросов|800+ вопросов]] - [[235. LoRA для function calling…

  • wikitarget_modules

    # target_modules ## Определение Параметр в LoRA, задающий список модулей трансформера (например, q_lin, k_lin, v_lin), к которым применяются…

  • wikiAccelerate

    …Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…

  • wikiHugging Face Inference API

    # Hugging Face Inference API ## Определение API для развёртывания и вызова моделей Hugging Face, включая LoRA-модели для function calling. ## Где…

  • wikiPeftMixedModel

    # PeftMixedModel ## Определение Класс в библиотеке PEFT для одновременного применения нескольких адаптеров (например, LoRA) на разных слоях модели. ## Где встречается - [[40…

  • wikiPrompt Tuning

    …Что такое LoRA для training (инференс уже знаем)|481. Что такое LoRA для training (инференс уже знаем)]] - [[484. Что такое…

  • wikiDoRA

    # DoRA ## Определение Улучшение LoRA, разлагающее веса на magnitude и direction, что повышает качество fine-tuning на 2-5% без увеличения…

  • wikiLoRA

    …Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…

  • wikiscale-and-add

    # scale-and-add ## Определение Модификация метода сложения с масштабированием, применяемая при объединении нескольких LoRA-адаптеров. ## Где встречается - [[40. Как вы…

  • wikiLow-rank decomposition

    # Low-rank decomposition ## Определение Аппроксимация матрицы обновления весов произведением двух низкоранговых матриц, лежащая в основе метода LoRA для эффективного fine…

  • wikitask vector

    # task vector ## Определение Вектор, представляющий разность весов адаптера (например, LoRA) и базовой модели. Используется в методах объединения нескольких адаптеров через…

  • wikiattention projections

    # attention projections ## Определение Линейные слои Q, K, V, O в механизме внимания; часто к ним добавляют LoRA-адаптеры для эффективной…

  • wikiLoReFT

    # LoReFT ## Определение Low-rank Representation Fine-Tuning — метод дообучения, использующий низкоранговые матрицы для модификации внутренних представлений модели, альтернатива LoRA. ## Где…

  • wikiadapter conflict

    # adapter conflict ## Определение Проблема, возникающая при объединении нескольких LoRA-адаптеров: их обновления могут иметь противоположные знаки, что приводит к ухудшению…

  • wikidelta weights

    …В параметр-эффективном дообучении (PEFT) хранятся как отдельные адаптеры, например в LoRA. ## Где встречается - [[40. Как вы объединяете несколько LoRA

  • answerКак вы предотвращаете catastrophic forgetting при fine-tuning?

    LoRA (Low-Rank Adaptation) как основной инструмент [[Вики/LoRA\|LoRA]] — метод параметрически эффективного дообучения ([[Вики/Parameter-Efficient Fine-Tuning\|PEFT…

  • wikiSLERP

    # SLERP ## Определение Метод интерполяции для плавного смешивания весов адаптеров (например, LoRA) на гиперсфере, позволяющий комбинировать знания без катастрофического забывания. ## Где…

  • wikitask prompt routing

    # task prompt routing ## Определение Метод выбора подходящего адаптера (LoRA) на основе входного промпта или специального токена. Позволяет динамически переключаться между…

  • wikiTask vector arithmetic

    # Task vector arithmetic ## Определение Метод объединения нескольких адаптеров (например, LoRA) путём сложения их task vectors как векторов. Позволяет комбинировать навыки…

  • wikiTIES-Merging

    # TIES-Merging ## Определение Алгоритм объединения нескольких адаптеров (например, LoRA), который уменьшает конфликты знаков между ними за счёт этапов обрезки (trim…

  • answerЧто такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете?

    LoRA (Low-Rank Adaptation) – самый популярный метод ### Идея [[Вики/LoRA\|LoRA]] (Hu et al., 2021) исходит из гипотезы, что изменение…

  • wikiHugging Face PEFT

    # Hugging Face PEFT ## Определение Библиотека с единым API для PEFT-методов (LoRA, ReFT и др.), упрощающая fine-tuning больших моделей…

  • wikiAdaLoRA

    # AdaLoRA ## Определение Вариант LoRA с адаптивным выбором ранга для каждого слоя, что позволяет эффективно распределять параметры и улучшать качество дообучения…

  • wikilow-rank matrices

    # low-rank matrices ## Определение Матрицы малого ранга, используемые для сжатия представлений, например, в LoRA или в линейных вариациях attention (Linformer…

  • wikiSFTTrainer

    …Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…

  • wikiGit LFS

    …Fine-tune LoRA для стиля|223. Fine-tune LoRA для стиля]] - [[235. LoRA для function calling|235. LoRA для function…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: LoRA для function calling

    …Настроить [[Вики/LoRA\|LoRA]] через `[[Вики/Parameter-Efficient Fine-Tuning\|peft]].[[Вики/LoraConfig\|LoraConfig]]`: - `r=8`, `[[Вики/lora_alpha\|lora

  • answerКак вы избегаете переобучения при fine-tuning на маленьком датасете?

    …Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…

  • answerКак вы объединяете несколько LoRA адаптеров для разных задач?

    …Как вы объединяете несколько LoRA адаптеров для разных задач? ## Краткий тезис [[Вики/LoRA\|LoRA]] ([[Вики/LoRA\|Low-Rank Adaptation]]) позволяет…

  • wikistop_token

    …завершения генерации текста моделью. ## Где встречается - [[235. LoRA для function calling|235. LoRA для function calling]] ## Навигация - [[00. Индекс терминов…

  • wikiPeftModel

    …Как вы объединяете несколько LoRA адаптеров для разных задач|40. Как вы объединяете несколько LoRA адаптеров для разных задач]] ## Навигация…

  • wikiDouble Quantization

    …Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…

  • answerКак вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофического забывания?

    …Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…