Поиск

  • wikiFull fine-tuning

    # Full fine-tuning ## Определение Метод дообучения, при котором обновляются все параметры модели; требует больших вычислительных ресурсов и большого датасета, склонен…

  • wikiParameter-Efficient Fine-Tuning

    # Parameter-Efficient Fine-Tuning ## Определение Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных…

  • wikiFine-tuning cost

    # Fine-tuning cost ## Определение Суммарные затраты на GPU, подготовку датасета и инженерные ресурсы для выполнения fine-tuning модели. ## Где встречается…

  • wikiLoRA

    …Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…

  • wikiData-efficient fine-tuning

    # Data-efficient fine-tuning ## Определение Подход, использующий 50–200 примеров и активное обучение для снижения стоимости датасета. ## Где встречается - [[780…

  • wikiQLoRA

    # QLoRA ## Определение Метод параметро-эффективного fine-tuning, объединяющий 4-битную квантизацию весов модели и Low-Rank Adaptation (LoRA) для значительного…

  • wikifine-tuning

    …Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…

  • wikicatastrophic forgetting

    …Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот|21. Когда вы выбираете fine-tuning вместо RAG, а когда…

  • answerКогда вы выбираете fine-tuning вместо RAG, а когда — наоборот?

    …Когда вы выбираете fine-tuning вместо RAG, а когда — наоборот? ## Краткий тезис Выбор между **[[Вики/SFT\|fine-tuning]]** ([[Вики/SFT…

  • answerКак измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)?

    …Если [[Вики/Horizon\|горизонт]] 3–6 месяцев, [[Вики/fine-tuning\|fine-tuning]] окупается быстро. Если [[Вики/Fine-tuning cost\|Cost…

  • wikifine-tuning embedding model

    # fine-tuning embedding model ## Определение Адаптация векторных представлений под доменную область через дообучение модели эмбеддингов (часто с triplet loss) для…

  • wikiHugging Face PEFT

    # Hugging Face PEFT ## Определение Библиотека с единым API для PEFT-методов (LoRA, ReFT и др.), упрощающая fine-tuning больших моделей…

  • wikiSanity check

    # Sanity check ## Определение Простой тест для проверки корректности пайплайна (например, дообучение на одном примере) или обнаружения катастрофического забывания после fine

  • wikiback-translation

    …Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[25. Как вы оцениваете качество…

  • answerКак вы предотвращаете catastrophic forgetting при fine-tuning?

    …Сравнение [[Вики/LoRA\|LoRA]] и [[Вики/full compatibility\|Full]] [[Вики/SFT\|fine-tuning]]: | Характеристика | Full fine-tuning | LoRA | |------------------------------|------------------|---------------------| | Число обучаемых…

  • wikiAxolotl

    # Axolotl ## Определение Конфигурационный фреймворк для fine-tuning LLM на основе YAML. Поддерживает synthetic data и используется для production конфигураций fine

  • wikiHugging Face Trainer

    # Hugging Face Trainer ## Определение Класс из библиотеки Transformers для обучения и fine-tuning моделей. Интегрирован с PEFT и поддерживает early…

  • answerКакой размер датасета нужен для fine-tuning?

    Fine-tuning, LoRA, Full fine-tuning [[Вики/SFT\|Fine-tuning]] — [[Вики/SFT\|дообучение]] предобученной модели на новом датасете для адаптации…

  • wikiDP-Fine-tuning

    # DP-Fine-tuning ## Определение Применение дифференциальной приватности только на этапе дообучения для сохранения качества модели. ## Где встречается - [[620. Что такое…

  • wikiDoRA

    # DoRA ## Определение Улучшение LoRA, разлагающее веса на magnitude и direction, что повышает качество fine-tuning на 2-5% без увеличения…

  • wikiReFT

    # ReFT ## Определение Метод параметро-эффективного fine-tuning, который обучает интервенции на скрытых представлениях модели, добавляя условные векторы к эмбеддингам. ## Где…

  • wikidropout

    …Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[25. Как вы оцениваете качество…

  • wikiFine-tuning loop

    # Fine-tuning loop ## Определение Цикл дообучения, в котором фидбэк от оператора используется для улучшения агентов через fine-tuning. Обычно включает…

  • answerКакие методы fine-tuning вы знаете и какой используете чаще всего?

    …от полного обновления всех весов ([[Вики/Full fine-tuning\|full fine-tuning]]) до параметро-эффективных методов ([[Вики/Parameter-Efficient Fine

  • wikiChain-of-Thought fine-tuning

    # Chain-of-Thought fine-tuning ## Определение Дообучение модели с использованием примеров, содержащих цепочку рассуждений. Учит агента генерировать объяснения, которые действительно…

  • wikiSFTTrainer

    # SFTTrainer ## Определение Компонент библиотеки Hugging Face TRL для supervised fine-tuning LLM на парах инструкция-ответ. ## Где встречается - [[28. Какие…

  • answerКакие фреймворки для fine-tuning вы используете?

    fine-tuning|Полный fine-tuning (update всех весов) дорог и не всегда нужен. **PEFT (Fine-Tuning|Parameter-Efficient Fine-Tuning

  • wikiROI

    …Рассчитать ROI для fine-tuning|75. Рассчитать ROI для fine-tuning]] - [[135. Рассчитать ROI от fine-tuning|135. Рассчитать ROI…

  • answerКак вы проверяете, что fine-tuned модель не сломала базовые способности?

    …Почему fine-tuning может ломать способности Основные причины ухудшения: - Дисбаланс датасета если данные для [[Вики/fine-tuning\|fine-tuning]] слишком…

  • wikiPrefix-tuning

    # Prefix-tuning ## Определение Метод fine-tuning, добавляющий обучаемые префиксные векторы к слоям self-attention; требует мало ресурсов. ## Где встречается - [[22…

  • wikiRegularization

    …Как вы предотвращаете catastrophic forgetting при fine-tuning|26. Как вы предотвращаете catastrophic forgetting при fine-tuning]] - [[356. Что такое…

  • wikigenerative model

    …Используется для weak supervision при разметке данных для fine-tuning. ## Где встречается - [[258. Что такое weak supervision для разметки данных…

  • wikiAdaLoRA

    …Какие методы fine-tuning вы знаете и какой используете чаще всего|22. Какие методы fine-tuning вы знаете и какой…

  • wikiweak supervision

    …Используется для быстрого создания размеченных наборов данных при fine-tuning. ## Где встречается - [[258. Что такое weak supervision для разметки данных…

  • wikiMemory Tuning

    # Memory Tuning ## Определение Механизм Lamini для запоминания фактов из контекста, используемый при fine-tuning. ## Где встречается - [[33. Какие фреймворки для…

  • wikiInstruction tuning

    …Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами]] - [[33. Какие фреймворки для fine

  • answerЧто такое adversarial fine-tuning для защиты от jailbreak?

    …3. [[Вики/SFT\|Fine-tuning]]: - Используется [[Вики/SFT\|supervised fine-tuning]] ([[Вики/fine-tuning\|SFT]]) на смешанном датасете. - Возможно применение…

  • wikiLamini

    # Lamini ## Определение Lamini — платформа для enterprise fine-tuning LLM, предоставляющая дашборды мониторинга и инструменты memory tuning. ## Где встречается - [[33. Какие…

  • wikiPrompt Tuning

    …Что такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA|484. Что такое ReFT (Representation Fine-Tuning) и когда…

  • answerКакая у вас была самая сложная проблема при fine-tuning и как вы её решили?

    …Потеря attention mask при fine-tuning BERT для QA [[Вики/Task\|Задача]] [[Вики/fine-tuning\|Fine-tuning]] [[Вики/Transformer\|BERT…

  • wikiSLURM

    # SLURM ## Определение Система управления заданиями на кластере, используемая для распределённого выполнения задач, таких как fine-tuning моделей. Обеспечивает планирование ресурсов…

  • wikiEWC

    # EWC ## Определение Регуляризационный метод, добавляющий штраф за изменение важных весов, чтобы сохранить знания при fine-tuning. ## Где встречается - [[26. Как…

  • wikiBootstrap estimation

    # Bootstrap estimation ## Определение Метод оценки достаточности данных для fine-tuning, основанный на обучении модели на подвыборках данных. Позволяет определить минимальный…

  • wikidata labeling

    …Затраты на разметку учитываются при расчете ROI fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] - [[135. Рассчитать ROI от fine

  • wikiOnline fine-tuning

    # Online fine-tuning ## Определение Непрерывное дообучение модели на потоке данных с сохранением checkpoint'ов для восстановления после сбоев. ## Где встречается…

  • wikipyreft

    # pyreft ## Определение Библиотека Stanford NLP для Representation Fine-Tuning (ReFT) — метода тонкой настройки, изменяющего представления модели вместо весов. ## Где встречается…

  • wikilearning curve experiment

    …Какой размер датасета нужен для fine-tuning|24. Какой размер датасета нужен для fine-tuning]] - [[699. Как вы оцениваете, сколько…

  • wikiKrum

    # Krum ## Определение Алгоритм робастной агрегации градиентов, выбирающий градиент, наиболее близкий к остальным, для защиты от атак отравления данных при fine

  • wikicost model

    # cost model ## Определение Математическая или вычислительная модель, описывающая затраты на fine-tuning и inference (например, ft_cost и fs_cost…

  • wikiLoReFT

    # LoReFT ## Определение Low-rank Representation Fine-Tuning — метод дообучения, использующий низкоранговые матрицы для модификации внутренних представлений модели, альтернатива LoRA. ## Где…