Поиск

wikiPeftModel
# PeftModel ## Определение Основной класс библиотеки PEFT для управления множественными адаптерами в одной модели. ## Где встречается - [[40. Как вы объединяете несколько…
wikiHugging Face PEFT
# Hugging Face PEFT ## Определение Библиотека с единым API для PEFT-методов (LoRA, ReFT и др.), упрощающая fine-tuning больших моделей…
wikiPeftMixedModel
# PeftMixedModel ## Определение Класс в библиотеке PEFT для одновременного применения нескольких адаптеров (например, LoRA) на разных слоях модели. ## Где встречается - [[40…
answerКакие методы fine-tuning вы знаете и какой используете чаще всего?
…Простота Единый [[Вики/API\|API]] ([[Вики/Hugging Face PEFT\|Hugging Face PEFT]]), легко комбинировать с другими техниками (например, [[Вики/DeepSpeed…
answerКакие фреймворки для fine-tuning вы используете?
…Fine-tuning и PEFT Fine-tuning — это дообучение предобученной языковой модели на небольшом датасете для решения конкретной задачи. fine-tuning…
answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?
…Инструменты и реализация Основные библиотеки: - [[Вики/Hugging Face PEFT\|Hugging Face PEFT]] — предоставляет `LoraConfig` и `get_peft_model`. - **Bitsandbytes** (от…
answerКак вы объединяете несколько LoRA адаптеров для разных задач?
…Реализация routing с помощью PEFT (Hugging Face) Библиотека `[[Вики/Parameter-Efficient Fine-Tuning\|peft]]` поддерживает множественные адаптеры через `[[Вики/PeftModel…
answerЧто такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете?
…Классификация методов PEFT Все методы [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]] можно разделить на три большие группы: | Группа | Примеры | Идея…
wikiP-tuning v2
# P-tuning v2 ## Определение Улучшенный метод prefix-tuning для параметро-эффективного fine-tuning (PEFT). ## Где встречается - [[800+ вопросов|800+ вопросов…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune LoRA для стиля
…Собрать LoRA-ответы — применить [[Вики/Adapter layers\|адаптер]]: ```python from peft import PeftModel base_model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2…
wikiLoraConfig
# LoraConfig ## Определение Класс из библиотеки PEFT для настройки параметров LoRA, включая rank, alpha и target_modules. ## Где встречается - [[29. Как…
wikiIA³
# IA³ ## Определение Метод PEFT, обучающий векторы масштабирования для ключей, значений и слоёв FFN (аналогично IA3). Позволяет тонко настраивать модель с…
wikidelta weights
…В параметр-эффективном дообучении (PEFT) хранятся как отдельные адаптеры, например в LoRA. ## Где встречается - [[40. Как вы объединяете несколько LoRA…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: LoRA для function calling
…Загрузить адаптер на базовую модель (без QLoRA, в полной точности или снова 4-bit): ```python from peft import PeftModel base…
answerКак вы избегаете переобучения при fine-tuning на маленьком датасете?
…Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…
wikiIA3
# IA3 ## Определение Метод Parameter-Efficient Fine-Tuning (PEFT), который обучает векторы масштабирования для активаций ключей, значений и слоёв FFN, позволяя…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune QLoRA на 1 GPU
…адаптеры]] ([[Вики/Parameter-Efficient Fine-Tuning\|PEFT]]):** ```python from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training…
answerКак работает QLoRA (Quantized LoRA) для training?
…Добавить LoRA-адаптеры через PEFT: ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig(r=8, lora_alpha…
wikiPrompt Tuning
# Prompt Tuning ## Определение Метод PEFT, при котором обучаются мягкие промпты (soft prompts) для адаптации модели под задачу. ## Где встречается - [[481…
answerКак вы подбираете гиперпараметры для LoRA?
…bias, use_rslora, init_lora_weights Помимо основных, в библиотеке [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]] есть несколько важных параметров…
answerЧто такое LoRA для training (инференс уже знаем)?
…Пример кода с библиотекой [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]] ([[Вики/Hugging Face\|Hugging Face]]): ```python from transformers import AutoModelForCausalLM…
answerСколько эпох достаточно для LoRA fine-tuning?
…Пример конфигурации LoRA fine-tuning в коде (HuggingFace + PEFT) ```python from transformers import AutoModelForCausalLM, TrainingArguments, Trainer from peft import LoraConfig…
answerКак fine-tune модель для следования сложным инструкциям?
…Инструменты: [[Вики/Hugging Face\|Hugging Face Transformers]], [[Вики/датасеты\|Datasets]], [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]]. **Шаги**: 1. Создать [[Вики…
answerКак работает DoRA (Weight-Decomposed LoRA) и чем лучше LoRA?
…Реализовать LoRA (через `peft.LoraConfig`) и DoRA (через `peft.DoraConfig`). 3. Fine-tune обе модели на подмножестве GSM8K (например, 1000…
wikiParameter-Efficient Fine-Tuning
# Parameter-Efficient Fine-Tuning ## Определение Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных…
wikiHugging Face Trainer
…Интегрирован с PEFT и поддерживает early stopping, кастомные сэмплеры и другие опции. ## Где встречается - [[24. Какой размер датасета нужен для…
answerЧто такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA?
…Инструменты и библиотеки - [[Вики/pyreft\|pyreft]] — официальная реализация от Stanford NLP. - [[Вики/Hugging Face PEFT\|Hugging Face PEFT]] — пока не…
answerКакие LLM для русского языка вы используете?
…Efficient Fine-Tuning\|PEFT]]):** ```python from transformers import AutoModelForCausalLM, AutoTokenizer from peft import LoraConfig, get_peft_model, TaskType from datasets…
answerКакая у вас была самая сложная проблема при fine-tuning и как вы её решили?
…Модель деградирует на старых задачах → Примените репетицию или PEFT (LoRA). Снизьте learning rate. 4. Модель переобучается → Увеличьте dropout, используйте early…
answerКак вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофического забывания?
…Пример конфигурации [[Вики/LoRA\|LoRA]] ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, lora_alpha…
answerКак вы проверяете, что fine-tuned модель не сломала базовые способности?
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] | Как вы боретесь с катастрофическим забыванием при…
answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…LoRA (Low-Rank Adaptation) как основной инструмент [[Вики/LoRA\|LoRA]] — метод параметрически эффективного дообучения ([[Вики/Parameter-Efficient Fine-Tuning\|PEFT…
wikiHugging Face
# Hugging Face ## Определение Платформа и библиотеки (Transformers, TRL, PEFT) для работы с предобученными NLP-моделями, датасетами и реализации RLHF. ## Где…
answerЧто такое data poisoning атака на fine-tuning и как защититься?
…В контексте LLM это может быть full fine-tuning (обновление всех весов) или **Fine-Tuning|parameter-efficient fine-tuning (PEFT…
answerКакие данные нужны для fine-tuning на кастомный стиль общения?
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] | Сравнение SFT и RLHF для контроля стиля…
answerКакой размер датасета нужен для fine-tuning?
…Инструменты [[Вики/Hugging Face\|Hugging Face Transformers]], [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]], [[Вики/датасеты\|Datasets]], [[Вики/scikit-learn\|scikit…
answerКак вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами?
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] - Следующий: [[33. Какие фреймворки для fine-tuning…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать process reward model (PRM)
…голову с нормализацией (LayerNorm). | | Нехватка памяти GPU (12GB) | Использовать PEFT (LoRA) для base модели; уменьшить max_length (512 токенов); использовать…
answerКак вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)?
…Инструменты Python, Hugging Face Transformers, PEFT (LoRA), Weights & Biases, LangChain (для генерации данных). **Шаги:** 1. Сгенерируйте 50k синтетических примеров вида…
answerКак бы вы спроектировали multi-tenant RAG (разные компании, изолированные данные)?
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] | Выбор векторной БД | --- ## Навигация (Obsidian) - Предыдущий: [[83…
answerЧто такое LangGraph и зачем он нужен?
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] | В чём разница между Chain и Agent…
wikiИндекс терминов
…peer interaction|peer-to-peer interaction]] - [[Вики/PeftMixedModel|PeftMixedModel]] - [[Вики/PeftModel|PeftModel]] - [[Вики/Pegasus|Pegasus]] - [[Вики/PendingAction|PendingAction]] - [[Вики/Penetration…
indexИндекс разборов
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31. Что такое Parameter-Efficient Fine-Tuning (PEFT…
indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…базовых способностей | Q 146, Q 154, Pet 236 | | 31 | PEFT методы | Pet 223, Pet 244 | | 32 | Подготовка датасета из логов…
indexОглавление
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31. Что такое Parameter-Efficient Fine-Tuning (PEFT…
question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете?** **Ответ:** - **PEFT:** обучаем только малую часть параметров (1…