Поиск
- answerКак работает QLoRA (Quantized LoRA) для training?
…насколько QLoRA хуже LoRA? В оригинальной статье [[Вики/QLoRA\|QLoRA]] (Dettmers et al., 2023) показано, что [[Вики/QLoRA\|QLoRA]] с…
- answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?
…QLoRA vs LoRA — в чем разница и когда QLoRA лучше? ## Краткий тезис [[Вики/QLoRA\|QLoRA]] — это техника адаптации больших языковых…
- wikiMistral-70B
# Mistral-70B ## Определение Mistral-70B — модель с 70 миллиардами параметров, используемая как альтернатива для fine-tuning методом QLoRA. ## Где встречается…
- wiki4-bit quantization
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[642. Как вы реализуете KV…
- wikiPaged Optimizers
# Paged Optimizers ## Определение Механизм управления памятью состояний оптимизатора через выгрузку на CPU при обучении с ограниченной видеопамятью, применяемый в QLoRA…
- wikiQLoRA
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[484. Что такое ReFT (Representation…
- wikiHugging Face Trainer
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[513. Что такое weak supervision…
- wikilora_alpha
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiDouble Quantization
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiadapter_config.json
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiadapter_model.safetensors
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiDatabricks Dolly 15k
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiLLaMA-2-70B
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikipaged optimizer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikimax_seq_length
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikipage swapping
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiattention projections
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiRTX 4090
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune QLoRA на 1 GPU
…Fine-tune QLoRA на 1 GPU ## 1. Цель задачи Научиться эффективно [[Вики/fine-tuning\|fine-tune]]'ить большие языковые модели…
- wikicausal LM
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiNormalFloat4
# NormalFloat4 ## Определение 4-битный формат квантизации с нормальным распределением, используемый в QLoRA. Минимизирует ошибку квантования для нормально распределённых весов, позволяя…
- wikidevice_map
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiAccelerate
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikibitsandbytes
# bitsandbytes ## Определение Библиотека для быстрой квантизации моделей PyTorch, поддерживающая 4-битные форматы, используется в QLoRA и для снижения потребления памяти…
- wikiLoRA rank
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiCPU offload
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiAutoModelForCausalLM
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiPeak memory
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiTensorBoard
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[269. Реализовать hard negative mining для retrieval…
- answerКакие методы fine-tuning вы знаете и какой используете чаще всего?
…QLoRA (Quantized LoRA) [[Вики/QLoRA\|QLoRA]] — [[Вики/Expansion\|расширение]] [[Вики/LoRA\|LoRA]], где исходная [[Вики/model\|модель]] загружается в 4…
- wikigradient norms
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum…
- wikiSFTTrainer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiAlpaca
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[95. Написать runbook для synthetic…
- wikiParameter-Efficient Fine-Tuning
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[484. Что такое ReFT (Representation…
- wikiGPU memory
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wiki1 GPU
…модели возможно только с использованием методов сжатия, таких как QLoRA. ## Где встречается - [[Практика|Практика]] ## Навигация - [[00. Индекс терминов|Индекс терминов…
- wiki70B model
…Обучение требует распределённых методов, таких как ZeRO-3 и оптимизатор sharding, а fine-tuning возможен с использованием QLoRA на одном…
- answerКакие фреймворки для fine-tuning вы используете?
…GUI не позволяет тонко регулировать параметры обучения (например, scheduler). - QLoRA с bitsandbytes: могут быть проблемы с типом данных (нужна версия…
- wikilearning rate
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[269. Реализовать hard negative mining для retrieval…
- wikiA100
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiAdam optimizer
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[656. Как работает кросс-энтропия…
- wikiLoss
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum…
- wikiInstruction tuning
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[267. Реализовать Evol-Instruct для instruction tuning…
- answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…QLoRA vs LoRA — в чем разница и когда QLoRA лучше\|27]] | Выбор данных для fine-tuning | | [[28. Какие данные нужны…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: LoRA для function calling
…Для моделей 7B потребуется [[Вики/Quantization\|quantization]] ([[Вики/QLoRA\|QLoRA]]). Если нет реального датасета — симулируем: 1. Определить 5-10 функций…
- answerКак fine-tune модель для следования сложным инструкциям?
…Обучаются только они. - [[Вики/QLoRA\|QLoRA]] использует 4-битную квантизацию для ещё большего снижения памяти. - Преимущества: [[Вики/memory savings\|экономия…
- wikiDeepSpeed
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiGSM8K
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[488. Что такое benchmark contamination…
- wikitokenizer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiLlama-3-70B
# Llama-3-70B ## Определение Большая языковая модель с 70 миллиардами параметров, часто обучаемая с QLoRA для fine-tuning. Дешева при…