Поиск

answerКак работает QLoRA (Quantized LoRA) для training?
…насколько QLoRA хуже LoRA? В оригинальной статье [[Вики/QLoRA\|QLoRA]] (Dettmers et al., 2023) показано, что [[Вики/QLoRA\|QLoRA]] с…
answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?
…QLoRA vs LoRA — в чем разница и когда QLoRA лучше? ## Краткий тезис [[Вики/QLoRA\|QLoRA]] — это техника адаптации больших языковых…
wikiMistral-70B
# Mistral-70B ## Определение Mistral-70B — модель с 70 миллиардами параметров, используемая как альтернатива для fine-tuning методом QLoRA. ## Где встречается…
wiki4-bit quantization
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[642. Как вы реализуете KV…
wikiPaged Optimizers
# Paged Optimizers ## Определение Механизм управления памятью состояний оптимизатора через выгрузку на CPU при обучении с ограниченной видеопамятью, применяемый в QLoRA…
wikiQLoRA
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[484. Что такое ReFT (Representation…
wikiHugging Face Trainer
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[513. Что такое weak supervision…
wikilora_alpha
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiDouble Quantization
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiadapter_config.json
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiadapter_model.safetensors
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiDatabricks Dolly 15k
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiLLaMA-2-70B
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikipaged optimizer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikimax_seq_length
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikipage swapping
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiattention projections
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiRTX 4090
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune QLoRA на 1 GPU
…Fine-tune QLoRA на 1 GPU ## 1. Цель задачи Научиться эффективно [[Вики/fine-tuning\|fine-tune]]'ить большие языковые модели…
wikicausal LM
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiNormalFloat4
# NormalFloat4 ## Определение 4-битный формат квантизации с нормальным распределением, используемый в QLoRA. Минимизирует ошибку квантования для нормально распределённых весов, позволяя…
wikidevice_map
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiAccelerate
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikibitsandbytes
# bitsandbytes ## Определение Библиотека для быстрой квантизации моделей PyTorch, поддерживающая 4-битные форматы, используется в QLoRA и для снижения потребления памяти…
wikiLoRA rank
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiCPU offload
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiAutoModelForCausalLM
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiPeak memory
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiTensorBoard
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[269. Реализовать hard negative mining для retrieval…
answerКакие методы fine-tuning вы знаете и какой используете чаще всего?
…QLoRA (Quantized LoRA) [[Вики/QLoRA\|QLoRA]] — [[Вики/Expansion\|расширение]] [[Вики/LoRA\|LoRA]], где исходная [[Вики/model\|модель]] загружается в 4…
wikigradient norms
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum…
wikiSFTTrainer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiAlpaca
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[95. Написать runbook для synthetic…
wikiParameter-Efficient Fine-Tuning
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[484. Что такое ReFT (Representation…
wikiGPU memory
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wiki1 GPU
…модели возможно только с использованием методов сжатия, таких как QLoRA. ## Где встречается - [[Практика|Практика]] ## Навигация - [[00. Индекс терминов|Индекс терминов…
wiki70B model
…Обучение требует распределённых методов, таких как ZeRO-3 и оптимизатор sharding, а fine-tuning возможен с использованием QLoRA на одном…
answerКакие фреймворки для fine-tuning вы используете?
…GUI не позволяет тонко регулировать параметры обучения (например, scheduler). - QLoRA с bitsandbytes: могут быть проблемы с типом данных (нужна версия…
wikilearning rate
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[269. Реализовать hard negative mining для retrieval…
wikiA100
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiAdam optimizer
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[656. Как работает кросс-энтропия…
wikiLoss
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum…
wikiInstruction tuning
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] - [[267. Реализовать Evol-Instruct для instruction tuning…
answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…QLoRA vs LoRA — в чем разница и когда QLoRA лучше\|27]] | Выбор данных для fine-tuning | | [[28. Какие данные нужны…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: LoRA для function calling
…Для моделей 7B потребуется [[Вики/Quantization\|quantization]] ([[Вики/QLoRA\|QLoRA]]). Если нет реального датасета — симулируем: 1. Определить 5-10 функций…
answerКак fine-tune модель для следования сложным инструкциям?
…Обучаются только они. - [[Вики/QLoRA\|QLoRA]] использует 4-битную квантизацию для ещё большего снижения памяти. - Преимущества: [[Вики/memory savings\|экономия…
wikiDeepSpeed
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiGSM8K
…Как работает QLoRA (Quantized LoRA) для training|482. Как работает QLoRA (Quantized LoRA) для training]] - [[488. Что такое benchmark contamination…
wikitokenizer
…Fine-tune QLoRA на 1 GPU|244. Fine-tune QLoRA на 1 GPU]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiLlama-3-70B
# Llama-3-70B ## Определение Большая языковая модель с 70 миллиардами параметров, часто обучаемая с QLoRA для fine-tuning. Дешева при…