Поиск

  • wikinn.Parameter

    # nn.Parameter ## Определение nn.Parameter — класс PyTorch, который позволяет регистрировать тензоры как обучаемые параметры модели, автоматически добавляя их в граф…

  • wikiparameters

    # parameters ## Определение Обучаемые веса модели; их количество определяет вычислительную сложность и требуемую память при обучении и инференсе. ## Где встречается - [[800…

  • wikiDepth scaling without parameters

    # Depth scaling without parameters ## Определение Способ увеличения эффективной глубины модели за счёт рекуррентного применения одного и того же блока, не…

  • wikiBloom filter parameters

    # Bloom filter parameters ## Определение Набор метрик для настройки фильтра Блума: размер битового массива (m), число хэш-функций (k), ожидаемое количество…

  • wikiParameterized query

    # Parameterized query ## Определение Техника формирования запросов к БД, отделяющая пользовательский ввод от кода запроса; защищает от SQL-инъекций. ## Где встречается…

  • wikiProduct Quantization (PQ) parameters

    # Product Quantization (PQ) parameters ## Определение Параметры метода Product Quantization, такие как количество подвекторов (m=32/64) и количество бит на…

  • wiki1B LLM

    # 1B LLM ## Определение Языковая модель с 1 миллиардом параметров, используемая как альтернатива BERT для классификации промптов или в качестве verifier…

  • wikiParameter-Efficient Fine-Tuning

    # Parameter-Efficient Fine-Tuning ## Определение Семейство методов дообучения, при которых обновляется лишь небольшая часть параметров (1–5%) при замороженных остальных…

  • answerЧто такое Tool System в Harness (defineTool, registry, JSON schema validation, rate limiting)?

    …def __init__(self, name, description, parameters_schema, fn, rate_limit): self.name = name self.description = description self.parameters_schema = parameters

  • wikishared layers

    # shared layers ## Определение Слои модели, общие для всех экспертов (например, attention и embeddings), требующие особого размещения при шардировании. ## Где встречается…

  • wikiпараметризованный тест

    # параметризованный тест ## Определение Единичный тест, выполняемый с разными наборами данных (золотыми кейсами) для обеспечения регрессионного тестирования. Позволяет компактно покрыть множество…

  • wiki2PL

    # 2PL ## Определение Модель IRT с параметрами сложности и дискриминативности. ## Где встречается - [[506. Что такое IRT (Item Response Theory) и как…

  • wikimodel weights

    # model weights ## Определение Числовые параметры обученной модели, определяющие её поведение; загружаются в память для выполнения инференса. ## Где встречается - [[431. Почему…

  • wikiпараметризованные тесты

    # параметризованные тесты ## Определение Тесты, которые запускаются с различными наборами входных данных (например, сгенерированных запросов) для проверки поведения системы в разных…

  • wikiугадывание

    # угадывание ## Определение Параметр IRT, нижняя асимптота кривой; вероятность правильного ответа при нулевой способности испытуемого, используется для коррекции оценки LLM. ## Где…

  • wikief

    # ef ## Определение Параметр HNSW, управляющий размером динамического списка кандидатов при поиске. Увеличение ef повышает точность, особенно при пост-фильтрации, но…

  • wikiAffine Transformation

    # Affine Transformation ## Определение Обучаемые параметры γ (gamma) и β (beta), используемые в слоях нормализации, таких как LayerNorm и RMSNorm, для…

  • wiki3PL

    # 3PL ## Определение Модель Item Response Theory (IRT) с тремя параметрами: дискриминативность (a), сложность (b) и вероятность угадывания (c). Используется для…

  • wikiUCB constant C

    # UCB constant C ## Определение Гиперпараметр в алгоритме UCB1, регулирующий баланс между исследованием и эксплуатацией. Используется в tree search для LLM…

  • wikiIA3

    # IA3 ## Определение Метод Parameter-Efficient Fine-Tuning (PEFT), который обучает векторы масштабирования для активаций ключей, значений и слоёв FFN, позволяя…

  • wikiDense model

    # Dense model ## Определение Плотная модель (dense model) — нейронная сеть, в которой все параметры каждого слоя активируются для каждого входа. Противопоставляется…

  • wikiscaling factors

    # scaling factors ## Определение Параметры, используемые Transformer Engine для масштабирования тензоров при конвертации FP16 в FP8, чтобы избежать переполнения. ## Где встречается…

  • wikitruncation

    # truncation ## Определение Truncation — обрезка текста до заданной максимальной длины (max_length) при токенизации или инференсе, используется для управления контекстом и…

  • answerЧто такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете?

    …Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете? ## Краткий тезис **[[Вики/Parameter-Efficient Fine-Tuning\|Parameter

  • wikimargin

    # margin ## Определение Гиперпараметр в Triplet loss, задающий минимальный зазор между сходствами анкора с положительным и отрицательным примерами; обычно 0.5…

  • wikirepetition penalty

    # repetition penalty ## Определение Техника LLM inference, при которой логит уже сгенерированного токена делится на коэффициент больше 1 на каждом шаге…

  • wikiFull fine-tuning

    # Full fine-tuning ## Определение Метод дообучения, при котором обновляются все параметры модели; требует больших вычислительных ресурсов и большого датасета, склонен…

  • answerКак вы переключаете агента между инструментами (function calling) с разными сигнатурами?

    …и как его использовать (важно для семантического выбора) - `[[Вики/parameters\|parameters]]` — [[Вики/JSON schema\|JSON Schema]] объекта, описывающая ожидаемые аргументы…

  • answerЧто такое gradient clipping и зачем он нужен при обучении LLM?

    …Математическая формула norm clipping Реализация на [[Вики/SQL\|Python]] (псевдокод): ```python def clip_grad_norm(parameters, max_norm): total_norm…

  • answerКак работает distributed optimizer в PyTorch (torch.distributed.optim)?

    …optimizer = ZeroRedundancyOptimizer( model.parameters(), optimizer_class=Adam, lr=1e-4, ) else: optimizer = Adam(model.parameters(), lr=1e-4) # Замер памяти…

  • answerКак вы проверяете, что fine-tuned модель не сломала базовые способности?

    …Что такое Parameter-Efficient Fine-Tuning (PEFT) и какие методы вы знаете\|31]] | Как вы боретесь с катастрофическим забыванием при…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать latent reasoning (∇-Reasoner)

    …Возможные сложности и их решение | Сложность | Решение | |-----------|---------| | Градиенты не доходят до residual (разрыв графа) | Убедиться, что residual является `nn.Parameter

  • answerПочему training 70B модели требует optimizer sharding (ZeRO-3)?

    …False } # Инициализация DeepSpeed model_engine, optimizer, _, _ = deepspeed.initialize( model=model, model_parameters=model.parameters(), config_params=ds_config ) # Теперь model…

  • answerКакие фреймворки для fine-tuning вы используете?

    …fine-tuning|Полный fine-tuning (update всех весов) дорог и не всегда нужен. **PEFT (Fine-Tuning|Parameter-Efficient Fine-Tuning…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Создать benchmark для агентов

    …2}}, {"action": "confirm_booking", "parameters": {"email": "user@example.com"}} ], "expected_outcome": "Билет куплен, письмо отправлено", "allowed_actions": ["search_flights", "select…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать протокол A2A с discovery и capability negotiation

    …true/false, "[[Вики/model weights\|parameters]]": {...} }`. 2. Спроектировать эндпоинты для протокола [[Вики/A2A\|A2A]] - `POST /register` – регистрация агента в реестре…

  • answerКак fine-tune модель для следования сложным инструкциям?

    …Инструменты: [[Вики/Hugging Face\|Hugging Face Transformers]], [[Вики/датасеты\|Datasets]], [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]]. **Шаги**: 1. Создать [[Вики…

  • answerКак вы подбираете гиперпараметры для LoRA?

    …что такое LoRA и зачем подбирать гиперпараметры [[Вики/LoRA\|LoRA]] ([[Вики/LoRA\|Low-Rank Adaptation]]) — метод из семейства **[[Вики/Parameter

  • answerКак работает gradient checkpointing в DeepSpeed?

    …2} } model_engine, optimizer, _, _ = deepspeed.initialize( model=model, model_parameters=model.parameters(), config_params=ds_config ) # Обучение for epoch in…

  • answerКак работает QLoRA (Quantized LoRA) для training?

    …Иногда добавляют [[Вики/FFN\|MLP]]. - Библиотеки: [[Вики/Hugging Face\|Hugging Face Transformers]] + [[Вики/4-bit quantization\|bitsandbytes]] + [[Вики/Parameter-Efficient…

  • answerЧто такое loss landscape LLM и как оно влияет на обучение (sharp vs flat minima)?

    …orig_params = [p.clone().detach() for p in model.parameters()] for i, a in enumerate(alphas): for j, b in…

  • answerЧто такое vanishing / exploding gradients в трансформерах и как их предотвратить?

    …Пример кода ```python import torch.nn.utils as utils # Norm clipping (рекомендуемый метод) utils.clip_grad_norm_(model.parameters(), max…

  • wikiTemperature

    # Temperature ## Определение Гиперпараметр LLM, контролирующий случайность генерации: низкие значения (около 0) делают вывод детерминированным, высокие — увеличивают разнообразие и креативность ответов…

  • answerКакие методы fine-tuning вы знаете и какой используете чаще всего?

    …от полного обновления всех весов ([[Вики/Full fine-tuning\|full fine-tuning]]) до параметро-эффективных методов ([[Вики/Parameter-Efficient Fine…

  • answerЧто такое ReFT (Representation Fine-Tuning) и когда он лучше LoRA?

    …LLM. **LoRA (Low-Rank Adaptation)** — метод **PEFT (Fine-Tuning|Parameter-Efficient Fine-Tuning)**, который добавляет к весам модели обучаемые низкоранговые…

  • answerКак работает связь между SGD и Adam? Почему Adam лучше для LLM?

    …SGD(model.parameters(), lr=0.01, momentum=0.9) # Adam (стандартный) optimizer_adam = optim.Adam(model.parameters(), lr=1e-3…

  • answerQLoRA vs LoRA — в чем разница и когда QLoRA лучше?

    …Какие данные нужны для fine-tuning на кастомный стиль общения\|28]] | PEFT (Parameter‑Efficient Fine‑Tuning) — обзор методов | | [[29. Как…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить canary deployment промптов

    …В каждой — [[Вики/required field\|обязательные поля]]: `version`, `system_prompt`, `[[Вики/parameters\|parameters]]` ([[Вики/Temperature\|temperature]], [[Вики/max_tokens\|max…

  • answerКак работает Infini-attention (Google, 2024) для бесконечного контекста?

    …super().__init__() self.segment_size = segment_size self.mem_k = nn.Parameter(torch.zeros(memory_slots, d_model)) self.mem…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune QLoRA на 1 GPU

    …навыки работы с [[Вики/4-bit quantization\|bitsandbytes]], [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]], [[Вики/Hugging Face\|Hugging Face Transformers…