Поиск

  • wikiformat constraints

    # format constraints ## Определение Тесты и проверки, гарантирующие соответствие ответа заданному формату (JSON, регулярные выражения, длина и т.д.). ## Где встречается…

  • wikiinstruction format

    # instruction format ## Определение Формат данных для fine-tuning (система + пользователь + ассистент), критичен для консистентности обучения. Использует шаблоны вроде <|user|>...<|assistant…

  • wikiInstruction Formatting

    # Instruction Formatting ## Определение Преобразование диалогов в формат инструкция-ответ для fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…

  • wikiStructured Format

    # Structured Format ## Определение Формат представления данных (например, JSON) для обмена информацией между шагами пайплайна, обеспечивающий структурированность. ## Где встречается - [[800+ вопросов…

  • wikidataset format

    # dataset format ## Определение Структура данных, определяющая порядок хранения примеров для обучения модели, например для задач function call или instruction tuning…

  • wikiAlpaca-format

    # Alpaca-format ## Определение Формат представления инструкционных пар с полями instruction, input, output, альтернатива ChatML для малых моделей. ## Где встречается - [[33…

  • wikiLm-format-enforcer

    # Lm-format-enforcer ## Определение Инструмент для принудительного соблюдения заданного формата (например, JSON или схема) при генерации текста LLM. ## Где встречается…

  • wikiDOT format

    # DOT format ## Определение Формат описания графов на языке DOT, используемый для экспорта графов ожидания в multi-agent системах (например, для…

  • wikiFormat Adherence

    # Format Adherence ## Определение Метрика, оценивающая долю ответов агента, строго следующих заданному формату (например, ReAct: Thought/Action/Observation). ## Где встречается - [[53…

  • wikiFormat prompt

    # Format prompt ## Определение Специализированный промпт или под-агент, отвечающий за приведение ответов к единому стилю и формату. ## Где встречается - [[806…

  • wikiTable format

    # Table format ## Определение Формат хранения данных, такой как Parquet, с поддержкой транзакций и версионирования; примеры: Delta Lake, Iceberg, Hudi. ## Где…

  • wikiformat exploitation

    # format exploitation ## Определение Разновидность reward hacking, при которой модель использует форматирование (эмодзи, списки) для получения более высокого вознаграждения, не улучшая…

  • wikiStructured table formats

    # Structured table formats ## Определение Форматы представления таблиц (Markdown, HTML), сохраняющие структуру при индексации и передаче в LLM для обработки больших…

  • wikistructured output format

    # structured output format ## Определение Формат вывода модели, при котором результат должен соответствовать определённой схеме (JSON/XML), часто реализуемый через guided…

  • wikistyle bias

    # style bias ## Определение Склонность модели-оценщика (LLM-as-judge) предпочитать ответы, оформленные в определённом стиле (например, формальном или структурированном), что…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prompt diff

    …Реализуйте `formatters.py` — цветной [[Вики/inference\|вывод]] в терминал: ```python from termcolor import colored def format_terminal(diff_text: str…

  • wikif-strings

    # f-strings ## Определение Синтаксис форматирования строк, встраивающий выражения внутрь строки (например, в Python f"..."). Используется в шаблонизаторах промптов (Jinja2, Handlebars…

  • answerКак тестировать промпты на регрессии (prompt regression suite)?

    …Типичная классификация: | Категория | Пример | Что проверяем | |---|---|---| | [[Вики/format constraints\|Format constraints]] | «Верни JSON с полями name и score» | Парсится ли…

  • wikiGGUF

    # GGUF ## Определение Формат квантизации моделей, оптимизированный для инференса на CPU и edge-устройствах (например, через llama.cpp). Поддерживает 2-8…

  • wikistructured representation

    # structured representation ## Определение Способ кодирования данных с явной структурой (например, JSON), используемый моделью для более сложной обработки и требующий дополнительных…

  • wikiIceberg

    # Iceberg ## Определение Открытый формат таблиц для больших датасетов, альтернатива Delta Lake с первоклассной поддержкой Flink и Trino. ## Где встречается - [[856…

  • wikiblack

    # black ## Определение Форматтер Python-кода, автоматически приводящий код к единому стилю, обязательный в проектах для поддержания кодовой базы. ## Где встречается…

  • wikiPDF

    # PDF ## Определение Формат документов с фиксированным макетом, широко используемый в RAG-системах. Сложность парсинга связана с отсутствием логической структуры, требуются…

  • answerКак вы обрабатываете смену форматов документов (legacy + новые форматы)?

    …text, "metadata": {"format": "txt"}, "format_version": "1.0"} class PDFParser(DocumentParser): def parse(self, file_path: str) -> Dict[str, Any…

  • answerКак организовать data versioning (DVC, LakeFS, Delta Lake)?

    …Delta Lake (Databricks) [[Вики/Delta Lake\|Delta Lake]] — это [[Вики/Table format\|табличный формат]] ([[Вики/Table format\|table format]]) с…

  • wikiAlpaca

    # Alpaca ## Определение Открытый синтетический датасет инструкций (52k примеров), сгенерированных через Self-Instruct, используемый для fine-tuning моделей следования инструкциям. Формат…

  • answerКак вы проектируете промпты, которые работают с разными моделями?

    …Универсальный формат общения (Chat Template) Лучшая практика — использовать [[Вики/instruction format\|chat template]] — [[Вики/template\|шаблон]], который фреймворк ([[Вики/agent…

  • answerКак вы комбинируете несколько языков представления в одном пайплайне?

    …Structured Formats для обмена данными **Structured Formats** (JSON, YAML, XML, таблицы) обеспечивают: - Чёткую структуру: поля, типы, вложенность. - Машинную читаемость: легко…

  • wikiParquet

    # Parquet ## Определение Столбцовый формат хранения данных, эффективный для аналитических запросов; используется для хранения offline признаков, логов и датасетов в ML…

  • wikiXML

    # XML ## Определение Структурированный формат данных на основе тегов, обеспечивающий явную схему и устраняющий неоднозначность естественного языка. Используется в LLM для…

  • answerЧто такое structured output / constrained decoding и зачем это нужно?

    …Термины и контекст - **[[Вики/structured output format\|Structured output]]** — [[Вики/LLM inference\|вывод LLM]], который соответствует заранее заданной структуре ([[Вики…

  • answerКакие ограничения у language representation design?

    …Решение Использовать [[Вики/constrained decoding\|constrained decoding]] (например, библиотеки типа `[[Вики/Lm-format-enforcer\|lm-format-enforcer]]` или `[[Вики/outlines…

  • answerКак работает FP8 quantization на H100 (Transformer Engine)?

    …common.recipe import Format, DelayedScaling # Рецепт для FP8 с динамическим масштабированием fp8_recipe = DelayedScaling( fp8_format=Format.HYBRID, # E4M3 для…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать FP8 инференс на H100

    …Проверить [[Вики/availability\|доступность]] [[Вики/H100\|H100]] ```bash nvidia-smi --query-gpu=name,compute_cap --format=csv # Должно быть "NVIDIA…

  • answerЧто такое data contract между сервисами в RAG пайплайне?

    …384}, "metadata": { "type": "object", "properties": { "source_url": {"type": "string", "format": "uri"}, "page_number": {"type": "integer", "minimum": 1}, "created_at": {"type…

  • answerКак управлять dependency между промптами (один промпт вызывает другой)?

    …Зависимости: {} ``` [[Вики/DAG orchestration\|DAG зависимостей]] ``` router_prompt → search_agent_prompt → rewrite_prompt router_prompt → summarise_agent_prompt → format_prompt…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать graceful degradation при отказе vector DB

    …Реализовать базовую [[Вики/ingestion\|RAG pipeline]]: - `embed_query` → `vector_store.[[Вики/retrieval\|search]]` → `format_context` → `[[Вики/GPT-4o\|llm]].[[Вики…

  • answerПочему LLM-as-Judge может быть biased? Назовите 3 основных bias и как их детектировать.

    …range(n_trials): # Оригинальный порядок prompt_original = prompt_template.format(first=pair_a, second=pair_b) winner_original = judge_model…

  • answerЧто такое skill libraries для агентов и как их создавать?

    …в логах заметили, что [[Вики/AI agents\|агент]] всегда после поиска данных зовёт `format_report`, затем `send_email`. Паттерн `[[Вики…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать документацию промпта

    …max tokens\|max_tokens]]: `150` - [[Вики/structured output format\|response_format]]: `json_object` Ожидаемый результат этапа Полный [[Вики/Partition\|раздел…

  • answerЧто такое jailbreak taxonomy (полная классификация)?

    …каждый из которых дробится на подтипы. --- ## 2. Уровень 1: Format-based атаки (форматные) Атаки, эксплуатирующие неожиданные форматы представления данных или…

  • answerЧто такое «prompt as code» (промпты в Git, code review)?

    …Always cite sources in the format [1], [2], etc. If the context does not contain the answer, say "I don…

  • answerКак работает prompt leakage (кража системного промпта) и как защититься?

    …Техническая реализация - В [[Вики/Paged Attention\|vLLM]] или **Text Generation Inference (TGI)** можно переопределить [[Вики/instruction format\|chat template]] так…

  • answerКак вы проектируете feature engineering для контекста RAG (кроме текста)?

    …0.9} ) prompt = PromptTemplate.from_template( "[Source: {source}, Date: {date}, Authority: {authority}]\n{text}" ) formatted = prompt.format(**doc.metadata, text…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Профилировать GPU utilization падение

    …2. **Запустите `[[Вики/nvidia-smi\|nvidia-smi]] --query-gpu=[[Вики/GPU utilization\|utilization.gpu]],[[Вики/Memory\|memory]].used --format=[[Вики…

  • answerЧто такое Prompt Registry (каталог промптов с версиями)?

    …0 (add few-shot examples) v2.0.0 (change format from JSON to XML) ``` --- ## 4. Хранение и инфраструктура Оптимальная архитектура…

  • answerЧто такое reward hacking в RLHF и как его детектировать?

    …ответить на этот вопрос» на любой запрос | | [[Вики/format exploitation\|Format exploitation]] | Использование маркдауна, списков, эмодзи, которые reward model считает…

  • answerКак вы строите DSL (Domain-Specific Language) для вашей LLM-системы?

    …Зачем [[Вики/DSL\|DSL]] в LLM-системе: - [[Вики/structured output format\|Структурированный вывод]]: [[Вики/LLM\|LLM]] генерирует не свободный текст…

  • answerНазовите 4 уровня языкового представления по Yang et al. (2026) и объясните разницу?

    …Level 1 — Structured formats (JSON, XML, YAML) Характеристики - Данные организованы в ключ-значение, иерархии, списки. - Устраняется амбигуозность за счёт явной…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить NVLink topology для 8× GPU

    …Зафиксировать версии драйвера и [[Вики/CUDA\|CUDA]]: ```bash nvidia-smi --query-gpu=name,driver_version,pci.bus_id,index --format