Поиск
- wikiformat constraints
# format constraints ## Определение Тесты и проверки, гарантирующие соответствие ответа заданному формату (JSON, регулярные выражения, длина и т.д.). ## Где встречается…
- wikiinstruction format
# instruction format ## Определение Формат данных для fine-tuning (система + пользователь + ассистент), критичен для консистентности обучения. Использует шаблоны вроде <|user|>...<|assistant…
- wikiInstruction Formatting
# Instruction Formatting ## Определение Преобразование диалогов в формат инструкция-ответ для fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…
- wikiStructured Format
# Structured Format ## Определение Формат представления данных (например, JSON) для обмена информацией между шагами пайплайна, обеспечивающий структурированность. ## Где встречается - [[800+ вопросов…
- wikidataset format
# dataset format ## Определение Структура данных, определяющая порядок хранения примеров для обучения модели, например для задач function call или instruction tuning…
- wikiAlpaca-format
# Alpaca-format ## Определение Формат представления инструкционных пар с полями instruction, input, output, альтернатива ChatML для малых моделей. ## Где встречается - [[33…
- wikiLm-format-enforcer
# Lm-format-enforcer ## Определение Инструмент для принудительного соблюдения заданного формата (например, JSON или схема) при генерации текста LLM. ## Где встречается…
- wikiDOT format
# DOT format ## Определение Формат описания графов на языке DOT, используемый для экспорта графов ожидания в multi-agent системах (например, для…
- wikiFormat Adherence
# Format Adherence ## Определение Метрика, оценивающая долю ответов агента, строго следующих заданному формату (например, ReAct: Thought/Action/Observation). ## Где встречается - [[53…
- wikiFormat prompt
# Format prompt ## Определение Специализированный промпт или под-агент, отвечающий за приведение ответов к единому стилю и формату. ## Где встречается - [[806…
- wikiTable format
# Table format ## Определение Формат хранения данных, такой как Parquet, с поддержкой транзакций и версионирования; примеры: Delta Lake, Iceberg, Hudi. ## Где…
- wikiformat exploitation
# format exploitation ## Определение Разновидность reward hacking, при которой модель использует форматирование (эмодзи, списки) для получения более высокого вознаграждения, не улучшая…
- wikiStructured table formats
# Structured table formats ## Определение Форматы представления таблиц (Markdown, HTML), сохраняющие структуру при индексации и передаче в LLM для обработки больших…
- wikistructured output format
# structured output format ## Определение Формат вывода модели, при котором результат должен соответствовать определённой схеме (JSON/XML), часто реализуемый через guided…
- wikistyle bias
# style bias ## Определение Склонность модели-оценщика (LLM-as-judge) предпочитать ответы, оформленные в определённом стиле (например, формальном или структурированном), что…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prompt diff
…Реализуйте `formatters.py` — цветной [[Вики/inference\|вывод]] в терминал: ```python from termcolor import colored def format_terminal(diff_text: str…
- wikif-strings
# f-strings ## Определение Синтаксис форматирования строк, встраивающий выражения внутрь строки (например, в Python f"..."). Используется в шаблонизаторах промптов (Jinja2, Handlebars…
- answerКак тестировать промпты на регрессии (prompt regression suite)?
…Типичная классификация: | Категория | Пример | Что проверяем | |---|---|---| | [[Вики/format constraints\|Format constraints]] | «Верни JSON с полями name и score» | Парсится ли…
- wikiGGUF
# GGUF ## Определение Формат квантизации моделей, оптимизированный для инференса на CPU и edge-устройствах (например, через llama.cpp). Поддерживает 2-8…
- wikistructured representation
# structured representation ## Определение Способ кодирования данных с явной структурой (например, JSON), используемый моделью для более сложной обработки и требующий дополнительных…
- wikiIceberg
# Iceberg ## Определение Открытый формат таблиц для больших датасетов, альтернатива Delta Lake с первоклассной поддержкой Flink и Trino. ## Где встречается - [[856…
- wikiblack
# black ## Определение Форматтер Python-кода, автоматически приводящий код к единому стилю, обязательный в проектах для поддержания кодовой базы. ## Где встречается…
- wikiPDF
# PDF ## Определение Формат документов с фиксированным макетом, широко используемый в RAG-системах. Сложность парсинга связана с отсутствием логической структуры, требуются…
- answerКак вы обрабатываете смену форматов документов (legacy + новые форматы)?
…text, "metadata": {"format": "txt"}, "format_version": "1.0"} class PDFParser(DocumentParser): def parse(self, file_path: str) -> Dict[str, Any…
- answerКак организовать data versioning (DVC, LakeFS, Delta Lake)?
…Delta Lake (Databricks) [[Вики/Delta Lake\|Delta Lake]] — это [[Вики/Table format\|табличный формат]] ([[Вики/Table format\|table format]]) с…
- wikiAlpaca
# Alpaca ## Определение Открытый синтетический датасет инструкций (52k примеров), сгенерированных через Self-Instruct, используемый для fine-tuning моделей следования инструкциям. Формат…
- answerКак вы проектируете промпты, которые работают с разными моделями?
…Универсальный формат общения (Chat Template) Лучшая практика — использовать [[Вики/instruction format\|chat template]] — [[Вики/template\|шаблон]], который фреймворк ([[Вики/agent…
- answerКак вы комбинируете несколько языков представления в одном пайплайне?
…Structured Formats для обмена данными **Structured Formats** (JSON, YAML, XML, таблицы) обеспечивают: - Чёткую структуру: поля, типы, вложенность. - Машинную читаемость: легко…
- wikiParquet
# Parquet ## Определение Столбцовый формат хранения данных, эффективный для аналитических запросов; используется для хранения offline признаков, логов и датасетов в ML…
- wikiXML
# XML ## Определение Структурированный формат данных на основе тегов, обеспечивающий явную схему и устраняющий неоднозначность естественного языка. Используется в LLM для…
- answerЧто такое structured output / constrained decoding и зачем это нужно?
…Термины и контекст - **[[Вики/structured output format\|Structured output]]** — [[Вики/LLM inference\|вывод LLM]], который соответствует заранее заданной структуре ([[Вики…
- answerКакие ограничения у language representation design?
…Решение Использовать [[Вики/constrained decoding\|constrained decoding]] (например, библиотеки типа `[[Вики/Lm-format-enforcer\|lm-format-enforcer]]` или `[[Вики/outlines…
- answerКак работает FP8 quantization на H100 (Transformer Engine)?
…common.recipe import Format, DelayedScaling # Рецепт для FP8 с динамическим масштабированием fp8_recipe = DelayedScaling( fp8_format=Format.HYBRID, # E4M3 для…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать FP8 инференс на H100
…Проверить [[Вики/availability\|доступность]] [[Вики/H100\|H100]] ```bash nvidia-smi --query-gpu=name,compute_cap --format=csv # Должно быть "NVIDIA…
- answerЧто такое data contract между сервисами в RAG пайплайне?
…384}, "metadata": { "type": "object", "properties": { "source_url": {"type": "string", "format": "uri"}, "page_number": {"type": "integer", "minimum": 1}, "created_at": {"type…
- answerКак управлять dependency между промптами (один промпт вызывает другой)?
…Зависимости: {} ``` [[Вики/DAG orchestration\|DAG зависимостей]] ``` router_prompt → search_agent_prompt → rewrite_prompt router_prompt → summarise_agent_prompt → format_prompt…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать graceful degradation при отказе vector DB
…Реализовать базовую [[Вики/ingestion\|RAG pipeline]]: - `embed_query` → `vector_store.[[Вики/retrieval\|search]]` → `format_context` → `[[Вики/GPT-4o\|llm]].[[Вики…
- answerПочему LLM-as-Judge может быть biased? Назовите 3 основных bias и как их детектировать.
…range(n_trials): # Оригинальный порядок prompt_original = prompt_template.format(first=pair_a, second=pair_b) winner_original = judge_model…
- answerЧто такое skill libraries для агентов и как их создавать?
…в логах заметили, что [[Вики/AI agents\|агент]] всегда после поиска данных зовёт `format_report`, затем `send_email`. Паттерн `[[Вики…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать документацию промпта
…max tokens\|max_tokens]]: `150` - [[Вики/structured output format\|response_format]]: `json_object` Ожидаемый результат этапа Полный [[Вики/Partition\|раздел…
- answerЧто такое jailbreak taxonomy (полная классификация)?
…каждый из которых дробится на подтипы. --- ## 2. Уровень 1: Format-based атаки (форматные) Атаки, эксплуатирующие неожиданные форматы представления данных или…
- answerЧто такое «prompt as code» (промпты в Git, code review)?
…Always cite sources in the format [1], [2], etc. If the context does not contain the answer, say "I don…
- answerКак работает prompt leakage (кража системного промпта) и как защититься?
…Техническая реализация - В [[Вики/Paged Attention\|vLLM]] или **Text Generation Inference (TGI)** можно переопределить [[Вики/instruction format\|chat template]] так…
- answerКак вы проектируете feature engineering для контекста RAG (кроме текста)?
…0.9} ) prompt = PromptTemplate.from_template( "[Source: {source}, Date: {date}, Authority: {authority}]\n{text}" ) formatted = prompt.format(**doc.metadata, text…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Профилировать GPU utilization падение
…2. **Запустите `[[Вики/nvidia-smi\|nvidia-smi]] --query-gpu=[[Вики/GPU utilization\|utilization.gpu]],[[Вики/Memory\|memory]].used --format=[[Вики…
- answerЧто такое Prompt Registry (каталог промптов с версиями)?
…0 (add few-shot examples) v2.0.0 (change format from JSON to XML) ``` --- ## 4. Хранение и инфраструктура Оптимальная архитектура…
- answerЧто такое reward hacking в RLHF и как его детектировать?
…ответить на этот вопрос» на любой запрос | | [[Вики/format exploitation\|Format exploitation]] | Использование маркдауна, списков, эмодзи, которые reward model считает…
- answerКак вы строите DSL (Domain-Specific Language) для вашей LLM-системы?
…Зачем [[Вики/DSL\|DSL]] в LLM-системе: - [[Вики/structured output format\|Структурированный вывод]]: [[Вики/LLM\|LLM]] генерирует не свободный текст…
- answerНазовите 4 уровня языкового представления по Yang et al. (2026) и объясните разницу?
…Level 1 — Structured formats (JSON, XML, YAML) Характеристики - Данные организованы в ключ-значение, иерархии, списки. - Устраняется амбигуозность за счёт явной…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить NVLink topology для 8× GPU
…Зафиксировать версии драйвера и [[Вики/CUDA\|CUDA]]: ```bash nvidia-smi --query-gpu=name,driver_version,pci.bus_id,index --format…