Поиск
- wikiXML/JSON payloads
# XML/JSON payloads ## Определение Вектор атаки на LLM через структурированные данные (XML/JSON), используемый для переопределения поведения модели; часть таксономии…
- wikioutput parsers
# output parsers ## Определение Компонент, извлекающий структурированные данные из ответа LLM, часто используемый в LangChain и агентных циклах. ## Где встречается - [[766…
- answerЧто такое Prompt Injection и как вы защищаетесь?
…нужно предотвращать как прямой перехват управления, так и [[Вики/Prompt injection\|инъекции]] через данные. --- ## 3. Структурированные промпты: разделение инструкций и…
- answerКак вы комбинируете несколько языков представления в одном пайплайне?
…Используется для точных вычислений, манипуляции данными, вызова внешних сервисов. - **[[Вики/XML\|Structured Formats]]** — структурированные данные ([[Вики/JSON\|JSON]], [[Вики/XML…
- answerКак вы обрабатываете большие таблицы в RAG (500+ строк)?
…Большие таблицы в RAG Большие таблицы (500+ строк) – это структурированные данные, где каждая строка – запись с набором полей (колонок). В…
- answerКак вы делаете synthetic data generation для редких классов в датасете?
…наш фокус) [[Вики/GPT-4o\|LLM]] позволяет создавать структурированные и неструктурированные данные (текст, JSON, код) на естественном языке. Преимущества: - Контролируемая…
- answerКак вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)?
…Структурированные данные в контексте RAG Структурированные данные — это данные, организованные по строгой схеме: таблицы с колонками и типами (SQL) или…
- answerКак вы проверяете, что модель действительно использует структуру представления, а не игнорирует ее?
…Вики/Prompt engineering\|инструкция]], а где данные, и смешивает их. - Снижение точности — структурированные данные (например, таблицы) обрабатываются как обычный текст…
- answerЧто такое Coordination Engineering и чем он отличается от Harness Engineering?
…агент-аналитик отправляет агенту-резюмеру структурированные факты 2. [[Вики/task allocation\|Распределение задач]] - Статическое ([[Вики/Roles\|роли]] закреплены) vs **динамическое…
- answerКак организовать streaming feature pipelines для real-time RAG?
…это набор этапов, которые преобразуют сырые данные ([[Вики/logs\|логи]], клики) в структурированные признаки, используемые моделью или поисковым движком. В…
- answerЧто такое «chaos testing» для агента (внезапно API вернул ошибку)?
…продуктивные данные. - Автоматизируйте: запускайте набор сценариев в CI, чтобы каждое изменение кода проходило проверку. - Используйте мониторинг: логирование (структурированные логи), трейсинг…
- answerЧто такое LayoutLMv3 и зачем он для document understanding?
…поиск\|RAG]] он превращает неструктурированные [[Вики/PDF\|PDF]] в структурированные данные, пригодные для точного поиска. --- ## 1. Термин: Document Understanding (DU…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический postmortem
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Время начала и конца инцидента (ISO 8601) | Из системы оповещений (PagerDuty, Opsgenie) — симулировать | | Логи…
- answerКак вы логируете и дебажите многошаговые агенты?
…пригодиться** — входные данные, выходные, метаданные, время, ошибки. Лучше потом отфильтровать лишнее, чем не иметь нужного. 2. Используйте структурированные форматы (JSON…
- answerПочему естественный язык не подходит для сложного рассуждения?
…вызывать API, обрабатывать данные, принимать решения. Сравнение - **[[Вики/Formal language\|Формальный язык]] ([[Вики/SQL\|Python]]):** `if [[Вики/Temperature\|temperature]] > 30…
- answerКак тестировать delegation paths (интеграционное тестирование multi-agent)?
…router = RouterAgent() response = await router.delegate("запрос") assert response == "извлечённые данные" mock_data_agent.assert_awaited_once_with("запрос") ``` Ключевые…
- answerЧто такое Layout-Aware Chunking и как он связан с мультимодальностью?
…сканы, веб-страницы) не только чистый текст, но и структурированные данные, которые затем могут быть заиндексированы вместе с визуальными элементами…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить monitoring delegation
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Система делегирования (реальная или симулированная) | Существующий multi-agent pipeline (например, на базе LangGraph/AutoGen…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать streaming с SSE в FastAPI для меж-агентной коммуникации
…Структурированные данные | 1 час | | Этап 3: Измерение и оптимизация TTFT | 1 час | | Этап 4: Обработка отключений | 30 мин | | Этап 5…
- answerЧто такое sidecar pattern для LLM observability и как его реализовать?
…promtail-config ``` Плюсы простота, не требует изменения кода, если приложение уже пишет структурированные [[Вики/logs\|логи]]. Минусы не перехватывает трафик…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический postmortem
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Время начала и окончания инцидента | Система алертинга (Alertmanager), PagerDuty или ручной ввод | | Логи всех…
- answerЧто такое sidecar pattern для LLM observability и как его реализовать?
…токены) и отправляет данные в внешние системы (Prometheus, Elasticsearch, Jaeger). Компоненты observability - **Логирование**: sidecar пишет структурированные логи (JSON) в stdout…
- answerКак работают agent swarms (рой агентов)?
…могут извлечь структурированные данные из [[Вики/HTML\|HTML]]. - [[Вики/orchestration\|Координация]]: скрапер скачивает страницу, публикует ссылку на сырой контент в…
- answerКак Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)?
…Эти данные можно экспортировать в [[Вики/OpenTelemetry collector\|OpenTelemetry Collector]] или напрямую в [[Вики/LangSmith\|LangSmith]]. --- ## 5. CostTracker: учёт токенов…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать runbook для агента
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Развёрнутая система с AI-агентом (например, ReAct / LangGraph / CrewAI) | Пет-проект, существующее production-окружение…
- answerКакие типы задач требуют Level 3 представления (scientific formalization)?
…PDF-отчёт | | Level 2 | [[Вики/Structured Format\|Structured data]] (структурированные данные) | Таблицы, JSON, графы знаний, ключ-значение | База данных сотрудников…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Полный production агент
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | LLM API (OpenAI, Anthropic, или локальная модель) | Личный ключ API или развёрнутая локальная модель…
- answerКогда DSPy *не* подходит? Назовите 3 сценария.
…Как и любой алгоритм обучения, ему нужны размеченные данные. Минимальный размер датасета — обычно 50–200 примеров. Если данных меньше, оптимизаторы…
- answerЧто такое «agentic mesh» (сеть взаимодействующих агентов) и как вы его дебажите?
…для повторения бага нужно точно знать все входные данные и [[Вики/state\|состояние]] всех агентов. - Отсутствие единого стека вызовов: нельзя…
- answerЧто такое agent state management (состояние агента между вызовами)?
…Как работает multi-agent with role specialization (агенты-эксперты в разных доменах)\|590]] | Безопасность агентов — конфиденциальные данные в состоянии | | [[591…
- answerЧто такое «Schema-Activated In-Context Learning» (SA-ICL)?
…Вы увидите, что [[Вики/Schema-Activated In-Context Learning\|SA-ICL]] даёт меньше ошибок и более структурированные ответы. --- ## Связь с…
- answerКак вы делаете streaming в production с учетом network limitations?
…использовать структурированные чанки (JSON), где указан тип (thought, tool_call, tool_result, token). - [[Вики/state management\|Управление состоянием]]: клиент должен…
- answerЧто такое prompt caching у провайдеров (Anthropic, Google) и как его использовать?
…Стратегии использования prompt caching ### 5.1 Структурированные системные промпты Самый частый [[Вики/Scenario\|сценарий]]: длинный [[Вики/промпт агента\|системный промпт…
- answerКак вы решаете проблему “я знаю, что ответ есть в документах, но retrieval не находит”?
…HR низкий | | **Metadata Filtering** | Средняя | Высокая | Низкая | Если есть структурированные данные | | [[Вики/HyDE\|HyDE]] | Высокая | Высокая | Высокая | Если простые методы…
- answerКак вы переключаете агента между инструментами (function calling) с разными сигнатурами?
…Обработка ошибок при вызове Даже после валидации возможны ошибки выполнения (инструмент недоступен, неверные данные). Агент должен уметь: - Повторная генерация если…
- answerКак вы fine-tune модель для функции "вызов внешнего API"?
…API\|API]] — это [[Вики/training\|обучение]] языковой модели генерировать структурированные вызовы функций ([[Вики/OpenAI Functions\|function]] calls]]) вместо обычного текстового…
- answerКак вы проектируете API для внешних систем, использующих вашу LLM?
…входящие запросы (без чувствительных данных!) с ID запроса. - Использовать структурированные логи (JSON). Пример: ```json {"timestamp": "...", "request_id": "abc123", "method": "POST…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать роутер запросов между Groq и GPT-4 с делегированием по сложности
…Исходные данные | Что нужно | Откуда взять | |-----------|--------------| | Датасет запросов, размеченный по сложности (простые / сложные) | Сгенерировать самостоятельно (см. ниже) или взять открытые…
- answerКак вы разворачиваете LLM в production (self-hosted)?
…requests` | | Number of active requests | Текущие батчи | vLLM | **Логирование:** структурированные логи (JSON) через [[Вики/Splunk\|ELK]] или [[Вики/Loki\|Loki…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Какие данные нужны для fine-tuning на кастомный стиль общения?** **Структура ответа:** 1. **Формат инструкции:** система + пользователь + ассистент 2. **Данные…