Поиск
- wikisynthetic evaluation
# synthetic evaluation ## Определение Метод автоматической генерации тестовых вопросов и эталонных ответов с помощью LLM для оценки RAG-систем или агентов…
- wikisynthetic eval datasets
# synthetic eval datasets ## Определение Синтетически созданные наборы данных для оценки производительности agentic workflows, имитирующие реальное взаимодействие пользователя с агентом. ## Где…
- wikisynthetic eval collapse
# synthetic eval collapse ## Определение Деградация качества оценки модели, когда синтетические тестовые данные перестают отражать реальное распределение задач, что приводит к…
- wikiHybrid eval-set
…Что такое synthetic eval collapse и как его предотвратить|494. Что такое synthetic eval collapse и как его предотвратить]] ## Навигация…
- wikiSynthetic dataset
…Что такое synthetic eval collapse и как его предотвратить|494. Что такое synthetic eval collapse и как его предотвратить]] - [[514…
- wikieval set
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiAgent-Eval
# Agent-Eval ## Определение Фреймворк от Microsoft для генерации eval-кейсов на основе спецификации агента. ## Где встречается - [[875. Как делать synthetic…
- wikisynthetic generation
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikievaluation leakage
…Что такое synthetic eval collapse и как его предотвратить|494. Что такое synthetic eval collapse и как его предотвратить]] ## Навигация…
- wikiRAG evaluation
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiOpenAI Evals
# OpenAI Evals ## Определение Набор стандартизированных бенчмарков и фреймворк для создания кастомных бенчмарков с поддержкой LLM-судей, используется для оценки качества…
- wikiHallucination detection
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)|687. Как вы делаете synthetic eval (генерация тестовых вопросов по…
- wikiJSONL
…Сгенерировать synthetic датасет для RAG|266. Сгенерировать synthetic датасет для RAG]] - [[271. Реализовать synthetic eval для агента|271. Реализовать synthetic…
- wikiEvol-Instruct
…Как работает synthetic data для RLHF (предпочтения)]] - [[866. Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты…
- wikitask templates
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikiseed examples
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikistate-action-next state
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikidiversity
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)|687. Как вы делаете synthetic eval (генерация тестовых вопросов по…
- wikicoverage
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)|687. Как вы делаете synthetic eval (генерация тестовых вопросов по…
- wikiinstructor
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikigenerator
…Сгенерировать synthetic датасет для RAG|266. Сгенерировать synthetic датасет для RAG]] - [[279. Настроить adversarial evaluation для RAG|279. Настроить adversarial…
- wikiOpenAI SDK
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikinext step accuracy
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikiутечка данных
…Что такое synthetic eval collapse и как его предотвратить|494. Что такое synthetic eval collapse и как его предотвратить]] - [[498…
- wikiagent specification
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- answerКак вы делаете synthetic eval (генерация тестовых вопросов по документам)?
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)? ## Краткий тезис [[Вики/synthetic evaluation\|Synthetic eval]] — это автоматическая [[Вики…
- wikiexpected trajectory
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…
- answerЧто такое synthetic eval collapse и как его предотвратить?
…Что такое synthetic eval collapse и как его предотвратить? ## Краткий тезис [[Вики/synthetic eval collapse\|Synthetic eval collapse]] — это [[Вики…
- wikiState space exploration
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…
- wikitask taxonomy
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…
- wikiNLTK
…Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)|693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)]] - [[95…
- wikitrajectory accuracy
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[65. Реализовать process…
- wikigeneration
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[875. Как делать synthetic eval…
- wikicoverage-driven generation
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikiagentic workflows
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…
- wikisource
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikioutput parsers
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiHuman evaluation
…Как вы делаете synthetic data generation для редких классов в датасете]] - [[578. Что такое agent evaluation метрика successful task completion…
- wikinegative transfer
…Что такое synthetic eval collapse и как его предотвратить|494. Что такое synthetic eval collapse и как его предотвратить]] - [[582…
- wikiGoogle Calendar API
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[Практика|Практика]] - [[297…
- wikiArgilla
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[333. Что такое…
- wikiAdversarial generation
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)|687. Как вы делаете synthetic eval (генерация тестовых вопросов по…
- wikiдатасеты
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[352. Что такое…
- wikiParquet
…Сгенерировать synthetic датасет для RAG|266. Сгенерировать synthetic датасет для RAG]] - [[271. Реализовать synthetic eval для агента|271. Реализовать synthetic…
- wikibreadth-first traversal
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[893. Как работает…
- wikiтраектория агента
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiAPI call
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[Практика|Практика]] - [[800…
- wikibias
…Как вы делаете synthetic eval (генерация тестовых вопросов по документам)|687. Как вы делаете synthetic eval (генерация тестовых вопросов по…
- wikiOpenAI Functions
…Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiConsensus
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[Практика|Практика]] - [[800…