Поиск

  • wikisynthetic eval datasets

    # synthetic eval datasets ## Определение Синтетически созданные наборы данных для оценки производительности agentic workflows, имитирующие реальное взаимодействие пользователя с агентом. ## Где…

  • wikidataset

    # dataset ## Определение Коллекция примеров (например, пар инструкция-ответ) для обучения или оценки модели. ## Где встречается - [[38. Как вы fine-tune…

  • wikiHuggingFace dataset

    # HuggingFace dataset ## Определение Формат и источник датасетов на Hugging Face Hub, используемый для загрузки и обработки данных при fine-tuning…

  • wikiGoldenset

    …Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…

  • wikiTraining dataset

    # Training dataset ## Определение Снапшот данных на конкретную дату, создаваемый из feature groups с point-in-time join в Hopsworks. ## Где…

  • wikiдатасеты

    # датасеты ## Определение Наборы данных (например, из Hugging Face Datasets), используемые для регрессионного тестирования, загрузки, обработки и fine-tuning LLM. ## Где…

  • wikiGoogle C4 dataset

    # Google C4 dataset ## Определение Крупный публичный датасет, полученный очисткой веб-корпуса Common Crawl. Применяется для претренировки LLM и проверки перекрытия…

  • wikidataset diversity

    # dataset diversity ## Определение Мера разнообразия примеров в датасете, используемая как целевая метрика при генерации синтетических данных или оценке качества выборки…

  • wikiannotator

    # annotator ## Определение Человек, создающий эталонные размеченные данные (например, траектории для golden dataset). ## Где встречается - [[146. Реализовать golden dataset для агента…

  • wikidataset format

    # dataset format ## Определение Структура данных, определяющая порядок хранения примеров для обучения модели, например для задач function call или instruction tuning…

  • wikiPG-19 dataset

    # PG-19 dataset ## Определение Тестовый датасет длинных контекстов: PG-19 ## Где встречается - [[51. Развернуть Mamba-2 локально|51. Развернуть Mamba…

  • wikiallowed variations

    # allowed variations ## Определение Разрешение нескольких альтернативных правильных траекторий (путей) для одного запроса в golden dataset при оценке агентов. ## Где встречается…

  • wikiVisual Prompt Injection Dataset

    # Visual Prompt Injection Dataset ## Определение Датасет, содержащий примеры визуальных промпт-инъекций для тестирования защитных механизмов VL-моделей. ## Где встречается - [[621…

  • wikifailure cases

    # failure cases ## Определение Примеры ошибочных сценариев (негативные примеры), добавляемые в golden dataset для проверки устойчивости системы к ошибкам. ## Где встречается…

  • wikiComparison Dataset

    # Comparison Dataset ## Определение Датасет, содержащий тройки (prompt, ответ_A, ответ_B, метка), используемый для обучения модели вознаграждения (reward model) на…

  • wikicalibration dataset

    # calibration dataset ## Определение Небольшой набор данных (обычно 128–1024 примера), используемый для подбора параметров квантизации (GPTQ, AWQ) с целью минимизации…

  • wikiproduction logs

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikiGolden path

    # Golden path ## Определение Минимально необходимая последовательность действий агента для правильного ответа, фиксируемая в golden dataset для оценки path coverage и…

  • wikiData versioning

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] - [[800+ вопросов|800+ вопросов]] - [[57…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Конвертировать датасет из JSONL в Parquet

    …Ожидаемый результат Основной артефакт Репозиторий (или папка) со следующими файлами: - `[[Вики/dataset\|dataset]].[[Вики/JSONL\|jsonl]]` — исходный [[Вики/dataset\|датасет…

  • wikiLabel Studio

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] - [[146. Реализовать golden dataset для…

  • answerЧто такое «golden dataset» для агента и как его создавать?

    …Что такое «golden dataset» для агента и как его создавать? ## Краткий тезис **[[Вики/Goldenset\|Golden dataset]]** для агента — это размеченный…

  • wikisemantic comparison

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiagreement matrix

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikistep embeddings

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiannotator calibration

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiraw trajectory

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiAgent-Eval

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikibinary metric

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiCUAD

    # CUAD ## Определение CUAD (Contract Understanding Atticus Dataset) — открытый датасет размеченных юридических договоров, предназначенный для задач понимания контрактов. ## Где встречается - [[298…

  • wikisequence alignment

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiinstructor

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • answerКак проектировать golden dataset для agent evaluation?

    …Golden dataset (золотой стандарт) **[[Вики/Goldenset\|Golden dataset]]** — это вручную или полуавтоматически размеченный [[Вики/dataset\|набор данных]], который считается истиной…

  • wikiAction F1

    …Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…

  • wikipairwise agreement

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiNo-leakage

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiClass balance

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiOpenAI SDK

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikinext step accuracy

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikiTrajectory Exact Match

    …Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…

  • wikiFinal Answer Match

    …Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…

  • wikiStep accuracy

    …Как проектировать golden dataset для agent evaluation|880. Как проектировать golden dataset для agent evaluation]] - [[65. Реализовать process reward model…

  • wikiexpected trajectory

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…

  • wikitask templates

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikiConflict resolution

    …Реализовать golden dataset для агента|146. Реализовать golden dataset для агента]] - [[293. Настроить conflict resolution между агентами|293. Настроить conflict…

  • wikiJSONL

    …Что такое «golden dataset» для агента и как его создавать|786. Что такое «golden dataset» для агента и как его…

  • wikiState space exploration

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…

  • wikitrajectory accuracy

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[65. Реализовать process…

  • wikicoverage-driven generation

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • answerКак вы комбинируете реальные и синтетические данные для максимального качества?

    …Пример кода на [[Вики/SQL\|Python]] для смешивания батчей: ```python from datasets import Dataset, interleave_datasets import torch from torch…