Поиск

wikiRAG evaluation
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
wikiEvol-Instruct
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[Практика|Практика]] - [[800+ вопросов|800…
wikitorchvision
# torchvision ## Определение Библиотека PyTorch для работы с изображениями, предоставляющая датасеты, трансформации и предобученные модели. ## Где встречается - [[273. Реализовать curriculum learning…
wikiALCE
# ALCE ## Определение Бенчмарк для оценки long-form ответов с цитированием, включающий метрики faithfulness на уровне фактов (датасеты ASQA, QAMPARI). ## Где…
wikiGiskard
# Giskard ## Определение Фреймворк для тестирования LLM-приложений, включающий встроенные тесты на устойчивость к adversarial атакам и датасеты инъекций. ## Где встречается…
wikigeneration
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[875. Как делать synthetic eval…
wikiдатасеты
# датасеты ## Определение Наборы данных (например, из Hugging Face Datasets), используемые для регрессионного тестирования, загрузки, обработки и fine-tuning LLM. ## Где…
wikidata programming
…Позволяет быстро генерировать размеченные датасеты без ручной разметки. ## Где встречается - [[513. Что такое weak supervision для разметки данных для fine…
wikicoverage
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[880. Как проектировать golden dataset…
wikiProdigy
…Позволяет быстро создавать размеченные датасеты, используя итеративный подход с участием человека. ## Где встречается - [[341. Как вы проектируете бенчмарк для нового…
wikiSupply Chain
# Supply Chain ## Определение Уязвимости в цепочке поставок ML-компонентов, включая библиотеки, предобученные модели и датасеты. Компрометация любого звена может привести…
wikidiversity
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[800+ вопросов|800+ вопросов]] - [[95…
wikioff-policy
…из политики, отличной от текущей, что позволяет использовать статические датасеты без онлайн-взаимодействия. ## Где встречается - [[36. Что такое DPO (Direct…
wikiMulti-step reasoning
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[879. Как делать evaluation для…
answerLangSmith — зачем и как используете?
…Она обеспечивает сквозную [[Вики/мониторинг\|наблюдаемость]] ([[Вики/мониторинг\|observability]]) цепочек вызовов, позволяет создавать [[Вики/датасеты\|датасеты]] для регрессионного тестирования, проводить…
wikiShareGPT / OpenAssistant / Dolly
# ShareGPT / OpenAssistant / Dolly ## Определение Открытые датасеты диалогов и инструкций, используемые для fine-tuning и оценки моделей (например, instruction tuning и…
wikiadversarial input
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[868. Что такое red teaming…
answerКак вы генерируете синтетический датасет для instruction tuning? Self-instruct, Evol-Instruct?
…Как вы генерируете синтетический датасет для instruction tuning? Self-instruct, Evol-Instruct? ## Краткий тезис Синтетические [[Вики/датасеты\|датасеты]] для [[Вики…
wikiTextAttack
…Включает встроенные методы атак (TextFooler, HotFlip и др.) и датасеты для оценки robustness. ## Где встречается - [[34. Какая у вас была…
answerКак генерировать synthetic датасеты для RAG evaluation?
…Как генерировать synthetic датасеты для RAG evaluation? ## Краткий тезис Синтетические [[Вики/датасеты\|датасеты]] ([[Вики/Synthetic dataset\|synthetic]] [[Вики/датасеты\|datasets…
wikiData augmentation
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[Практика|Практика]] - [[800+ вопросов|800…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить архитектуры на reasoning задачах (Mamba vs Transformer vs RWKV vs Hyena)
…Загрузить [[Вики/датасеты\|датасеты]]: ```python from datasets import load_dataset gsm8k = load_dataset("openai/gsm8k", "main", split="test") math = load…
wikiSynthetic dataset
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[Практика|Практика]] - [[800+ вопросов|800…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка AWQ квантизации для LLM
…Загрузить [[Вики/датасеты\|датасеты]] (калибровочный и для оценки): ```python from datasets import load_dataset calib_dataset = load_dataset("c4", "en…
answerКак вы делаете synthetic data для сложного рассуждения (math, code)?
…Эти методы позволяют получать большие размеченные [[Вики/датасеты\|датасеты]] без ручной аннотации, что критически важно для обучения агентов, способных к…
wikidata drift
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[800+ вопросов|800+ вопросов]] - [[68…
wikigold standard
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[875. Как делать synthetic eval…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить GPTQ vs AWQ на reasoning задачах
…Ожидаемый результат этапа Рабочее окружение, скачанная [[Вики/model\|модель]] и [[Вики/датасеты\|датасеты]], выполнены baseline-замеры [[Вики/Quantization\|full-precision…
answerКак вы тестируете robustness LLM к adversarial input (не только injection)?
…Датасеты и бенчмарки Для стандартизации тестирования существуют специализированные наборы: - [[Вики/AdvGLUE\|AdvGLUE]] — [[Вики/Adversarial generation\|adversarial]] версия [[Вики/GLUE\|GLUE…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune embedding для юридического домена
…Исходные данные | Что нужно | Откуда взять | |---|---| | 5000 договоров (юридический домен, RU/EN) | Открытые датасеты: CUAD (Contrat Understanding Atticus Dataset), российские…
wikiSelf-reflection
…Как генерировать synthetic датасеты для RAG evaluation|866. Как генерировать synthetic датасеты для RAG evaluation]] - [[870. Как работает LLM-as…
answerКак вы делаете synthetic data для редких языков (не английский)?
…перевод вопроса на башкирский print(translate("What is the capital of France?")) ``` Плюсы - Быстро, масштабируемо. - Использует проверенные англоязычные [[Вики/датасеты…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Fine-tune LoRA для стиля
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Фреймворк дообучения | `transformers`, `peft`, `trl` | LoRA, обучение, PPO/SFT | | Датасеты | `datasets` | Загрузка, обработка, разделение | | Оптимизация…
answerКак делать synthetic eval datasets для agentic workflows?
…Зачем нужны синтетические датасеты для agentic workflows Обычный RAG-пайплайн (retrieval + generation) оценивается статическими парами вопрос–ответ. В **agentic workflow…
answerКак интегрировать тестирование агентов в CI/CD?
…Инструменты: [[Вики/LangSmith\|LangSmith]] ([[Вики/датасеты\|датасеты]], [[Вики/automated testing\|автотесты]]), [[Вики/DeepEval\|DeepEval]] ([[Вики/Evaluation\|оценка]] по метрикам). ### 2…
answerКак вы детектируете data contamination в evaluation датасетах?
…Практические рекомендации для создания evaluation датасетов 1. **Используйте датасеты, опубликованные после даты среза тренировочных данных модели.** Например, для модели, обученной…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать curriculum learning
…Используем встроенные [[Вики/датасеты\|датасеты]] [[Вики/PyTorch\|PyTorch]] ([[Вики/MNIST\|MNIST]] доступен всегда). 2. В качестве метрики сложности для простоты…
answerКак работает Toolformer (обучение агента использованию инструментов)?
…Преимущества и ограничения ### Преимущества - Без разметки — не нужны [[Вики/датасеты\|датасеты]] с вызовами [[Вики/API\|API]], [[Вики/model\|модель]] сама…
answerЧто такое data poisoning атака на fine-tuning и как защититься?
…Почему [[Вики/fine-tuning\|fine-tuning]] уязвим - [[Вики/датасеты\|Датасеты]] для дообучения часто собираются из ненадёжных источников (пользовательский контент, [[Вики…
answerКак вы планируете масштабирование команды вокруг LLM-системы?
…Возникает [[Вики/crew\|команда]] платформы, которая строит внутренние сервисы: [[Вики/датасеты\|датасеты]], пайплайны оценки, [[Вики/feature store\|feature store]]. ## 2…
answerЧто такое curriculum learning на уровне данных для LLM?
…Инструменты [[Вики/SQL\|Python]], [[Вики/HuggingFace Transformers\|HuggingFace Transformers]], [[Вики/датасеты\|Datasets]], [[Вики/PyTorch\|PyTorch]]. **Шаги:** 1. Загрузить [[Вики/dataset…
answerКакой размер датасета нужен для fine-tuning?
…Инструменты [[Вики/Hugging Face\|Hugging Face Transformers]], [[Вики/Parameter-Efficient Fine-Tuning\|PEFT]], [[Вики/датасеты\|Datasets]], [[Вики/scikit-learn\|scikit…
answerКак вы предотвращаете catastrophic forgetting при fine-tuning?
…для [[Вики/fine-tuning\|fine-tuning]] на одном домене добавлять универсальные [[Вики/датасеты\|датасеты]] (например, [[Вики/ShareGPT OpenAssistant Dolly\|OpenAssistant…
answerКак избежать evaluation overfitting (когда модель учится на тесте)?
…Инструменты Для [[Вики/NLP\|NLP]]‑задач используют утилиты (например, `[[Вики/датасеты\|datasets]]` от [[Вики/Hugging Face\|Hugging Face]] с функцией…
answerЧто такое LayoutLMv3 и зачем он для document understanding?
…Fine-tuning под задачи DU После предобучения [[Вики/LayoutLMv3\|LayoutLMv3]] донастраивается на конкретные [[Вики/датасеты\|датасеты]]. Основные типы задач: ### 5…
answerЧто такое Cost Engineering для LLM-систем?
…выход модели; - косвенные – содержание GPU-кластера, инженерное время, [[Вики/датасеты\|датасеты]]. Инструменты атрибуции: - тэгирование запросов ([[Вики/user_id\|user_id…
practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить contextual retrieval (Anthropic стиль)
…Скачать [[Вики/dataset\|датасет]] wiki_qa или [[Вики/SQuAD 2.0\|SQuAD 2.0]] (можно через `[[Вики/датасеты\|datasets]]` библиотеку…
answerКак вы делаете synthetic data generation для редких классов в датасете?
…Инструменты [[Вики/SQL\|Python]], [[Вики/function calling\|OpenAI API]], [[Вики/датасеты\|Hugging Face Datasets]], [[Вики/scikit-learn\|scikit-learn]]. **Шаги…
answerКак вы делаете data quality monitoring для RAG корпуса?
…Особенности - [[Вики/scalability\|Масштабируемость]] на большие [[Вики/датасеты\|датасеты]]. - Поддержка метрик: [[Вики/Recall\|completeness]], [[Вики/Uniqueness\|uniqueness]], [[Вики/Compliance\|compliance…
answerЧто такое IRT (Item Response Theory) и как она применяется к LLM эвалюации?
…Собрать ответы моделей на 200 вопросов [[Вики/MMLU\|MMLU]] (можно использовать [[Вики/API\|API]] или готовые [[Вики/датасеты\|датасеты]]). 2…