Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/Train set

Train set

Train set

Определение

Набор данных, на котором производится обучение или fine-tuning модели; loss на нём используется для обнаружения переобучения.

Где встречается

  • 800+ вопросов

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминdatafine-tuning

Обратные ссылки (22)

  • Индекс терминов
  • Как вы делаете hybrid search (vector + keyword) в production на 10M документов?
  • Как вы детектируете data contamination в evaluation датасетах?
  • Как вы калибруете вероятности LLM для classification задач?
  • Как избежать benchmark contamination (когда модель видела тестовые данные)?
  • Как происходит PII leakage через LLM и как защититься?
  • Как работает LLM fingerprinting (идентификация модели по ответам)?
  • Как работает LLM-as-judge и почему он biased?
  • Как работает dropout и зачем он нужен в LLM? (regularization)
  • Как работает membership inference атака на LLM?
  • Какой размер датасета нужен для fine-tuning?
  • Объясните разницу между NeMo Guardrails и Garak. Когда что используется?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить self-training с псевдо-метками
  • Что такое Constitutional AI и как RLHF связан с ним?
  • Что такое Learned Index Structures for ANN? Новые подходы 2025-2026?
  • Что такое Positional bias в LLM-as-Judge и как его исправить?
  • Что такое adversarial retrieval (атака на retrieval компонент)?
  • Что такое curriculum learning for synthetic data (обучение на легких данных сначала)?
  • Что такое model cards и system cards и как их составлять?
  • Что такое reward hacking в RLHF и как его детектировать?
  • Что такое secure aggregation для федеративного обучения LLM?
  • Что такое synthetic data collapse (когда синтетические данные деградируют со временем)?