Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/GPT-2 small

GPT-2 small

GPT-2 small

Определение

Малая версия модели GPT-2, используемая в пет-проектах для симуляции reward hacking в RLHF.

Где встречается

  • 489. Что такое reward hacking в RLHF и как его детектировать

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминfine-tuning

Ссылки

  • Что такое reward hacking в RLHF и как его детектировать?

Обратные ссылки (5)

  • Индекс терминов
  • Как работает извлечение знаний (knowledge editing) из LLM без переобучения?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить гибридную архитектуру Mamba + Attention для улучшения качества языковой модели
  • Что такое Constitutional AI и как RLHF связан с ним?
  • Что такое curriculum learning на уровне данных для LLM?