RoT5

RoT5

Определение

RoT5 (ruT5) — это предобученная модель на русском языке, основанная на архитектуре T5 (Text-to-Text Transfer Transformer). Она использует трансферное обучение, что позволяет решать downstream задачи (например, генерацию текста, суммаризацию, перевод) без необходимости в больших размеченных наборах данных. Модель обучается на текстовых корпусах и адаптируется под конкретную задачу с минимальным дообучением.

Где встречается

Навигация