Decoder-only architecture
Decoder-only architecture
Определение
Архитектура трансформера, использующая только декодер с маскированным attention, применяемая в большинстве современных LLM (например, GPT).
Архитектура трансформера, использующая только декодер с маскированным attention, применяемая в большинстве современных LLM (например, GPT).