S-LoRA

S-LoRA

Определение

S-LoRA — система, предложенная Chen et al. в 2023 году, предназначенная для эффективного обслуживания множества LoRA-адаптеров без перезагрузки базовой модели. Она решает проблему мультиадаптерного обслуживания, обеспечивая низкую задержку переключения и высокую пропускную способность при одновременной работе с разными адаптерами.

Где встречается

Навигация