S-LoRA
S-LoRA
Определение
S-LoRA — система, предложенная Chen et al. в 2023 году, предназначенная для эффективного обслуживания множества LoRA-адаптеров без перезагрузки базовой модели. Она решает проблему мультиадаптерного обслуживания, обеспечивая низкую задержку переключения и высокую пропускную способность при одновременной работе с разными адаптерами.