中文翻译暂不可用,显示俄语原文。
DeepSeek-MoE
DeepSeek-MoE
Определение
Mixture of Experts модель с 64 экспертами, k=6 и shared expert. Использует fine-grained эксперты для эффективного масштабирования.
中文翻译暂不可用,显示俄语原文。
Mixture of Experts модель с 64 экспертами, k=6 и shared expert. Использует fine-grained эксперты для эффективного масштабирования.