中文翻译暂不可用,显示俄语原文。
GLaM
GLaM
Определение
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.
中文翻译暂不可用,显示俄语原文。
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.