GLaM
GLaM
Определение
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.