English translation is not available yet. Showing Russian content.
GLaM
GLaM
Определение
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.
English translation is not available yet. Showing Russian content.
Разреженная Mixture-of-Experts модель от Google с 1.2 трлн параметров, 64 экспертами и k=2 активациями на токен, обученная на 1.6 трлн токенов.