中文翻译暂不可用,显示俄语原文。

Switch Transformer

Switch Transformer

Определение

Архитектура Mixture of Experts (MoE) с большим числом экспертов и k=1, предложенная Google; первая крупная MoE модель в NLP.

Где встречается

Навигация