中文翻译暂不可用,显示俄语原文。

LLM inference

LLM inference

Определение

Процесс генерации ответа языковой моделью на основе входного промпта; включает токенизацию, прямой проход по сети и декодирование. В production требует управления памятью и параллелизмом.

Где встречается

Навигация