English translation is not available yet. Showing Russian content.

LLM inference

LLM inference

Определение

Процесс генерации ответа языковой моделью на основе входного промпта; включает токенизацию, прямой проход по сети и декодирование. В production требует управления памятью и параллелизмом.

Где встречается

Навигация