中文翻译暂不可用,显示俄语原文。
max_tokens
max_tokens
Определение
Параметр LLM, задающий максимальное количество токенов в генерируемом ответе. Уменьшение этого параметра — один из способов graceful degradation при перегрузке сервера.
中文翻译暂不可用,显示俄语原文。
Параметр LLM, задающий максимальное количество токенов в генерируемом ответе. Уменьшение этого параметра — один из способов graceful degradation при перегрузке сервера.