中文翻译暂不可用,显示俄语原文。
Fixed shapes
Fixed shapes
Определение
Оптимизация инференса, при которой длина последовательности и размер батча фиксированы, что позволяет эффективно использовать TensorRT-LLM и другие оптимизированные движки.
中文翻译暂不可用,显示俄语原文。
Оптимизация инференса, при которой длина последовательности и размер батча фиксированы, что позволяет эффективно использовать TensorRT-LLM и другие оптимизированные движки.