中文翻译暂不可用,显示俄语原文。
INT4
INT4
Определение
Формат целых чисел с низкой точностью (0.5 байта), применяемый для квантования KV cache при инференсе LLM для экономии памяти.
中文翻译暂不可用,显示俄语原文。
Формат целых чисел с низкой точностью (0.5 байта), применяемый для квантования KV cache при инференсе LLM для экономии памяти.