FP32

Определение

32-битный формат чисел с плавающей точкой (float32) одинарной точности. Используется как эталонный формат для сравнения точности, для хранения мастер-весов при смешанном обучении и для эмбеддингов до сжатия.

Где встречается

7. Как вы уменьшаете latency RAG-системы (время ответа)
77. Как вы оптимизируете embedding генерацию для большого количества документов
223. Как работает Product Quantization (PQ) для сжатия векторов
433. Почему KV cache растет линейно с длиной контекста и как это оптимизировать
461. Почему training 70B модели требует optimizer sharding (ZeRO-3)
464. Почему BF16 лучше FP16 для training
469. Как работает Mixed Precision Training (FP16 + FP32 master веса)
705. Как работает Tensor Core microarchitecture (WGMMA, MMA инструкции) в H100
800+ вопросов
12. Настроить mmap для embeddings
52. Настроить RWKV для инференса

FP32

FP32

Определение

Где встречается

Навигация