TinyLlama
TinyLlama
Определение
Маленькая языковая модель с 1.1 млрд параметров, предназначенная для быстрых задач классификации, speculative decoding и fine-tuning в пет-проектах.
Где встречается
- 29. Как fine-tune модель для следования сложным инструкциям
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 36. Что такое DPO (Direct Preference Optimization) и чем отличается от RLHF
- 161. Как вы измеряете эффективность speculative decoding
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 289. Как работает speculative decoding на уровне логитов, а не токенов
- 336. Что такое KTO (Kahneman-Tversky Optimization) и чем отличается от DPO
- 446. Что такое chunked prefill и зачем он нужен
- 549. Как вы проектируете систему для real-time video understanding (поток с камеры)
- 571. Как работают verifier models для agentic RAG и зачем они нужны
- 596. Как работает model stealing attack (экстракция модели через API)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 708. Что такое MIG (Multi-Instance GPU) и как настроить для разных LLM
- 800+ вопросов
- 220. Настроить wave decoding для коротких ответов
- 249. RAG с cost-aware routing
- 296. RAG с векторной БД на CPU (ChromaQdrant)