TinyLlama

Определение

Маленькая языковая модель с 1.1 млрд параметров, предназначенная для быстрых задач классификации, speculative decoding и fine-tuning в пет-проектах.

Где встречается

29. Как fine-tune модель для следования сложным инструкциям
32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
36. Что такое DPO (Direct Preference Optimization) и чем отличается от RLHF
161. Как вы измеряете эффективность speculative decoding
164. Какие trade-offs между разными архитектурами speculative decoding
289. Как работает speculative decoding на уровне логитов, а не токенов
336. Что такое KTO (Kahneman-Tversky Optimization) и чем отличается от DPO
446. Что такое chunked prefill и зачем он нужен
549. Как вы проектируете систему для real-time video understanding (поток с камеры)
571. Как работают verifier models для agentic RAG и зачем они нужны
596. Как работает model stealing attack (экстракция модели через API)
700. Как вы комбинируете реальные и синтетические данные для максимального качества
708. Что такое MIG (Multi-Instance GPU) и как настроить для разных LLM
800+ вопросов
220. Настроить wave decoding для коротких ответов
249. RAG с cost-aware routing
296. RAG с векторной БД на CPU (ChromaQdrant)

TinyLlama

TinyLlama

Определение

Где встречается

Навигация