GPT-4o
GPT-4o
Определение
Мультимодальная проприетарная модель OpenAI, обеспечивающая баланс качества и скорости с контекстом 128k токенов. Часто используется как дорогой baseline для оценки cost-effectiveness и в качестве judge-модели.
Где встречается
- 70. Как вы снижаете стоимость LLM в production на 50%+
- 72. OpenAI vs Антропик vs Groq vs Self-hosted — что выбираете
- 139. Как вы оцениваете cost-effectiveness LLM-пайплайна
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 639. Как вы делаете model selection для long context (какая модель лучше держит 100k+)
- 768. Что такое «ротация агентов» (load balancing между агентами)
- 772. Что такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)
- 44. Настроить query expansion
- 46. Настроить cross-encoder reranking
- 71. Рассчитать cost per 1M tokens для разных моделей
- 75. Рассчитать ROI для fine-tuning
- 116. Реализовать иерархическое делегирование
- 135. Рассчитать ROI от fine-tuning
- 231. Agentic RAG с саморефлексией
- 242. Агент с delegated tools
- 245. RAG с semantic chunking
- 247. RAG с distributed tracing
- 248. Агент с AB тестированием
- 249. RAG с cost-aware routing
- 264. Настроить health checks для всех компонентов
- 266. Сгенерировать synthetic датасет для RAG
- 284. Настроить pairwise evaluation для моделей
- 285. Реализовать synthetic benchmark генератор
- 286. Реализовать hierarchical coordination
- 296. RAG с векторной БД на CPU (ChromaQdrant)