Поиск
- answerКак масштабируется тест-тайм компьютинг? Есть ли закон diminishing returns?
…Некоторые архитектуры ([[Вики/Chain-of-Thought\|Chain-of-Thought]], [[Вики/tree search\|Tree-of-Thought]], [[Вики/Agentic loops\|агентные циклы…
- answerНазовите 12+ слоёв эталонной архитектуры Harness?
…Назовите 12+ слоёв эталонной архитектуры Harness? ## Краткий тезис [[Вики/Reference architecture\|Эталонная архитектура]] [[Вики/Harness Engineering\|Harness]] (проект `[[Вики/Harness…
- answerЧто такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса?
…Как работает TTC на уровне архитектуры? В традиционных трансформерах ([[Вики/transformers\|transformers]]) каждый [[Вики/token usage\|токен]] проходит через фиксированное…
- answerЧто такое Recurrent Depth в контексте LLM и зачем это нужно?
…Пример архитектуры Agentic RAG с recurrent depth: 1. Запрос → эмбеддинг. 2. Recurrent depth блок (K=4) → уточнённый эмбеддинг. 3. Retrieval…
- answerКак LLM используются для code generation с формальной верификацией (Dafny, Lean)?
…LLM генерирует код + спецификации, верификатор проверяет, ошибки возвращаются LLM для исправления. | AlphaProof (DeepMind) | | [[Вики/Agentic RAG\|Агентные системы]] | LLM управляет…
- answerЧто такое Semantic Kernel и чем отличается от LangChain?
…такое CrewAI?\|56]] | CrewAI (агентные команды) | | [[57 Какие архитектуры AI-агентов вы знаете?\|57]] | Архитектуры агентов (планировщики) | | [[58 Как работают…
- answerКакие инструменты для Delegation Engineering существуют (Airflow для агентов)?
…Кроме того, современные агентные фреймворки ([[Вики/LangGraph\|LangGraph]], [[Вики/AutoGen\|AutoGen]], [[Вики/CrewAI\|CrewAI]]) предоставляют встроенные механизмы [[Вики/human-in…
- answerКак вы обрабатываете real-time фичи для LLM (например, текущий сток товара)?
…Пример архитектуры (текстовая диаграмма) ``` [Пользователь] → [LLM Agent] ↓ [Tool: get_current_stock] ↓ [Redis (Feature Store)] ↑ [Kafka Consumer] ↑ [Kafka Topic: stock_changes…
- answerКак работает asynchronous execution на Hopper (copy engine vs compute)?
…Применение в Agentic RAG [[Вики/Agentic RAG\|Агентные RAG-системы]] часто выполняют несколько параллельных действий: - Поиск в векторной БД ([[Вики…
- answerКак тест-тайм компьютинг меняет MLOps?
…Новые требования к инфраструктуре MLOps [[Вики/Test-Time Compute\|TTC]] требует пересмотра архитектуры [[Вики/MLOps\|MLOps]]: - Динамическое [[Вики/probability distribution…
- answerКак проектировать retry storm mitigation (защита от лавинных ретраев)?
…Композиция методов — пример архитектуры для Agentic RAG Общая схема защиты от retry storm в агенте: ``` Пользователь → Agent → CircuitBreaker → TokenBucket → ExponentialBackoff…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cost attribution per feature
…123 | Оптимизация затрат на LLM (кэширование, дешевые модели) | | 234 | Агентные архитектуры: метрики и стоимость | | 345 | Cost analysis для RAG-пайплайнов…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Некоторые архитектуры позволяют модель «разворачивать» на произвольную глубину . **155. Что такое Recurrent Depth в контексте LLM и зачем это нужно…