Поиск
- wikiFlashAttention
# FlashAttention ## Определение Memory-efficient механизм внимания с IO-aware дизайном, использующий tiling, recomputation и kernel fusion для снижения сложности по…
- answerКак LLM применяются для protein folding (AlphaFold 3, ESM3)? Архитектура и отличия?
…Применения и ограничения ### Применения - Дизайн лекарств: предсказание структуры белков-мишеней и генерация ингибиторов. - Инженерия ферментов: создание новых катализаторов с заданными…
- answerКакие паттерны multi-agent систем вы знаете?
…Преимущества - Простая архитектура. - Чёткая [[Вики/Hierarchical Planning\|иерархия]], легко отслеживать [[Вики/logs\|логи]]. - Подходит для задач с явными этапами (например…
- answerЧто такое AI for materials science (GNoME, MatterGen) и как это отличается от text LLM?
…Как LLM применяются для protein folding (AlphaFold 3, ESM3) Архитектура и отличия\|727]] - Следующий: [[729. Как LLM используются для code…
- answerКакие 3 книги/курса вы рекомендуете по production LLM?
…Три ключевых источника: Designing Machine Learning Systems (Chip Huyen) — база по [[Вики/MLOps\|MLOps]] и дизайну систем, **"Build a [[Вики…
- answerЧто такое agent state management (состояние агента между вызовами)?
…Как вы делаете agent robustness к missing API (когда инструмент временно недоступен)\|585]] | Архитектура AI-агента (общий дизайн agentic RAG…
- answerКак выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)?
…crew\|команда]] готова их выполнить. Что проверяется на [[Вики/Operational Readiness Review\|ORR]] - Архитектура — соответствует ли дизайн требованиям по надёжности…
- answerКак вы планируете масштабирование команды вокруг LLM-системы?
…Как вы предотвращаете галлюцинации в production RAG системе\|96]] | Архитектура high-load RAG-системы (инфраструктура для масштабирования) | | [[97. Какую LLM…
- answerЧто такое «Schema-Activated In-Context Learning» (SA-ICL)?
…Какие embedding-модели вы использовали и почему\|15]] | Архитектура Agentic RAG | | [[20. Как вы обеспечиваете, что RAG работает с документами…
- answerКакие ограничения у language representation design?
…197]] | Архитектура Agentic RAG: как агент выбирает действия | | [[199\|199]] | Как тестировать агентные системы | | [[200\|200]] | Промпт-дизайн для агентов…
- answerНазовите OWASP Top 10 для LLM (2025) и 3 самых критичных риска?
…персональная информация, ключи API, внутренние документы) через ответы модели. | | LLM07 | [[Вики/Insecure Plugin Design\|Insecure Plugin Design]] | Небезопасная архитектура плагинов…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать rollback delegation
…Ключевой результат Функциональный [[Вики/Prototype\|прототип]] (или детальный дизайн + [[Вики/Code\|код]]), в котором при имитации [[Вики/ошибки\|ошибки]] агента…
- answerКак работает RLHF (Reinforcement Learning from Human Feedback) технически?
…Это решается KL-регуляризацией и тщательным дизайном RM. ### 7.2 Сложность сбора данных Человеческие аннотации дороги и субъективны. Разные аннотаторы…
- answerКак вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)?
…От того, на каком этапе происходит [[Вики/Fusing\|слияние]], зависит архитектура системы. --- ## 2. Мотивация: зачем комбинировать текст и изображения В…
- answerКак вы проектируете API для внешних систем, использующих вашу LLM?
…Как вы храните историю изменений промптов (prompt lineage)\|95]] | Multi-model сервинг (роутинг запросов) | Эти вопросы дополняют друг друга: дизайн…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…АРХИТЕКТУРА И ДИЗАЙН (20 вопросов) --- **81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG?** **Структура…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…Архитектура и дизайн (81-100) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 81 | 1000 одновременных пользователей | Dist 191-205, Pet 224 | | 82 | Real…