Поиск
- wikiFallback-модель
# Fallback-модель ## Определение переключение на запасную модель (например, с GPT-4 на Claude) при блокировке API ## Где встречается - [[390. Как…
- wikiVLM
# VLM ## Определение Мультимодальная модель, объединяющая обработку визуальной и текстовой информации; применяется для задач captioning, VQA и оценки галлюцинаций. ## Где встречается…
- wiki2PL модель
# 2PL модель ## Определение Модель IRT с параметрами дискриминации (a) и сложности (b); учитывает разную дискриминацию вопросов. ## Где встречается - [[171. Что…
- wiki1PL модель
# 1PL модель ## Определение Модель IRT с одним параметром задания — сложностью (b); все вопросы имеют одинаковую дискриминацию. ## Где встречается - [[171. Что…
- wiki3PL модель
# 3PL модель ## Определение Модель IRT с параметрами a, b и c (угадывание); применяется для заданий с возможностью угадывания (например, multiple…
- wikiproxy-модель
# proxy-модель ## Определение Модель, заменяющая медленный LLM-as-judge для ускорения оценки. ## Где встречается - [[169. Реализовать rollback промпта|169. Реализовать…
- wikipay-per-use
# pay-per-use ## Определение Модель монетизации, в которой плата взимается за каждый выполненный запрос или потреблённые токены. Часто применяется в…
- wikimargin
…Как строить финансовую модель LLM-продукта для бизнеса]] - [[145. Сделать финансовую модель LLM-продукта|145. Сделать финансовую модель LLM-продукта…
- answerЧто такое Variational Speculative Decoding (VSD) и чем он революционен?
…использовать быструю [[Вики/draft model\|draft модель]] (например, [[Вики/model\|модель]] меньшего размера) для генерации нескольких токенов, а затем [[Вики…
- wikiSaaS
# SaaS ## Определение Модель предоставления программного обеспечения как услуги, используемая для LLM-продуктов (например, чат-помощников) с соответствующей финансовой моделью. ## Где…
- wikipull-модель
# pull-модель ## Определение Архитектура сбора метрик, при которой Prometheus сам забирает данные с агента. Рекомендуется для отслеживания затрат и производительности…
- wikiмодель Лотки-Вольтерры
# модель Лотки-Вольтерры ## Определение Математическая модель взаимодействия хищник-жертва, используемая в научной формализации для описания динамики популяций. ## Где встречается - [[191…
- wikiARPU
…Как строить финансовую модель LLM-продукта для бизнеса]] - [[145. Сделать финансовую модель LLM-продукта|145. Сделать финансовую модель LLM-продукта…
- wikidraft model
# draft model ## Определение Быстрая, меньшая модель, которая генерирует черновик токенов для последующей верификации целевой (target) моделью в speculative decoding. Используется…
- wikigross margin
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[800+ вопросов|800…
- wikiBradley-Terry модель
# Bradley-Terry модель ## Определение Bradley-Terry модель — частный случай Item Response Theory (IRT), использующийся в Chatbot Arena для ранжирования LLM…
- answerКак вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели?
…Если сложность низкая → маленькая модель + CoT (1 шаг). 4. Если сложность высокая → большая модель (или маленькая модель с большим числом…
- wikiMMHal-Bench
…Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)|368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal…
- answerКак работает speculative decoding на уровне логитов, а не токенов?
…draft-модель генерирует токены, а target-модель вычисляет логиты для всех позиций параллельно. Но в «чистом» логит-варианте target-модель…
- answerЧто такое EAGLE-3 и чем он отличается от стандартного speculative decoding?
…Draft модель получает это скрытое состояние как дополнительный вход. 3. Draft модель предсказывает следующий токен, «зная», как target модель «воспринимает…
- wikiunit economy
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[Практика|Практика]] - [[800…
- wikiB2C
# B2C ## Определение Сегмент рынка, ориентированный на массового потребителя, влияющий на ценовую модель продукта. ## Где встречается - [[145. Сделать финансовую модель LLM…
- wikiSubscription
# Subscription ## Определение Модель дохода, при которой пользователи платят регулярную (месячную/годовую) плату за доступ к продукту. ## Где встречается - [[145. Сделать…
- wikiLTV
…Как строить финансовую модель LLM-продукта для бизнеса]] - [[145. Сделать финансовую модель LLM-продукта|145. Сделать финансовую модель LLM-продукта…
- wikiPitch Deck
# Pitch Deck ## Определение Финальная презентация для бизнес-стейкхолдеров, представляющая финансовую модель и обоснование LLM-продукта. ## Где встречается - [[145. Сделать финансовую…
- answerКак вы fine-tune модель для функции "вызов внешнего API"?
…Инструменты - Модель: Llama‑3.2‑1B‑Instruct (или любая другая instruct-модель из Hugging Face) - Фреймворк: Hugging Face Transformers + TRL…
- wikiEnterprise Contract
# Enterprise Contract ## Определение Модель ценообразования для B2B-клиентов с фиксированной ежемесячной платой и дополнительной оплатой за превышение лимитов (overage). ## Где…
- wikifreemium
# freemium ## Определение Бизнес-модель, при которой базовый функционал продукта предоставляется бесплатно, а расширенные возможности — по платной подписке. ## Где встречается - [[784…
- answerКакие trade-offs между разными архитектурами speculative decoding?
…Ключевые термины - **[[Вики/draft model\|Draft-модель]]** — маленькая [[Вики/model\|модель]], генерирующая кандидатов. - **[[Вики/baseline\|Target-модель]]** — [[Вики/target model…
- wikiCHAIR
…Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)|368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal…
- wikiOn-demand GPU
# On-demand GPU ## Определение Тип аренды GPU с почасовой оплатой, влияющий на стоимость инференса и финансовую модель продукта. ## Где встречается…
- answerКак работает speculative decoding с несколькими draft моделями?
…Мотивация для нескольких draft моделей Одна draft модель — это компромисс между скоростью и качеством предсказания. Если сделать draft модель слишком…
- wikiPOPE
…Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)|368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal…
- wikisensitivity analysis
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[800+ вопросов|800…
- wikie5-large-v2
# e5-large-v2 ## Определение Embedding-модель от Microsoft, используемая для генерации векторных представлений текста. ## Где встречается - [[79. Как вы обновляете…
- wikiOpEx
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[Практика|Практика]] - [[800…
- wikiPayback period
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[800+ вопросов|800…
- wikiall-mpnet-base-v2
# all-mpnet-base-v2 ## Определение Предобученная эмбеддинг-модель на основе MPNet, обеспечивающая высокое качество векторных представлений текста. ## Где встречается - [[79…
- wikilarge model
# large model ## Определение Модель с большим числом параметров (миллиарды), обеспечивающая высокое качество на сложных задачах, но имеющая фиксированные вычислительные затраты…
- answerЧто такое Constitutional AI и как RLHF связан с ним?
…2. [[Вики/Critique\|Critique]] — [[Вики/model\|модель]] (или другая [[Вики/model\|модель]]) критикует свой собственный ответ на основе конституции. 3…
- wikiMistral Large
# Mistral Large ## Определение Mistral Large — открытая языковая модель, обеспечивающая хороший баланс между качеством генерации и стоимостью вычислений. ## Где встречается - [[639…
- wikiscalability
…Как строить финансовую модель LLM-продукта для бизнеса|784. Как строить финансовую модель LLM-продукта для бизнеса]] - [[Практика|Практика]] - [[800…
- wikiembedding-модель
# embedding-модель ## Определение Модель машинного обучения, преобразующая текст в векторные представления (эмбеддинги). Используется в RAG для семантического поиска релевантных документов…
- wikiCascading
…сначала дешёвая маленькая модель, а при ошибке — более дорогая большая, без использования классификатора. ## Где встречается - [[778. Как проектировать cost-aware…
- wikiCommand R+
# Command R+ ## Определение Открытая модель (open-source) от Cohere со встроенной поддержкой поиска (retrieval), оптимизированная для RAG-сценариев и длинного…
- answerКак вы деплоите speculative decoding в production?
…Draft generation Draft модель генерирует K токенов авторегрессивно (последовательно). Это быстро, так как модель маленькая. 2. **Verification:** Target модель получает…
- wikievaluation overfitting
# evaluation overfitting ## Определение Ситуация, когда модель подстраивается под тестовые данные (test set overfitting), снижая объективность метрик и обобщающую способность. ## Где…
- wikiLlama 3.1 405B
# Llama 3.1 405B ## Определение Open-source модель с 405 миллиардами параметров, качество ниже проприетарных аналогов, но бесплатна при самостоятельном…
- wikidependent functions strategy
…из графа вызовов берётся транзитивное замыкание зависимостей, чтобы модель видела весь необходимый код репозитория. ## Где встречается - [[647. Как вы делаете…
- wikiCDN
…Как строить финансовую модель LLM-продукта для бизнеса]] - [[145. Сделать финансовую модель LLM-продукта|145. Сделать финансовую модель LLM-продукта…