Поиск
- wikiPlanning alignment
# Planning alignment ## Определение Соответствие плана действий агента ценностям и предпочтениям пользователя. ## Где встречается - [[499. Как вы оцениваете alignment модели с…
- wikisafety alignment
# safety alignment ## Определение Процесс выравнивания поведения модели с человеческими ценностями и требованиями безопасности, часто включающий дообучение и оценку. ## Где встречается…
- wikiTool use alignment
# Tool use alignment ## Определение Оценка того, использует ли агент инструменты строго по назначению, без отклонений от заданной функциональности. ## Где встречается…
- wikialignment tax
# alignment tax ## Определение Снижение производительности или качества ответов модели в результате применения методов выравнивания (alignment), таких как RLHF или adversarial…
- wikiAlignment budget
# Alignment budget ## Определение Ограничение на количество вызовов LLM или токенов для баланса стоимости и качества в процессе выравнивания (alignment) агента…
- wikiMultilingual alignment
# Multilingual alignment ## Определение Расширение alignment LLM на все поддерживаемые языки для защиты от translation attack. Обеспечивает единые стандарты безопасности независимо…
- wikiMultiple Sequence Alignment
# Multiple Sequence Alignment ## Определение Выравнивание множества гомологичных последовательностей (например, белков) для выявления консервативных позиций; используется как вход для моделей предсказания…
- wikiVQ-GAN
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiединый токенизатор
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikisequence alignment
# sequence alignment ## Определение Метод оценки агентов, автоматически сопоставляющий ожидаемую последовательность действий с фактической для измерения точности траектории. ## Где встречается - [[146…
- wikiForced alignment
# Forced alignment ## Определение Постобработка транскрипции для точной синхронизации текста с аудиодорожкой. Использует модели CTC или Wav2Vec2. ## Где встречается - [[559. Что…
- wikiHypervolume
…Используется при сравнении моделей или стратегий alignment. ## Где встречается - [[499. Как вы оцениваете alignment модели с человеческими ценностями без gold…
- wikiQuery-document alignment
# Query-document alignment ## Определение Метрика, оценивающая, насколько эмбеддинги запросов попадают в кластеры релевантных документов; низкое значение указывает на mismatch энкодеров…
- wikiVQVAE
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiLakera Guard
# Lakera Guard ## Определение Lakera Guard — инструмент для обеспечения безопасности и alignment LLM-агентов, позволяющий задавать конституционные правила поведения без необходимости…
- wikiконнекторные методы
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard? ## Краткий тезис [[Вики/Evaluation\|Оценка]] [[Вики/safety alignment\|alignment…
- wikiApproval voting
…Применяется для оценки alignment модели с человеческими ценностями при отсутствии золотого стандарта. ## Где встречается - [[499. Как вы оцениваете alignment модели…
- wikiWord-Patch Alignment
# Word-Patch Alignment ## Определение Бинарная классификация, определяющая, соответствует ли текстовый токен визуальному патчу в модели LayoutLMv3. Используется для обучения совместного…
- answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?
…Alignment должен оценивать не только текст, но и **процесс**: - [[Вики/Tool use alignment\|Tool use alignment]] — использует ли агент инструменты…
- wikiViolation rate
# Violation rate ## Определение Метрика доли шагов агента, которые нарушают заданные конституционные правила, используется для оценки alignment агента до и после…
- wikipreference distributions
…Позволяют оценивать alignment без единого стандарта, учитывая неопределённость. ## Где встречается - [[499. Как вы оцениваете alignment модели с человеческими ценностями без…
- wikiRecovery rate
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiAction safety rate
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiConstitutionalChain
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiConstitutional adherence
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiPlan coherence
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiBERT classifier
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiRLlib
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiperceptual loss
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiтрансформер-декодер
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiConstitutional prompt
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiCondorcet method
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiдискретные токены
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiBorda count
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikicommitment loss
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiTrajectory reward
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiединый трансформер
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiChameleon
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiDiffusion Models
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiany-to-any generation
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiSocial choice aggregation
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiSENTINEL Tokens
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiExploration vs exploitation
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikirevision
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiOvercorrection
…Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…
- wikiBPE
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…
- wikiConstitutional AI
…Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…
- wikiPartial Harnessing
# Partial Harnessing ## Определение Метод управления агентами, при котором часть шагов выполняется по строгим правилам, а остальное делегируется LLM, снижая затраты…
- wikiAutoregressive
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…