Поиск

  • wikiPlanning alignment

    # Planning alignment ## Определение Соответствие плана действий агента ценностям и предпочтениям пользователя. ## Где встречается - [[499. Как вы оцениваете alignment модели с…

  • wikisafety alignment

    # safety alignment ## Определение Процесс выравнивания поведения модели с человеческими ценностями и требованиями безопасности, часто включающий дообучение и оценку. ## Где встречается…

  • wikiTool use alignment

    # Tool use alignment ## Определение Оценка того, использует ли агент инструменты строго по назначению, без отклонений от заданной функциональности. ## Где встречается…

  • wikialignment tax

    # alignment tax ## Определение Снижение производительности или качества ответов модели в результате применения методов выравнивания (alignment), таких как RLHF или adversarial…

  • wikiAlignment budget

    # Alignment budget ## Определение Ограничение на количество вызовов LLM или токенов для баланса стоимости и качества в процессе выравнивания (alignment) агента…

  • wikiMultilingual alignment

    # Multilingual alignment ## Определение Расширение alignment LLM на все поддерживаемые языки для защиты от translation attack. Обеспечивает единые стандарты безопасности независимо…

  • wikiMultiple Sequence Alignment

    # Multiple Sequence Alignment ## Определение Выравнивание множества гомологичных последовательностей (например, белков) для выявления консервативных позиций; используется как вход для моделей предсказания…

  • wikiVQ-GAN

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiединый токенизатор

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikisequence alignment

    # sequence alignment ## Определение Метод оценки агентов, автоматически сопоставляющий ожидаемую последовательность действий с фактической для измерения точности траектории. ## Где встречается - [[146…

  • wikiForced alignment

    # Forced alignment ## Определение Постобработка транскрипции для точной синхронизации текста с аудиодорожкой. Использует модели CTC или Wav2Vec2. ## Где встречается - [[559. Что…

  • wikiHypervolume

    …Используется при сравнении моделей или стратегий alignment. ## Где встречается - [[499. Как вы оцениваете alignment модели с человеческими ценностями без gold…

  • wikiQuery-document alignment

    # Query-document alignment ## Определение Метрика, оценивающая, насколько эмбеддинги запросов попадают в кластеры релевантных документов; низкое значение указывает на mismatch энкодеров…

  • wikiVQVAE

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiLakera Guard

    # Lakera Guard ## Определение Lakera Guard — инструмент для обеспечения безопасности и alignment LLM-агентов, позволяющий задавать конституционные правила поведения без необходимости…

  • wikiконнекторные методы

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard? ## Краткий тезис [[Вики/Evaluation\|Оценка]] [[Вики/safety alignment\|alignment

  • wikiApproval voting

    …Применяется для оценки alignment модели с человеческими ценностями при отсутствии золотого стандарта. ## Где встречается - [[499. Как вы оцениваете alignment модели…

  • wikiWord-Patch Alignment

    # Word-Patch Alignment ## Определение Бинарная классификация, определяющая, соответствует ли текстовый токен визуальному патчу в модели LayoutLMv3. Используется для обучения совместного…

  • answerКак вы оцениваете alignment модели с человеческими ценностями без gold standard?

    Alignment должен оценивать не только текст, но и **процесс**: - [[Вики/Tool use alignment\|Tool use alignment]] — использует ли агент инструменты…

  • wikiViolation rate

    # Violation rate ## Определение Метрика доли шагов агента, которые нарушают заданные конституционные правила, используется для оценки alignment агента до и после…

  • wikipreference distributions

    …Позволяют оценивать alignment без единого стандарта, учитывая неопределённость. ## Где встречается - [[499. Как вы оцениваете alignment модели с человеческими ценностями без…

  • wikiRecovery rate

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiAction safety rate

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiConstitutionalChain

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiConstitutional adherence

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiPlan coherence

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiBERT classifier

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiRLlib

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiperceptual loss

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiтрансформер-декодер

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiConstitutional prompt

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiCondorcet method

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiдискретные токены

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiBorda count

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikicommitment loss

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiTrajectory reward

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiединый трансформер

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiChameleon

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiDiffusion Models

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiany-to-any generation

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiSocial choice aggregation

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiSENTINEL Tokens

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|545. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiExploration vs exploitation

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikirevision

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiOvercorrection

    …Как вы делаете agent с human values alignment (Constitutional AI для агентов)|589. Как вы делаете agent с human values…

  • wikiBPE

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…

  • wikiConstitutional AI

    …Как вы оцениваете alignment модели с человеческими ценностями без gold standard|499. Как вы оцениваете alignment модели с человеческими ценностями…

  • wikiPartial Harnessing

    # Partial Harnessing ## Определение Метод управления агентами, при котором часть шагов выполняется по строгим правилам, а остальное делегируется LLM, снижая затраты…

  • wikiAutoregressive

    …Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)|365. Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon…