Поиск
- wikifield extraction
# field extraction ## Определение Извлечение структурированных полей (например, номер счёта) из документов с помощью моделей вроде LayoutLMv3. ## Где встречается - [[800+ вопросов…
- wikiclaim extraction
# claim extraction ## Определение Claim extraction — метод разбиения ответа LLM на атомарные фактические высказывания (claims) для последующей верификации по контексту, используется…
- wikiTable Extraction Score
# Table Extraction Score ## Определение F1-мера для оценки качества извлечения ячеек таблицы; порог качества обычно >85%. ## Где встречается - [[527. Как…
- wikiBlack-box extraction
# Black-box extraction ## Определение Атака, при которой злоумышленник отправляет запросы к API модели и обучает свою модель на полученных ответах…
- wikiData extraction
# Data extraction ## Определение Атака на LLM, предшествующая membership inference, с целью извлечения заученного текста из модели. ## Где встречается - [[602. Как…
- wikiStructured extraction
# Structured extraction ## Определение Задача вызова LLM для извлечения конкретных сущностей из текста вместо генерации длинных ответов, используется для снижения стоимости…
- wikikey extraction
# key extraction ## Определение Попытка восстановить секретный ключ по множеству текстов, например, при атаках на модели или watermarking. ## Где встречается - [[613…
- wikiExtraction attacks
# Extraction attacks ## Определение Атаки на LLM, при которых злоумышленник специальными запросами извлекает чувствительные данные (PII), запомненные моделью в процессе обучения…
- wikiEntity Extraction
# Entity Extraction ## Определение Задача NLP по выделению из текста заданных сущностей (дат, сумм, имён) с помощью моделей вроде LayoutLMv3. ## Где…
- wikiwhite-box extraction
# white-box extraction ## Определение Атака с полным доступом к весам и графу вычислений модели, направленная на извлечение её параметров (например…
- wikimodel extraction
# model extraction ## Определение Атака, направленная на кражу весов или архитектуры модели через запросы к API. ## Где встречается - [[351. Как работает…
- wikimodel stealing attack
# model stealing attack ## Определение Атака, при которой через многократные запросы к API модели злоумышленник восстанавливает её веса или архитектуру. ## Где…
- answerКак работает model extraction attack и как защититься?
…Как работает model extraction attack и как защититься? ## Краткий тезис [[Вики/model stealing attack\|Model extraction attack]] ([[Вики/model extraction…
- wikiFinTabNet
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiМногостраничные таблицы
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiОбъединённые ячейки
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiPubTables-1M
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiПовёрнутый текст
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiHTML-таблица
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiTEDS
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiTATR-structure
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiRetrieval Quality
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[800…
- wikiключевые кадры
# ключевые кадры ## Определение Выбранные кадры видео, полученные методами равномерной выборки, по смене сцены или кластеризации, для дальнейшей индексации и описания…
- wikiMarkdown table
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] ## Навигация…
- wikiTabula
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[800…
- wikiDETR
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[564…
- wikipandas DataFrame
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[800…
- wikibounding box coordinates
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[800…
- wikiCamelot
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[800…
- wikiPost-processing
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[612…
- wikiserialization
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[586…
- wikiRule-based executor
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[567…
- wikiCUDA streams
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[707…
- wikiPrivacy attacks
# Privacy attacks ## Определение Класс атак на модель, направленных на извлечение конфиденциальных данных, включающий membership inference, data extraction и другие. ## Где…
- answerКак работает model stealing attack и как защититься?
…Типы model stealing атак | Тип атаки | Доступ к модели | Что извлекается | Сложность | |-----------|----------------|------------------|-----------| | [[Вики/Black-box extraction\|Black-box extraction]] | Только…
- answerКак измерять faithfulness для long-form ответов (1000+ токенов)?
…Основные подходы: [[Вики/Sentence-level NLI\|Sentence-level NLI]], [[Вики/claim extraction\|Claim extraction]], [[Вики/косинусная близость\|Semantic similarity]] и…
- wikiindexing
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[Практика…
- wikiprompt stealing
# prompt stealing ## Определение Атака, при которой злоумышленник заставляет LLM раскрыть скрытые инструкции системного промпта. ## Где встречается - [[888. Как защититься от…
- wikiprompt leakage
# prompt leakage ## Определение Атака, при которой пользователь заставляет модель раскрыть системный промпт или иную конфиденциальную информацию. ## Где встречается - [[625. Что…
- wikiFeature engineering
# Feature engineering ## Определение Процесс конструирования входных признаков из сырых данных для улучшения производительности модели, включающий агрегацию, создание эмбеддингов и другие…
- wikiпайплайн
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[750…
- wikipdfplumber
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[645…
- wikiframe sampling
# frame sampling ## Определение Техника выбора репрезентативных кадров из видеопотока для уменьшения вычислительной нагрузки. Включает стратегии: равномерная выборка, детекция смены сцен…
- wikiRULER
# RULER ## Определение Бенчмарк для оценки long-context способностей модели, включающий задачи multi-needle, variable tracking и common word extraction. ## Где…
- answerЧто такое MITRE ATLAS и как он связан с MITRE ATT&CK?
…результат при предъявлении триггера. **AML.T0030 — [[Вики/model extraction\|Model Extraction]] (Extraction)** Через многократные [[Вики/Query\|запросы]] к [[Вики/API…
- answerКак происходит PII leakage через LLM и как защититься?
…Эксперименты Карлини и др. (Carlini et al., 2021, 2023) показали, что с помощью [[Вики/Extraction attacks\|extraction attacks]] (например, «Complete…
- wikiTesseract OCR
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[564…
- answerЧто такое data exfiltration через LLM (утечка данных через ответы)?
…Примеры атак | Тип атаки | Описание | Пример запроса | |-----------|----------|----------------| | **Extraction attack** | Извлечение точных фрагментов из обучающих данных | «Повтори первые 100 слов из…
- wikiключевой поиск
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[582…
- wikiLlamaIndex
…Как вы делаете extraction таблиц из PDF для RAG|556. Как вы делаете extraction таблиц из PDF для RAG]] - [[558…