Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/cluster

cluster

cluster

Определение

Группа близких векторов в векторной базе данных, куда помещается вектор при атаке типа malicious embeddings.

Где встречается

  • 800+ вопросов

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминdata

Обратные ссылки (38)

  • Индекс терминов
  • Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG?
  • Как вы анализируете embedding geometry для отладки retrieval качества?
  • Как вы делаете blue-green deployment для RAG системы с zero downtime?
  • Как вы делаете data quality для синтетических датасетов?
  • Как вы деплоите LLM на spot instances в облаке?
  • Как вы измеряете diversity синтетического датасета?
  • Как вы обновляете ANN индекс при добавлении новых векторов без перестроения?
  • Как вы обрабатываете streaming данные для real-time RAG?
  • Как вы проводите chaos engineering для RAG системы?
  • Как вы проектируете RAG для 10k RPS с P99 latency <200ms? Архитектура.
  • Как вы проектируете disaster recovery для LLM системы при сбое региона?
  • Как вы решаете проблему «lost in the middle» при работе с длинными контекстами?
  • Как вы управляете качеством разметки (label quality) для DPO датасетов?
  • Как организовать GPU scheduling для multi-tenant LLM serving?
  • Как проектировать Airflow DAG для RAG ingestion?
  • Как проектировать ETL vs ELT для RAG?
  • Как работает RAPTOR (иерархическое суммирование для длинного контекста)?
  • Как учитывать CAP theorem в AI systems?
  • Какие методы fine-tuning вы знаете и какой используете чаще всего?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с semantic chunking (кластеризация эмбеддингов предложений)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить GPU scheduling для multi-tenant
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить Redis cluster с LFU eviction
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить auto-scaling для vLLM
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить auto-scaling с учётом cost
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить expert parallelism для Mixtral
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для LLM
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить hot shard detection
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить sharding для petabyte embeddings
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка orchestration с помощью Temporal для 5 агентов с компенсацией
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать topology-aware scheduling для K8s device plugin с учётом NVSwitch доменов
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить распределенные FS (Lustre, BeeGFS, JuiceFS)
  • Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид?
  • Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speed/quality?
  • Что такое Layout-Aware Chunking и как он связан с мультимодальностью?
  • Что такое Learned Index Structures for ANN? Новые подходы 2025-2026?
  • Что такое skill libraries для агентов и как их создавать?
  • Что такое «ротация агентов» (load balancing между агентами)?