Поиск
- wikiLLM endpoint
# LLM endpoint ## Определение API-интерфейс для взаимодействия с языковой моделью, подверженный rate limit и ценообразованию. Ключевой компонент для интеграции LLM…
- wikiGateway
# Gateway ## Определение API-шлюз, выступающий единой точкой входа для запросов к системе RAG и LLM, обеспечивающий валидацию, маршрутизацию, rate limiting…
- wikiLLM API
# LLM API ## Определение Интерфейс для программного вызова большой языковой модели с ограничениями по скорости и требованиями к надёжности (circuit breaker…
- wikiAPI key
…Как вы проектируете API для внешних систем, использующих вашу LLM|90. Как вы проектируете API для внешних систем, использующих вашу…
- wikiAWS Secrets Manager
# AWS Secrets Manager ## Определение Облачный сервис для управления секретами, такими как API-ключи LLM. Синхронизируется с Kubernetes через External Secrets…
- answerКак работает agent with external tool verification (проверка результатов API)?
…Часто это отдельный [[Вики/LLM call\|LLM-вызов]] с меньшим контекстом и чётким промптом. --- ## 2. Зачем нужна верификация результатов API…
- wikiStripe API
…Что такое idempotency в контексте LLM API и зачем она нужна|406. Что такое idempotency в контексте LLM API и…
- wikiOpenAI Batch API
# OpenAI Batch API ## Определение API OpenAI для пакетной обработки запросов со скидкой до 50%, не подходит для real-time задач…
- wikiKong
# Kong ## Определение Популярный API Gateway с плагинами для rate limiting, аутентификации и маршрутизации. Используется как прокси для LLM-сервисов. ## Где…
- wikiAnthropic Claude API
…Что такое idempotency в контексте LLM API и зачем она нужна|406. Что такое idempotency в контексте LLM API и…
- wikiKubernetes Secret
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- wikipay-per-token
# pay-per-token ## Определение Модель ценообразования LLM API, где стоимость запроса зависит от количества обработанных токенов ввода и вывода. Обеспечивает…
- wikiEventSource API
…Как вы проектируете API для внешних систем, использующих вашу LLM|90. Как вы проектируете API для внешних систем, использующих вашу…
- wikiExternal Secrets Operator
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- wikiAPI costs
# API costs ## Определение Затраты на токены при вызове коммерческих LLM, основной компонент операционных расходов в инференсе. ## Где встречается - [[139. Как…
- wikipybreaker
# pybreaker ## Определение Библиотека Python для реализации паттерна Circuit Breaker, предназначенная для защиты сервисов от каскадных сбоев при вызовах LLM API…
- wikiTensorRT Plugin API
…API для добавления кастомных слоёв и операций в оптимизированный инференсный движок TensorRT, расширяющее его функциональность. ## Где встречается - [[318. TensorRT-LLM…
- answerКак вы защищаете агента от tool injection (вредоносный API ответ)?
…передаём весь ответ LLM response = call_api(url) llm_output = llm.invoke(f"Ответ API: {response}. Ответь пользователю.") ``` Безопасный подход…
- wikiServing API
# Serving API ## Определение gRPC или REST эндпоинт для выдачи признаков (фичей) по запросу с низкой задержкой в реальном времени. ## Где…
- wikiAPI
# API ## Определение Интерфейс программирования приложений, используемый для вызова сервисов, включая LLM и внешние инструменты. ## Где встречается - [[60. Как вы обрабатываете…
- wikirate limiting
# rate limiting ## Определение Механизм контроля частоты запросов к API (например, LLM провайдеров) для предотвращения превышения квот и защиты от перегрузок…
- wikiCustom Metrics API
…API Kubernetes, используемое HPA для получения кастомных метрик (GPU utilization, queue length). ## Где встречается - [[192. Настроить autoscaling для LLM сервера…
- wikiReloader
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- answerЧто такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)?
…В AI-агентах это означает: - Отправка запроса через [[Вики/API\|API]] другого сервиса ([[Вики/LLM endpoint\|OpenAI]], [[Вики/Claude API…
- wikiSealed Secrets
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- wikiIRSA
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- answerКак работает Toolformer (обучение агента использованию инструментов)?
…Вики/API\|API]], подставляя реальные ответы от инструмента и дообучаясь предсказывать эти API-токены. В результате [[Вики/LLM\|LLM]] становится…
- wikiOpenAI API
# OpenAI API ## Определение API для доступа к моделям OpenAI, используется для вызова LLM в RAG-пайплайнах, агентах и других приложениях…
- wikiMock API
# Mock API ## Определение Имитация внешнего API с предопределёнными ответами, позволяющая тестировать агента без реальных вызовов. ## Где встречается - [[788. Что такое…
- wikiDDoS
…Что такое rate limiting на уровне API Gateway для LLM|829. Что такое rate limiting на уровне API Gateway для…
- wikicircuit breaker
…Как проектировать graceful degradation при отказе LLM API|832. Как проектировать graceful degradation при отказе LLM API]] - [[835. Как проектировать…
- wikitenacity
…Что такое circuit breaker и как он применяется к LLM API вызовам|237. Что такое circuit breaker и как он…
- wikiOpenWeatherMap API
# OpenWeatherMap API ## Определение Внешний API для получения текущих погодных данных и прогнозов. Часто используется в пет-проектах как источник оперативной…
- answerКак моделировать экономику агентов с ограниченными бюджетами на API вызовы?
…В контексте API-вызовов ресурсами являются: - [[Вики/токены\|Токены]] (входные/выходные [[Вики/токены\|токены]] [[Вики/LLM\|LLM]]) - Деньги ([[Вики/Inference…
- wikiChatGPT API
…курсе Building Systems with the ChatGPT API для создания production-систем на основе LLM. ## Где встречается - [[800+ вопросов|800+ вопросов…
- wikicaching
…Что такое idempotency в контексте LLM API и зачем она нужна|239. Что такое idempotency в контексте LLM API и…
- wiki5xx
…Что такое idempotency в контексте LLM API и зачем она нужна|239. Что такое idempotency в контексте LLM API и…
- wikiexponential backoff
…Что такое idempotency в контексте LLM API и зачем она нужна|239. Что такое idempotency в контексте LLM API и…
- wikiOpenAI Moderation API
# OpenAI Moderation API ## Определение API для проверки промптов на вредоносность, альтернатива локальным моделям, встроенная фильтрация от OpenAI. ## Где встречается - [[616…
- wikiOAuth
…Как вы проектируете API для внешних систем, использующих вашу LLM|90. Как вы проектируете API для внешних систем, использующих вашу…
- wikiNginx
…Как вы проектируете multi-region active-active для LLM API|247. Как вы проектируете multi-region active-active для LLM…
- wikiusage
# usage ## Определение Поле в ответе API, содержащее количество потраченных токенов (входных и выходных) для мониторинга затрат и использования LLM. ## Где…
- wikiPubSub
…Как вы проектируете multi-region active-active для LLM API|247. Как вы проектируете multi-region active-active для LLM…
- wikiRedis Enterprise CRDB
…Как вы проектируете multi-region active-active для LLM API|247. Как вы проектируете multi-region active-active для LLM…
- wikiVault
…Как вы управляете секретами (API keys для LLM) в Kubernetes|255. Как вы управляете секретами (API keys для LLM) в…
- wikiClusterSecretStore
# ClusterSecretStore ## Определение Ресурс для централизованного хранения секретов на уровне кластера, используемый с External Secrets Operator для управления API-ключами LLM…
- wikijitter
…Что такое idempotency в контексте LLM API и зачем она нужна|239. Что такое idempotency в контексте LLM API и…
- wikiaiobreaker
# aiobreaker ## Определение Асинхронная реализация паттерна Circuit Breaker для Python, используемая для предотвращения повторных вызовов отказавших LLM API. ## Где встречается - [[237…
- wikiCAS
# CAS ## Определение Оптимистичный механизм блокировки, используемый в LLM API для обеспечения идемпотентности и безопасного конкурентного доступа. ## Где встречается - [[239. Что…
- wikiClaude API
…Что такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)|772. Что такое «аутсорсинг» задачи другому LLM (с другим…