English translation is not available yet. Showing Russian content.
ONNX
ONNX
Определение
Открытый стандарт для представления моделей, отделяющий архитектуру от фреймворка обучения, позволяющий экспортировать модели для совместимости между различными компиляторами и фреймворками.
Где встречается
- 269. Как вы обрабатываете streaming данные для real-time RAG
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 324. Что такое TVM (Apache TVM) и зачем он нужен для AI инференса
- 325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели
- 625. Что такое adversarial prompt detection для реального времени (runtime)
- 851. Как строить streaming RAG pipeline (real-time ingestion)
- 238. RAG с incremental update