replica
replica
Определение
Копия модели или данных, используемая для отказоустойчивости и масштабирования. В контексте LLM реплики модели развертываются для балансировки нагрузки и обеспечения высокой доступности.
Где встречается
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 235. Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 800+ вопросов
- 37. Реализовать sharded cache на 10+ нод