Parquet
Parquet
Определение
Столбцовый формат хранения данных, эффективный для аналитических запросов; используется для хранения offline признаков, логов и датасетов в ML/LLM пайплайнах.
Где встречается
- 109. Как вы бенчмарките DSPy против ручного промпт-инжиниринга в production
- 271. Как вы делаете schema evolution для метаданных документов в RAG
- 856. Как организовать data versioning (DVC, LakeFS, Delta Lake)
- Практика
- 800+ вопросов
- 11. Конвертировать датасет из JSONL в Parquet
- 47. Реализовать query drift детекцию
- 73. Сравнить spot vs on-demand для batch inference
- 151. Настроить trajectory coverage
- 163. Реализовать AB тестирование промптов
- 266. Сгенерировать synthetic датасет для RAG
- 271. Реализовать synthetic eval для агента
- 281. Настроить мониторинг дрейфа метрик