Interpretability
Interpretability
Определение
Свойство модели, позволяющее понять причины её решений; достигается методами вроде LIME, SHAP или анализа внутренних представлений, что критично для отладки и соответствия регуляциям (например, EU AI Act).
Где встречается
- 290. Что такое Chain-of-Thought без токенов (latent CoT) и как это реализовано
- 575. Как работает hierarchical planning для агентов (разбивка на подзадачи)
- 732. Что такое EU AI Act и как оно влияет на деплой LLM в production
- 800+ вопросов