DeepSeek

DeepSeek

Определение

DeepSeek — китайская компания, специализирующаяся на разработке больших языковых моделей и методов их обучения. Она предложила метод Group Relative Policy Optimization (GRPO), который используется для обучения с подкреплением языковых моделей без отдельной модели ценности (Value model). DeepSeek также известна своими открытыми моделями, такими как DeepSeek-R1.

Где встречается

Навигация