DeepSeek-R1 وصول مجاني غير محدود، هو نموذج استدلال من الجيل الأول تم تدريبه باستخدام التعلم المعزز واسع النطاق (RL) لحل مهام الاستدلال المعقدة.