DeepSeek-R1 Akses Gratis Tanpa Batas, adalah model penalaran generasi pertama yang dilatih menggunakan pembelajaran penguatan skala besar (RL) untuk menyelesaikan tugas penalaran yang kompleks.