DeepSeek-R1 मुफ्त असीमित एक्सेस, एक पहली पीढ़ी का रीज़निंग मॉडल है जिसे जटिल रीज़निंग कार्यों को हल करने के लिए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग (RL) का उपयोग करके प्रशिक्षित किया गया है।