Modèle Grok 4.20 Thinking utilisant l'apprentissage par renforcement pour réfléchir plus longtemps aux problèmes et les résoudre.