Articles

2025

Au-delà du Pass@1 , comment la « Self-play Variational Synthesis » (SVS) maintient l’entropie et dope le raisonnement des LLM 27 août 2025

2024

L'algorithme innovant de Proximal Policy Optimization, Découvrez tout ce que vous devez savoir sur sa création par OpenAI 26 juillet 2024