Articles
2025
Au-delà du Pass@1 , comment la « Self-play Variational Synthesis » (SVS) maintient l’entropie et dope le raisonnement des LLM
27 août 2025
2024
L'algorithme innovant de Proximal Policy Optimization, Découvrez tout ce que vous devez savoir sur sa création par OpenAI
26 juillet 2024