Articles
- FutureX , un benchmark avancé et dynamique pour l’évaluation des agents LLM en prédiction du futur
- ReasonRank, le cadre innovant pour optimiser le reranking des passages en recherche d'information
- Le benchmark WideSearch, une évaluation novatrice des agents IA pour la collecte d'informations à grande échelle et fiables
- Meta accusé de tricher avec sa nouvelle intelligence artificielle Llama 4
- Gemini 2.5 Pro, Comment ce modèle révolutionnaire propulse Google au sommet de l'intelligence artificielle mondiale ?
- Mistral Small 3.1, une IA compacte, mais redoutablement puissante