Les modèles de Midjourney font désormais face à la concurrence de ceux développés par Black Forest Labs, la startup fondée par les créateurs de Stable Diffusion.

Alors que le marché des générateurs text-to-image se développe progressivement, une question persiste : quel outil offre les meilleures performances ? L’organisme Artificial Analysis, qui fournit des analyses comparatives et des informations objectives pour aider les développeurs, les consommateurs, les chercheurs et les utilisateurs de modèles d’IA, propose une réponse avec Text to Image Arena. Ce classement, similaire à la Chatbot Arena, évalue objectivement les modèles de génération d’images alimentés par l’IA grâce aux contributions des internautes. Sur le site de l’organisme, les visiteurs sont invités à comparer deux modèles, dont l’identité est cachée, en évaluant celui qui répond le plus précisément à la requête.

Les 10 Modèles de Génération d’Images Les Plus Performants en Août 2024

En août 2024, le classement d’Artificial Analysis est dominé par un nouvel acteur : Black Forest Labs. Cette startup, fondée par les créateurs de Stable Diffusion, a pris la première place grâce à la version avancée de FLUX.1, un modèle génératif lancé le 1er août 2024. En moins d’un mois, cette technologie, qui alimente le générateur controversé de l’agent conversationnel Grok développé par X (Twitter), s’est solidement implantée dans le classement, avec deux autres itérations aux 4e et 7e positions.

Le podium est complété par le dernier modèle d’Ideogram et la version 6.1 de Midjourney, qui a récemment quitté Discord pour lancer son propre site web. Stability.ai reste également dans le top 10 à la 6e position, tout comme Playground AI à la 8e place. OpenAI, leader dans la génération de texte, est en retard dans la génération d’images, avec ses modèles DALL-E occupant les 9e et 10e positions.

Voici le classement des 10 modèles de génération d’images les plus performants en août 2024 :

1.FLUX.1 [pro] : 1 151 (score Elo)
2.Ideogram v2 : 1 130
3.Midjourney v6.1 : 1 126
4.FLUX.1 [dev] : 1 118
5.Midjourney v6 : 1 112
6.Stable Diffusion 3 Large : 1 098
7.FLUX.1 [schnell] : 1 091
8.Playground v2.5 : 1 046
9.DALLE 3 HD : 1 041
10.DALLE 3 : 1 023

Ce classement illustre l’évolution rapide et dynamique du domaine de la génération d’images par IA, avec de nouveaux acteurs qui repoussent sans cesse les limites de l’innovation.

Critères de Classement de la Text to Image Arena

Comme la Chatbot Arena, la Text to Image Arena utilise un système de duels pour évaluer les modèles. Les utilisateurs doivent comparer deux modèles anonymisés et désigner celui qui répond le mieux à la requête initiale. Chaque modèle reçoit ensuite un score Elo, qui évolue selon ses performances. Par exemple, si un modèle A perd contre un modèle B au score Elo inférieur, il perdra des points, et inversement. Selon Artificial Analysis, ce classement est mis à jour toutes les heures.

Lire aussi :

Top 10 des Modèles d’IA les Plus Performants en Août 2024