En décembre 2025, une étude menée par le regroupement de jeux de casino Relum a révélé que Grok, développé par Elon Musk, est l’un des chatbots IA les plus fiables pour le travail, affichant un taux d’hallucination de seulement 8%. En comparaison, ChatGPT et Gemini affichent des taux bien supérieurs, soulignant ainsi l’excellence de Grok.
Elon Musk et la Conférence sur le Transport Intelligent en Israël
En décembre 2025, une étude réalisée par le collecteur de jeux de casino Relum a révélé que le chatbot d’Elon Musk, Grok, est l’un des bots d’intelligence artificielle (IA) les plus fiables pour un usage professionnel. En effet, Grok affiche le taux d’hallucination le plus faible, à seulement 8 % parmi les dix modèles majeurs testés.
Grok dépasse les attentes en matière d’hallucinations
En comparaison, le leader du marché, ChatGPT, a enregistré l’un des taux d’hallucination les plus élevés à 35 %, juste derrière Gemini de Google, qui a affiché un taux d’hallucination élevé de 38 %. Ces résultats soulignent la capacité factuelle de Grok, bien que ce modèle d’IA ait une visibilité de marché inférieure.
L’étude de Relum a évalué les chatbots en fonction du taux d’hallucination, des évaluations clients, de la cohérence des réponses et du taux d’indisponibilité. Les chatbots ont ensuite reçu un score de risque de fiabilité compris entre 0 et 99, les scores plus élevés indiquant des problèmes plus graves.
Grok a réalisé un taux d’hallucination de 8 %, une note de client de 4,5, une cohérence de 3,5 et un taux d’indisponibilité de 0,07 %, ce qui a entraîné un score de risque global de seulement 6. DeepSeek suit de près avec 14 % d’hallucinations et aucun temps d’arrêt, ce qui lui confère un score de risque exceptionnel de 4. Le taux élevé d’hallucinations et d’indisponibilité de ChatGPT lui a donné le score de risque le plus élevé de 99, suivi de Claude et Meta AI avec des scores de risque de 75 et 70 respectivement.
L’importance d’un faible taux d’hallucination
Razvan-Lucian Haiduc, directeur produit chez Relum, a partagé ses réflexions sur les résultats de l’étude. "Environ 65 % des entreprises américaines utilisent maintenant des chatbots IA dans leur travail quotidien, et près de 45 % des employés admettent avoir partagé des informations sensibles de l’entreprise avec ces outils. Ces chiffres montrent à quel point les chatbots sont devenus essentiels dans le travail quotidien.
"La dépendance aux outils d’IA va probablement augmenter encore plus, donc les entreprises devraient choisir leurs chatbots en fonction de leur fiabilité et de leur adéquation à leurs besoins spécifiques. Un chatbot que tout le monde utilise n’est pas nécessairement celui qui fonctionne le mieux pour votre secteur ou qui fournit des réponses précises pour vos tâches."
L’étude révèle une différence notable entre la popularité des chatbots IA et leur performance, avec le faible taux d’hallucination de Grok le positionnant comme un choix solide pour les applications nécessitant une grande précision. Cela malgré le fait que Grok n’est pas aussi largement utilisé par les consommateurs, au moins par rapport à des applications d’IA plus courantes comme ChatGPT.
Mon avis :
Une étude de décembre 2025 par Relum révèle que le chatbot Grok d’Elon Musk, avec un taux de hallucinations de 8%, surpasserait ChatGPT (35%) et Google Gemini (38%) en fiabilité. Bien que moins visible, Grok est préférable pour les applications nécessitant précision et fiabilité, soulignant l’écart entre popularité et performance des outils d’IA.
En tant que jeune média indépendant, WIZEE a besoin de votre aide. Soutenez-nous en nous suivant et en nous ajoutant à vos favoris sur Google News. Merci !
