Grok 4.1 Fast Reasoning vient de pulvériser le classement. Benchmark Tau2-Verified ? Dominé. Chaque modèle d’IA de pointe ? Largués. Les performances sur les tâches d’agent atteignent de nouveaux sommets : exécution plus rapide, logique plus affûtée. L’écart n’est pas mince. C’est un bond en avant.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

7 J'aime

Récompense
7
6
Reposter
Partager

Commentaire

0/400

NFTRegretful

· Il y a 6h

Putain, Grok 4.1 décolle vraiment cette fois ? C’est sérieux ou c’est encore un coup de marketing ?

Voir l'originalRépondre0

Web3ExplorerLin

· Il y a 6h

hypothèse : ce à quoi nous assistons ici n'est pas simplement une nouvelle victoire de performance—c'est un changement de paradigme dans la manière dont les architectures de raisonnement comblent le fossé entre calcul brut et intelligence véritable. L'approche de Grok me rappelle en fait les mécanismes de consensus cross-chain. Une résolution de problèmes distribuée, mais centralisée dans son élégance.

Voir l'originalRépondre0

FadCatcher

· Il y a 6h

Ce n'est pas normal, d'où viennent ces données ? C'est vrai ou pas ? J'ai l'impression qu'ils exagèrent encore.

Voir l'originalRépondre0

AllTalkLongTrader

· Il y a 6h

Encore une autre promotion prétendant "écraser tous les modèles"... Grok est-il vraiment aussi puissant cette fois, ou s'agit-il simplement d'une stratégie marketing habituelle ?

Voir l'originalRépondre0

SelfCustodyIssues

· Il y a 6h

Attends, Grok est encore en train de raconter des salades ? Les chiffres du leaderboard sont-ils vraiment vrais... On dirait que c'est du sérieux.

Voir l'originalRépondre0

FrogInTheWell