Nouvelles de Gate News, le 10 avril, aujourd’hui la plateforme d’évaluation d’IA de référence à l’échelle mondiale LMArena (plateforme d’évaluation de modèles d’IA basée sur des tests à l’aveugle, avec des millions d’utilisateurs participants) met à jour le classement spécialisé Code Arena : GLM-5.1 prend la première place mondiale des modèles open source et se classe troisième au niveau mondial des modèles.

GLM-5.1 reprend non seulement la capacité de codage open source SOTA de la génération précédente, mais réalise aussi une percée sur les tâches à long terme (Long-Horizon Task), en atteignant : construire un bureau Linux depuis zéro en 8 heures ; 655 itérations pour briser le goulot d’étranglement de l’optimisation des bases de données vectorielles ; et 1000 tours d’appels d’outils pour optimiser la charge de modèles d’apprentissage automatique réels.

À noter : dans les mêmes critères d’évaluation du tableau METR, GLM-5.1 est le seul modèle open source à atteindre un niveau de travail continu de 8 heures, et c’est aussi l’un des rares modèles dans le monde, en dehors de Claude Opus 4.6, à posséder cette capacité.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Google lance Gemini 3.1 Flash TTS : prend en charge 70 langues et un réalisateur de scénarios pour divers contextes, une voix IA plus naturelle

Actualités de l’industrie de l’IA

Google AI annonce le lancement de Gemini 3.1 Flash TTS, un modèle de conversion texte-voix prenant en charge 70 langues, doté de nouvelles fonctionnalités telles que la mise en scène par scénario, le contrôle au niveau du locuteur et des étiquettes audio. Par rapport à ses prédécesseurs, Gemini 3.1 améliore le caractère naturel et l’expressivité de la voix, et peut être utilisé via Google AI Studio ou l’API Gemini, pour une multitude de cas d’usage.

ChainNewsAbmediaIl y a 17m

DownDetector indique que les utilisateurs de Claude rencontrent des problèmes de service

Actualités de l’industrie de l’IA

Message d’actualités Gate, 15 avril — DownDetector, un site de surveillance de l’état du réseau, a enregistré des signalements d’utilisateurs indiquant que Claude, un assistant IA, rencontre des problèmes de service.

GateNewsIl y a 9h

Allbirds lève $50M via des obligations convertibles, se tourne vers une infrastructure d’IA avec NewBird AI

Actions Actualités de l’industrie de l’IA

Allbirds a levé $50 million via des obligations convertibles et va passer du commerce de détail de chaussures à l’informatique IA, en se renommant NewBird AI pour refléter sa nouvelle mission.

GateNewsIl y a 10h

OpenAI prévoit de nouveaux tarifs pour la publicité ChatGPT, tout en explorant des améliorations supplémentaires

Actualités de l’industrie de l’IA

Message de nouvelles Gate, 15 avril — OpenAI prévoit d’introduire de nouvelles tarifications pour les publicités ChatGPT et d’explorer d’autres options de mise à niveau, selon The Information.

GateNewsIl y a 11h

La startup d’IA Hilbert lève $28M lors d’un tour de série A mené par Andreessen Horowitz

Actualités de l’industrie de l’IA

Hilbert, une startup d’IA, a levé $28 million dans le cadre d’un tour de table de Série A mené par Andreessen Horowitz afin d’aider les entreprises à automatiser leurs décisions pour favoriser leur croissance et à améliorer l’efficacité de leurs investissements dans l’IA.

GateNewsIl y a 11h

Claude lance un mécanisme d’authentification d’identité : il exige des documents officiels et un selfie en temps réel, et les utilisateurs en Chine sont les plus touchés.

Actualités de l’industrie de l’IA

Anthropic a mis en place un mécanisme d’authentification d’identité pour ses modèles d’IA Claude, demandant aux utilisateurs de fournir des pièces d’identité en photo délivrées par le gouvernement ainsi qu’une photo selfie prise en temps réel afin de prévenir les abus. Cette mesure affecte particulièrement les utilisateurs en Chine, car ils ne peuvent pas accéder directement au service, tandis que les utilisateurs à Taïwan peuvent terminer la vérification sans difficulté. La vérification est traitée par le prestataire tiers Persona et elle accorde de l’importance à la confidentialité des données, utilisées uniquement pour la confirmation d’identité.

ChainNewsAbmediaIl y a 13h

Commentaire

0/400

Aucun commentaire