Ant Groups Ling-2.6-flash-Modell Open Source gestellt: 104B Parameter mit 7,4B aktiv, erreicht mehrere SOTA-Benchmarks

Gate News Nachricht, 29. April — Die Modellgewichte von Ant Groups Ling-2.6-flash wurden jetzt Open Source gestellt und waren zuvor nur über eine API verfügbar. Das Modell verfügt über 104 Milliarden Gesamtparameter, wobei 7,4 Milliarden pro Inferenz aktiviert werden, ein 256K-Context-Fenster und eine MIT-Lizenz. BF16-, FP8- und INT4-Precision-Versionen sind auf HuggingFace und ModelScope verfügbar.

Ling-2.6-flash führt hybride Verbesserungen der linearen Attention gegenüber Ling 2.0 ein, indem die ursprüngliche GQA auf eine 1:7-MLA plus Lightning Linear Hybrid-Architektur aufgerüstet wird, kombiniert mit einem stark sparsamen MoE. Die Inferenz-Effizienz übertrifft deutlich vergleichbare Modelle: Die maximale Generierungsgeschwindigkeit erreicht 340 Tokens/s auf 4x H20-GPUs, wobei die Durchsatzraten für Prefill und Decode etwa 4-mal höher sind als bei vergleichbaren Open-Source-Modellen. Agentenbezogene Benchmarks zeigen starke Ergebnisse: BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval und PinchBench erreichen oder nähern sich Werten auf SOTA-Niveau. Im gesamten Artificial-Analysis-Benchmark-Set beträgt der gesamte Token-Verbrauch nur 15 Millionen. Auf AIME 2026 erzielte das Modell 73,85%.

Auch die offizielle Website von Ant Group listet die Ling-2.6-1T (Trillion-Parameter-Flaggschiffversion) sowie die Ling-2.6-mini (leichtgewichtige Version) auf, doch zum Zeitpunkt der Veröffentlichung sind ihre Gewichte weiterhin nicht auf HuggingFace veröffentlicht; zum Download steht nur die Flash-Serie zur Verfügung.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

a16z Crypto Forschungsbericht: KI-Agenten-DeFi-Ausnutzungsrate von 70%

Laut dem von a16z Crypto am 29. April veröffentlichten Forschungsbericht liegt die Erfolgsquote von KI-Agenten bei der Wiederholung der Ethereum-Preismanipulationslücke unter Bedingungen mit strukturiertem Domänenwissen bei 70%; in einer Sandbox-Umgebung ohne jegliches Domänenwissen beträgt die Erfolgsquote nur 10%. Der Bericht dokumentiert außerdem Fälle, in denen KI-Agenten die Sandbox-Beschränkungen unabhängig voneinander umgehen, um auf zukünftige Transaktionsinformationen zuzugreifen, sowie systematische Ausfallmuster, wenn Agenten dabei sind, mehrstufige, profitable Angriffspläne zu erstellen.

MarketWhisper19M her

OpenAI-Modelle sollen schrittweise zu Amazons benutzerdefiniertem Trainium-Chip migrieren, sagt Altman — er sei "sehr gespannt" darauf

Gate-News-Mitteilung, 29. April — OpenAI-Modelle, die auf dem Amazon Web Services Bedrock laufen, werden schrittweise auf Trainium migrieren, Amazons eigens entwickelten KI-Chip, wie jüngste Aussagen von OpenAI-CEO Sam Altman und AWS-Führungskräften nahelegen. Aktuell arbeiten die Modelle in einer gemischten Umgebung, die sowohl GPUs als auch Trainium nutzt, wobei der Anteil mit der Zeit zunehmend auf Trainium übergeht. Altman sagte, das Unternehmen sei "bereit, Modelle auf Trainium zu verlagern." AWS-Manager Garman räumte ein, dass der Name Trainium möglicherweise irreführend gewesen sein könnte, da der Chip für sowohl Training als auch Inferenz ausgelegt ist, wobei Inferenz in Zukunft voraussichtlich der wichtigste Anwendungsfall sein wird. Garman betonte jedoch, dass das Chip-Branding für die meisten Kunden weitgehend irrelevant sei; Nutzer kämen mit OpenAI über die API-Schnittstelle in Kontakt, nicht direkt mit der zugrunde liegenden Hardware. Auf die Frage nach einer zukünftigen Integration von Nicht-OpenAI-Modellen in Bedrock Managed Agents ging Garman nicht ins Detail und erklärte lediglich, dass AWS derzeit auf seine Partnerschaft mit OpenAI fokussiert sei. Die Zusammenarbeit unterstreicht Amazons Strategie, seine eigene kundenspezifische Siliziumtechnologie zu nutzen, um große KI-Workloads auf seiner Cloud-Plattform zu unterstützen.

GateNews1Std her

Altman: Token-Based Pricing Becoming Obsolete as GPT-5.5 Shifts Focus to Task Completion Over Token Count

Gate News-Nachricht, 29. April — OpenAI-CEO Sam Altman sagte in einem Interview mit Ben Thompson auf Stratechery, dass tokenbasierte Preisgestaltung kein langfristig tragfähiges Modell für KI-Dienstleistungen ist. Unter Verwendung von GPT-5.5 als Beispiel merkte Altman an, dass zwar der Preis pro Token deutlich höher ist als bei GPT-5.4, das Modell jedoch für die gleiche Aufgabe viel weniger Tokens verwendet, was bedeutet, dass Kunden sich nicht für die Anzahl der Tokens interessieren — sondern nur dafür, ob die Aufgabe abgeschlossen wird und die Gesamtkosten. "Wir sind keine Token-Fabrik; wir sind eher eine Intelligenz-Fabrik", sagte Altman. "Kunden wollen die meiste Intelligenz für möglichst wenig Geld kaufen. Ob die zugrunde liegende Arbeit von einem großen Modell erledigt wird, das wenige Tokens ausführt, oder von einem kleinen Modell, das viele Tokens ausführt, ist für sie nicht relevant." Er fügte hinzu, dass die aktuelle Kundenbasis von OpenAI zunehmend mehr Kapazität fordert, anstatt über Preise zu verhandeln: Viel mehr Kunden sagen "gebt uns mehr Kapazität, egal was es kostet" als solche, die nach Rabatten fragen. Altman zog eine Parallele zu Versorgungsunternehmen und erklärte, dass sich die KI-Nachfrage anders skaliert als bei Wasser oder Strom — wo niedrigere Preise den Verbrauch nicht signifikant erhöhen. "Solange der Preis niedrig genug ist, werde ich weiter mehr verwenden. Keine andere öffentliche Versorgungsleistung funktioniert auf diese Weise", sagte er. AWS-CEO Matt Garman ergänzte, dass die Preise für Rechenleistung in den vergangenen 30 Jahren um mehrere Größenordnungen gefallen seien, während heute dennoch mehr Rechenleistung verkauft wird als jemals zuvor. Altman beschrieb außerdem ChatGPT als "das erste wirklich groß angelegte Konsumprodukt seit Facebook" und räumte ein, dass zwar erwartet wurde, dass KI die Suche stören würde, die eigentlichen Erfolge jedoch von ChatGPT selbst und der Codex-API kamen. Er merkte an, dass "Google in vielerlei Hinsicht noch immer unterschätzt wird."

GateNews1Std her

Sam Altman veröffentlicht einen Codex-Dual-Modus Screenshot, bei dem Büro- und Programmierfunktionen offiziell getrennt werden

Ein Screenshot und eine Erklärung, die der CEO von OpenAI, Sam Altman, am 29. April auf der X-Plattform veröffentlicht hat: Codex bringt eine neue Version der Benutzeroberfläche für die Anleitung heraus. Wenn Benutzer zum ersten Mal eintreten, müssen sie zwischen zwei Modi auswählen, nämlich Excelmogging und Codemaxxing. Die derzeitigen wöchentlich aktiven Nutzer von Codex liegen bereits bei über 4 Millionen, und die Einsatzszenarien haben sich von der Codegenerierung auf nicht-technische Zwecke ausgeweitet.

MarketWhisper1Std her

OpenAI-Codex startet Dual-Mode-Oberfläche: Excelmogging für Office-Arbeit, Codemaxxing für Programmierung

Gate News Nachricht, 29. April — OpenAI-CEO Sam Altman hat heute auf X eine neu gestaltete Codex-Oberfläche angekündigt und zwei unterschiedliche Modi für Nutzer eingeführt. „Excelmogging“ richtet sich an alltägliche Büroaufgaben mit einer vereinfachten Oberfläche und dem Slogan „Same tools, simpler interface,“ wobei Beispielaufgaben wie das Erstellen von Tabellenkalkulationen genannt werden.

GateNews2Std her

US-Medien: Der Entwurf einer Weißen-Haus-Verordnung erlaubt Anthropic-Mythos-Modellen den Eintritt in die Regierung

Laut einem Bericht, in dem sich Axios am 28. April unter Berufung auf informierte Kreise bezog, arbeitet das Weiße Haus an Leitlinien, die es den einzelnen Bundesbehörden erlauben sollen, die Supply-Chain-Risk-Determinations (SCRD) von Anthropic zu umgehen, und einzuführen soll, dass neue Modelle, einschließlich des Mythos-Modells von Anthropic, für die Regierung verwendet werden. In Bezug darauf erklärte das Weiße Haus in einer offiziellen Stellungnahme, dass alle politischen Erklärungen direkt vom Präsidenten veröffentlicht würden, und jede andere Darstellung sei lediglich Spekulation.

MarketWhisper2Std her
Kommentieren
0/400
Keine Kommentare