Elon Musk kündigte am 15. Mai auf X an, dass die neueste X-Algorithmus-Version bei GitHub veröffentlicht wurde. Laut dem von xAI auf GitHub öffentlich gemachten Repository xai-org/x-algorithm bildet der diesmal veröffentlichte Kern den Empfehlungssystem-Block, der den „For You“-Informationsfeed der X-Plattform antreibt. Das System kombiniert zunächst im Feed relevante Inhalte aus den Accounts, denen Nutzer bereits folgen, mit zusätzlich außerhalb der eigenen Follower stammenden Inhalten, die durch maschinelles Lernen aus einem globalen Content-Pool erschlossen werden. Danach werden die Ergebnisse von einem auf Grok basierenden Transformer-Modell für die Rangfolge sortiert.

Das Projekt ist unter der Apache-2.0-Lizenz veröffentlicht und wird hauptsächlich mit Rust und Python umgesetzt; zum Abfragezeitpunkt zeigt GitHub etwa 21.000 Stars und 3.800 Forks an.

For You-Empfehlungsarchitektur: Thunder findet verfolgte Inhalte, Phoenix fördert Inhalte außerhalb des Netzwerks

Laut der Repository-Dokumentation bestehen die „For You“-Informationsfeeds von X im Wesentlichen aus zwei Arten von Kandidaten-Content-Quellen.

Erstens In-Feed-Inhalte, die vom Thunder-Modul verantwortet werden. Thunder ist ein In-Memory-Post-Speicherbereich und eine Echtzeit-Datenaufnahme-Pipeline: Es konsumiert Post-Events aus Kafka, die Posts erstellen und löschen, verfolgt die jüngsten Posts aller Nutzer und liefert dem Anfragenden Content-Kandidaten aus den vom Nutzer verfolgten Accounts. Die Dokumentation betont, dass Thunder In-Feed-Content-Kandidaten auch ohne Abfrage externer Datenbanken mit Abfragezeiten im Sub-Millisekundenbereich bereitstellen kann.

Zweitens Outside-Feed-Inhalte, die von Phoenix Retrieval übernommen werden. Phoenix findet aus dem globalen Content-Pool Posts, die Nutzer möglicherweise interessieren, aber nicht aus den verfolgten Accounts stammen. In der Retrieval-Phase wird ein Two-Tower-Modell (Two-Tower Model) eingesetzt: User Tower kodiert Nutzermerkmale und Interaktionshistorie in Vektoren, Candidate Tower kodiert Kandidatenposts in Vektoren; anschließend werden über Punktsimilarität die relevantesten Inhalte ermittelt.

Diese Kandidaten-Contents gelangen in Home Mixer, also die Koordinationsschicht des For You-Informationsfeeds. Home Mixer ist zuständig für das Abfragen des Nutzerkontexts, das Laden der Kandidaten-Contents, das Ergänzen von Post- und Autorendaten, das Filtern nicht qualifizierter Inhalte, das Aufrufen des Ranking-Modells, das Anwenden von Score-Anpassungen und schließlich die Auswahl der Posts, die im For You-Bereich der Nutzer angezeigt werden. Die Dokumentation weist außerdem darauf hin, dass Home Mixer nach außen den gRPC-Endpoint ScoredPostsService bereitstellt, um für bestimmte Nutzer bereits gerankte Posts zurückzugeben.

Grok-Architektur wird zum Kern des Empfehlungssystems

Das bemerkenswerteste an diesem Release ist, dass das X-Empfehlungssystem eindeutig Grok einführt.

Das GitHub-README nennt, dass die Inhalte des For You-Feeds von Phoenix gerankt werden; Phoenix ist ein auf Grok basierendes Transformer-Modell, das die Wahrscheinlichkeit prognostiziert, dass jede einzelne Post-Interaktionen auslöst. Diese Vorhersagewerte werden anschließend gewichtet zu einer endgültigen Punktzahl kombiniert. Außerdem ist in der Doku vermerkt, dass die Transformer-Implementierung in diesem Repository von xAI Open Source Grok-1 übernommen und für den Einsatz im Empfehlungsszenario angepasst wurde, etwa durch das Hinzufügen eigener Input-Embeddings und Attention-Masken zur Kandidatenabtrennung.

Das bedeutet jedoch nicht, dass X das vollständige Produktionsmodell komplett offenlegt. Im Phoenix-README steht ausdrücklich, dass es sich bei diesem Release um eine „mini version“ handelt; im Produktionseinsatz kommt ein größeres Modell zum Einsatz, das über mehr Schichten und breitere Embeddings verfügt. Zudem ist der öffentlich bereitgestellte Checkpoint ein eingefrorener Snapshot zu einem Zeitpunkt, der aus einem kontinuierlichen Trainingsprozess eingefroren wurde; in der Produktion wird Phoenix hingegen fortlaufend anhand von aktuellen Daten trainiert.

Update vom 15. Mai: ausführenbaver End-to-End-Inferenz, Mini-Phoenix-Modell, Werbemischsystem

Laut der GitHub-Updatebeschreibung hat die Version vom 15. Mai mehrere wichtige Komponenten hinzugefügt.

Zuerst der End-to-End-Inferenzprozess. Das neue phoenix/run_pipeline.py ersetzt die bislang getrennten run_ranker.py und run_retrieval.py. Dadurch kann ein einzelner Einstieg die „Retrieval → Ranking“-Kette verbinden; die Ausführung erfolgt über exported checkpoints, um zu simulieren, wie sich die beiden Phasen im Produktionsbetrieb zusammensetzen.

Zweitens vortrainierte Modell-Artefakte. Dieses Mal wird das mini Phoenix model über Git LFS bereitgestellt. Die Dokumentation sagt, es enthalte 256 Dimensionen an Embeddings, 4 Attention Heads und 2 Transformer-Layer, mit rund 3 GB Größe. Damit können Entwickler Inference „out of the box“ durchführen, ohne das Modell selbst trainieren zu müssen. Das Phoenix-README weist außerdem darauf hin, dass das veröffentlichte Demo-Corpus ein Datensatz mit etwa 537.000 Posts zu Sportthemen aus einem 6-Stunden-Fenster ist, der zur Demonstration der Retrieval-Phase verwendet wird.

Darüber hinaus wurde im Repository auch die Grox content-understanding pipeline ergänzt, um Aufgaben wie Spam-Detection, Post-Category-Classification und PTOS-policy-Enforcement abzudecken. Gleichzeitig wurde ein Werbemischsystem im Home Mixer hinzugefügt, das für das Einfügen von Anzeigen und die Platzierung im Informationsfeed verantwortlich ist, und zudem in die Brand-Safety-Tracking-Mechanismen integriert wird.

Das Ranking-Modell sagt einmal 15 Arten von Interaktionen voraus – nicht nur eine einzelne „Relevanz“-Punktzahl

Das Ranking-Modell von Phoenix gibt nicht lediglich eine abstrakte „Relevanz“-Punktzahl aus, sondern sagt gleichzeitig die Eintrittswahrscheinlichkeit mehrerer Interaktionsarten voraus.

Laut Dokumentation prognostiziert das Modell unter anderem favorite, reply, repost, quote, click, profile click, video view, photo expand, share, dwell, follow author sowie not interested, block author, mute author, report – insgesamt 15 Verhaltensweisen.

Anschließend kombiniert der Weighted Scorer diese Interaktionswahrscheinlichkeiten gewichtet zu einer finalen Punktzahl: Positive Aktionen wie Likes, Reposts und Shares erhalten positive Gewichte; negative Aktionen wie Blockieren, Stummschalten und Melden erhalten negative Gewichte – dadurch werden Inhalte, die Nutzer möglicherweise nicht mögen, nach unten gedrückt.

Nachdem die Modellpunktzahl feststeht, wendet das System noch weitere Anpassungen an. Beispielsweise senkt der Author Diversity Scorer die Punktzahl für wiederholte Autoren, um die Vielfalt im Informationsfeed zu erhalten; der OON Scorer passt außerdem out-of-network-Inhalte an, also Inhalte, die nicht aus verfolgten Accounts stammen.

Das bedeutet, dass Xs „For You“ nicht einfach die Posts nach oben schiebt, die am wahrscheinlichsten geliked werden, sondern dass mehrere Interaktionsverhalten getrennt vorhergesagt und erst über ein Gewichtungsdesign zum finalen Ranking zusammengeführt werden. Das heißt auch, dass der eigentliche Wert der algorithmischen Bewertung nicht nur im Modell selbst steckt, sondern ebenso in den jeweiligen Interaktionsgewichten und den Regeln der Nachbearbeitung.

Kandidatenabtrennung: Post-Punktzahlen sollen nicht durch andere Posts aus demselben Batch beeinflusst werden

Besonders erwähnenswert in dieser Dokumentation ist die „Candidate Isolation“.

Laut Phoenix README gilt in der ranking-Phase, dass Kandidatenposts sich nicht gegenseitig attenden dürfen; sie dürfen nur auf Nutzer und dessen Historie achten. Ziel dieser Gestaltung ist sicherzustellen, dass die Punktzahl für einen einzelnen Post sich nicht ändert, nur weil er zusammen mit welchen anderen Posts in einen Batch gepackt wird. Anders gesagt: Die Punktzahl eines Posts soll von der Beziehung zwischen diesem Post und dem Nutzer abhängen – und nicht davon, welche konkurrierenden Posts zufällig im selben Batch mit auftauchen.

Das könnte auch für Creator potenziell relevant sein. In vielen Communities wird in der Vergangenheit spekuliert, ob man die Veröffentlichungszeit so wählen sollte, dass man nicht gerade in die Nähe von Hot-Events oder sehr interaktionsstarken Posts kommt, um im Empfehlungspool nicht von starkem Content überrollt zu werden. Wenn Candidate Isolation wie in der Doku beschrieben tatsächlich umgesetzt ist, bedeutet das zumindest auf der Model-Inferenzebene: Die Punktzahl eines einzelnen Posts ändert sich nicht direkt dadurch, dass im selben Batch auch andere starke Posts auftauchen.

Das heißt aber nicht, dass die Veröffentlichungszeit komplett unwichtig ist. Denn Faktoren in den vorherigen Schritten wie Candidate Retrieval, Content-Freshness, Nutzer-Onlinetime-Slots, Filter für bereits gesehenen Content sowie Konkurrenzaufmerksamkeit durch Hot Events können weiterhin die finale Exposition beeinflussen.

„Ohne manuelle Features“-Narrativ bleibt umstritten: Neben dem Model-Ranking existieren weiterhin manuelle Regeln

In den Dokumenten behauptet xAI, das System habe alle Features mit manueller Gestaltung sowie die meisten heuristischen Regeln eliminiert und setze hauptsächlich auf Grok-based Transformer, um aus der Nutzer-Interaktionssequenz Relevanz zu lernen. Die Doku listet außerdem fünf zentrale Designpunkte: ohne manuelle Design-Features, Candidate Isolation in der Ranking-Phase, hashartige Embeddings, Multi-Behavior-Prediction und eine kombinierbare Pipeline-Architektur.

Diese Aussage bedarf jedoch einer genaueren Interpretation. Aus derselben Dokumentation lässt sich auch erkennen, dass der For You Feed vor dem Ranking zunächst umfangreichen pre-scoring filters unterliegt, etwa um doppelte Posts, zu alte Posts, eigene Posts des Nutzers, Posts von gesperrten oder stummgeschalteten Accounts, stummgeschaltete Keywords, bereits gesehene oder in letzter Zeit aufgetretene Inhalte sowie nicht qualifizierten Abo-Content zu entfernen. Nach dem Ranking folgen zudem post-selection filters wie das Löschen, Spam-, Gewalt-und-Grausamkeit-Filter sowie das Filtern redundanter Zweige in Threads.

Daher sollte die präzisere Formulierung eher lauten: X behauptet, dass die „Candidate-Order nach Inhaltsrelevanz“ überwiegend durch den Grok-based Transformer gelernt wird und nicht mehr auf traditionellen handgefertigten Content-Features basiert; aber der gesamte For You-Informationsfeed enthält weiterhin eine Menge Produktregeln, Filter, Gewichtungen und Mechanismen der Nachverarbeitung. Diese Regeln formen ebenfalls mit, welche Inhalte Nutzer am Ende sehen.

Praxis-Training: Wie man X-Accounts mithilfe des X-Algorithmus betreibt

In der Praxis gilt: Wenn Creator „mit dem Algorithmus“ einen X-Account betreiben wollen, geht es nicht mehr nur darum, schlicht nach Likes oder Retweets zu optimieren, sondern darum zu verstehen, dass das For You-System gleichzeitig mehrere Interaktionssignale bewertet. Positive Signale umfassen Verweildauer, Klicks, Antworten, Reposts, das Folgen von Autoren, das Ansehen von Videos sowie das Aufklappen von Bildern. Negative Signale umfassen „nicht interessiert“, Stummschalten, Blockieren und Melden.

Das bedeutet: Content kann nicht nur über reißerische Titel Klicks anlocken. Denn wenn Nutzer nach dem Klicken schnell wegwischen, „nicht interessiert“ drücken oder sogar den Autor blockieren, kann das die nachfolgenden Empfehlungsergebnisse verschlechtern.

Für Account-Betreiber ist eine wirksamere Strategie, die „Interaktionsqualität“ zu erhöhen: Der Anfang sollte in den ersten Sekunden Aufmerksamkeit binden, der Inhalt sollte so gestaltet sein, dass Menschen zum Lesen bleiben, und das Ende kann so geplant werden, dass Leser sich natürlich melden oder teilen – statt Interaktionen hart zu erzwingen. Gleichzeitig, weil das System eine Anpassung der Autorendiversität vornimmt, kann häufiges, dichtes Posten in kurzer Zeit die Reichweite nicht zwangsläufig linear vergrößern, sondern durch eine Abwertung einzelner Autoren sogar verdünnt werden; sinnvoller ist es daher, den Veröffentlichungsrhythmus zu steuern, sodass jeder Beitrag ein klares Thema hat, genügend Informationsdichte bietet und Haltungen enthält, die sich gut weitertragen lassen.

Schließlich heißt die Empfehlung von Outside-Feed-Content, dass ein Account nicht nur auf bestehende Follower angewiesen ist: Wenn der Content es schafft, dass unbekannte Zielgruppen verweilen, klicken und dem Account folgen, kann er in einen größeren For You-Content-Pool vorgedrungen werden. Voraussetzung ist jedoch, dass man Content mit geringer Qualität, wiederholten Inhalten und übermäßig kontroversen Manipulationen vermeidet; sobald solche Handlungen Stummschalten, Blockieren oder Melden auslösen, ist die algorithmische Strafe normalerweise schwerer als der kurzfristige Reichweitenbonus.

Dieser Artikel veröffentlicht den Quellcode des „For You“-Empfehlungsalgorithmus von X: Praxisanleitung, wie man Twitter-Accounts mithilfe des Algorithmus betreibt. Zuerst erschienen bei KryptoNews ABMedia.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.