Metas Gehirn-zu-Text-KI erzielt 61 % Genauigkeit, Open-Source-Code synchron veröffentlicht.

Meta hat diese Woche Brain2Qwerty v2 veröffentlicht, ein nicht-invasives Gehirn-Computer-Interface-System, das neuronale Aktivität mit einem helmförmigen MEG-Scanner (Magnetenzephalographie) aufzeichnet und mit einem End-to-End-Deep-Learning-Modell direkt in Zieltext dekodiert. Die durchschnittliche Wortgenauigkeit liegt bei 61 %. Meta veröffentlicht gleichzeitig den Code und die Datensätze als Teil seines Digital Brain Projects und richtet einen Fonds in Höhe von 5 Millionen US-Dollar ein.

Technische Architektur von Brain2Qwerty v2: Trainingsumfang und End-to-End-Dekodierungsansatz

Das System verwendet ein End-to-End-Deep-Learning-Modell, das direkt von den rohen MEG-Hirnsignalen bis zum Ausgabetext dekodiert, ohne manuell entworfene Zwischenschritte. Ein großes Sprachmodell korrigiert im späteren Verlauf auf Basis des semantischen Kontexts durch Rauschen verursachte Fehler.

Trainingsdatenumfang: etwa 22.000 Sätze von 9 Freiwilligen, jeweils etwa 10 Stunden aufgezeichnete Daten. Meta gibt an, dass die Genauigkeit mit zunehmender Trainingsdatenmenge kontinuierlich steigen wird. Als technischer Vergleich hatte die v1-Version unter MEG-Bedingungen eine Zeichenfehlerrate (CER) von etwa 32 %; bei derselben Aufgabe mit EEG (Elektroenzephalographie) stieg diese auf etwa 67 %.

Technische Vorteile von MEG und bestehende Gerätebeschränkungen

MEG nutzt supraleitende Sensoren zur Erfassung der extrem schwachen magnetischen Felder, die bei neuronaler Aktivität entstehen. Die Magnetfelder durchdringen das Gewebe besser als EEG und liefern relativ klarere Signale. Allerdings kosten MEG-Helme mehrere Millionen US-Dollar und benötigen eine spezielle Umgebung zur Abschirmung externer Magnetfelder, was sie lange auf neurowissenschaftliche Labore beschränkt hat – bisher kein klinischer oder Verbrauchereinsatz.

Brain2Qwerty v2 erreicht unter diesen Geräteeinschränkungen eine Genauigkeit von 61 % und nähert sich damit dem Niveau, das bisher nur implantierbaren Schnittstellen (wie Neuralink) möglich war. Der Grund für Metas Wahl des nicht-invasiven Wegs: Die operative Hürde implantierbarer Schnittstellen macht diese für die meisten potenziellen Nutzer inakzeptabel.

Metas Open-Source-Plan: Digital Brain Project und 5-Millionen-US-Dollar-Fonds

Bei der Veröffentlichung von Brain2Qwerty v2 stellt Meta gleichzeitig den Systemcode und die Trainingsdatensätze als Teil des Digital Brain Projects öffentlich zur Verfügung. Meta richtet außerdem einen Fonds in Höhe von 5 Millionen US-Dollar ein, der speziell für den Aufbau offener neurowissenschaftlicher Datensätze verwendet wird.

Meta weist darauf hin, dass einer der Engpässe in der nicht-invasiven BCI-Forschung der Mangel an öffentlich zugänglichen großen neuronalen Datensätzen ist. Derzeit wiederholen verschiedene Forschungseinrichtungen die grundlegende Datenerfassung mit äußerst geringer Effizienz. Dieser Fonds soll die Gemeinschaft dazu anregen, gemeinsam Basisdatensätze aufzubauen.

Häufig gestellte Fragen

Was ist der grundlegende technische Unterschied zwischen nicht-invasiven und implantierbaren Gehirn-Computer-Schnittstellen?

Implantierbare Schnittstellen (wie Neuralink) setzen Elektroden direkt in die Hirnrinde ein – saubere Signale, niedrige Latenz, hohe Präzision, aber erfordern einen chirurgischen Eingriff. Die größte Herausforderung bei nicht-invasiven Methoden ist das Signal-Rausch-Verhältnis: Schädel und Kopfhaut dämpfen die Signale erheblich, insbesondere bei EEG. MEG hat eine relativ bessere Durchdringung, aber die Gerätekosten und die Umgebungsanforderungen schränken die Verbreitung ein.

Welche technische Bedeutung hat das „End-to-End"-Modell von Brain2Qwerty v2?

Das End-to-End-Modell dekodiert direkt von den rohen MEG-Signalen zum Ausgabetext, ohne dass Forscher manuelle Zwischenschritte entwerfen müssen (z. B. zuerst bestimmte Hirnereignisse identifizieren und daraus Buchstaben ableiten). Meta hat während der Entwicklung mithilfe von KI-Agenten systematisch den Optimierungsspielraum des Dekodierungsprozesses erkundet, aus dem Ingenieure die endgültige Trainingskonfiguration ausgewählt haben.

Wann könnte dieses System in den klinischen oder kommerziellen Markt kommen?

Brain2Qwerty v2 wird derzeit unter Laborbedingungen mit MEG-Geräten getestet; es handelt sich um ein Forschungsstadium und noch nicht in klinischen Studien oder kommerziellen Prozessen. Meta gibt an, dass die Genauigkeit noch verbessert werden kann, aber ein Zeitplan für die klinische oder kommerzielle Nutzung wurde zum Zeitpunkt der Berichterstattung noch nicht bekannt gegeben.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare