أصدرت Meta هذا الأسبوع الإصدار v2 من نظام Brain2Qwerty، وهو نظام واجهة دماغية-حاسوبية غير جراحية يسجل النشاط العصبي عبر خوذة ماسح ضوئي (MEG) ويستخدم نموذج تعلم عميق من طرف إلى طرف لفك تشفير النص المستهدف مباشرة، بمتوسط دقة على مستوى الكلمة يبلغ 61%. كما أعلنت Meta عن فتح المصدر للشفرة ومجموعة البيانات كجزء من مشروع Digital Brain، وأنشأت صندوقًا بقيمة 5 ملايين دولار.
الهيكل التقني لنظام Brain2Qwerty v2: حجم التدريب وطريقة فك التشفير من طرف إلى طرف
يستخدم النظام نموذج تعلم عميق من طرف إلى طرف (end-to-end) لفك تشفير النص مباشرة من إشارات MEG الدماغية الخام، دون الاعتماد على خطوات معالجة وسيطة مصممة يدويًا؛ ويقوم نموذج لغوي كبير (LLM) في المرحلة اللاحقة بتصحيح الأخطاء الناتجة عن الضوضاء بناءً على السياق الدلالي.
حجم بيانات التدريب: حوالي 22 ألف جملة، و9 متطوعين، مع حوالي 10 ساعات من البيانات المسجلة لكل منهم. تشير Meta إلى أن الدقة ستستمر في التحسن مع زيادة حجم بيانات التدريب. كمقارنة تقنية، بلغ معدل خطأ الأحرف (CER) للإصدار v1 في ظل ظروف MEG حوالي 32%؛ وعند استخدام EEG (تخطيط كهربية الدماغ) لنفس المهمة، ارتفع إلى حوالي 67%.
المزايا التقنية لتقنية MEG والقيود الحالية للمعدات
تستخدم MEG أجهزة استشعار فائقة التوصيل لكشف المجالات المغناطيسية الضئيلة جدًا الناتجة عن النشاط العصبي، وتتمتع المجالات المغناطيسية بقدرة اختراق أفضل من EEG، مما يجعل الإشارات أوضح نسبيًا؛ لكن تكلفة خوذة MEG تصل إلى ملايين الدولارات، وتتطلب بيئة خاصة لعزل المجالات المغناطيسية الخارجية، مما يحد استخدامها حاليًا في مختبرات علوم الأعصاب، دون دخول التطبيقات السريرية أو الاستهلاكية.
يحقق Brain2Qwerty v2 دقة 61% في ظل هذه القيود التقنية للمعدات، مقتربًا من المستويات التي كانت تتطلبها سابقًا الواجهات المزروعة فقط (مثل Neuralink). نقطة انطلاق Meta لاختيار المسار غير الجراحي هي أن الحواجز الجراحية للواجهات المزروعة تجعل من الصعب على معظم المستفيدين المحتملين قبولها.
خطة Meta مفتوحة المصدر: مشروع Digital Brain وصندوق بقيمة 5 ملايين دولار
عند إصدار Brain2Qwerty v2، نشرت Meta أيضًا شفرة النظام ومجموعة البيانات كجزء من مشروع Digital Brain. كما أنشأت Meta صندوقًا بقيمة 5 ملايين دولار مخصص لدعم بناء مجموعات بيانات علوم الأعصاب مفتوحة المصدر.
تشير Meta إلى أن إحدى العقبات الرئيسية أمام أبحاث BCI غير الجراحية هي نقص مجموعات البيانات العصبية مفتوحة المصدر واسعة النطاق، حيث أن تكرار جمع البيانات الأساسية بين المؤسسات البحثية حاليًا غير فعال للغاية. يهدف هذا الصندوق إلى تعزيز بناء مجتمعي لبيانات أساسية موحدة.
الأسئلة الشائعة
ما هو الفرق التقني الأساسي بين الواجهات الدماغية-الحاسوبية غير الجراحية والمزروعة؟
الواجهات المزروعة (مثل Neuralink) تزرع أقطابًا كهربائية مباشرة في قشرة الدماغ، مما يوفر إشارة نظيفة وزمن استجابة منخفض ودقة عالية، لكنها تتطلب جراحة. التحدي الرئيسي للطرق غير الجراحية هو نسبة الإشارة إلى الضوضاء: الجمجمة وفروة الرأس تخفف الإشارة بشدة، خاصةً في EEG؛ بينما تتمتع MEG بقدرة اختراق أفضل نسبيًا، لكن التكلفة العالية للمعدات ومتطلبات البيئة تحد من انتشارها.
ما الأهمية التقنية لنموذج "من طرف إلى طرف" في Brain2Qwerty v2؟
النموذج من طرف إلى طرف يفك تشفير النص مباشرة من إشارات MEG الخام، دون الحاجة إلى خطوات وسيطة مصممة يدويًا (مثل تحديد أحداث دماغية معينة أولاً ثم استنتاج الأحرف تدريجيًا). استخدمت Meta أيضًا وكلاء ذكاء اصطناعي (AI agents) أثناء التطوير لاستكشاف مساحة تحسين عملية فك التشفير بشكل منهجي، واختار المهندسون التكوين النهائي للتدريب بناءً على ذلك.
متى قد يدخل هذا النظام إلى الأسواق السريرية أو التجارية؟
يتم حاليًا اختبار Brain2Qwerty v2 في ظل ظروف معدات MEG المختبرية، وهو نظام في مرحلة بحثية، ولم يدخل بعد في تجارب سريرية أو إجراءات تسويقية. تشير Meta إلى أنه لا يزال هناك مجال لتحسين الدقة، لكن الجدول الزمني للتطبيقات السريرية أو التجارية لم يُعلن عنه حتى وقت التقرير.