في التجربة الأولى من نوعها، تمكن العلماء من ترجمة إشارات الدماغ إلى كلام واضح بشكل مباشر.

في البداية، قد يبدو الأمر محض خيال علمي جامح، لكن من الممكن أن يساعد هذا الإنجاز بعض الأشخاص في مشاكل النطق.

ونعم، يمكننا أيضًا الحصول على بعض الواجهات الحاسوبية المستقبلية له (للاتصال مع الدماغ).

إن المفتاح الرئيسي لنظام التحويل هذا عبارة عن خوارزمية ذكاء اصطناعي تُطابق ما يسمعه الشخص مع أنماط النشاط الكهربائي للدماغ، ثم تحولها إلى كلام منطقي ومفهوم بالفعل للمستمع.

وفقًا لأبحاث سابقة؛ عندما نتحدث أو حتى نتخيل ذلك فقط فإن أنماطًا مميزة تظهر في الشبكات العصبونية للدماغ.

في هذه الحالة، يقوم النظام بفك ترميز الاستجابات والردود التي يقوم بها الدماغ بدلاً من الأفكار الفعلية إلى كلام، ولكن مع وجود تطويرٍ كافٍ للنظام ستصبح لديه القدرة على القيام بذلك أيضًا.

يقول نيما ميسغراني-Nima Mesgarani أحد أفراد الفريق البحثي وبروفسور من جامعة كولومبيا في نيويورك: «تساعدنا أصواتنا على التواصل مع أصدقائنا وعائلاتنا والعالم من حولنا، وهذا هو السبب في أن فقدان قوة صوت المرء بسبب الإصابة أو المرض مدمر للغاية.

مع دراسة اليوم، لدينا طريقة محتملة لاستعادة هذه القوة.

لقد تبيّن أنه مع التكنولوجيا المناسبة، يمكن فك رموز أفكار هؤلاء الأشخاص وفهمها من قِبَل أي مستمع».

تُعرف الخوارزمية المستخدمة باسم المشفر الصوتي، وهي من نفس نوع الخوارزمية التي يمكنها تجميع الكلام بعد أن تُدرَّب على حديث البشر.

عندما تحصل على رد من المساعد الصوتي سيري-Siri أو أمازون أليكسا-Amazon Alexa يُنشر مشفر صوتي.

بعبارة أخرى، لا يتعين على أمازون أو آبل برمجة كل كلمة في أجهزتهما؛ وإنما يستخدمان المشفر الصوتي لإنشاء صوت واقعي وفق النص الذي يجب أن يُقال.

هنا لم يُدرّب المشفر الصوتي عن طريق الكلام البشري ولكن عن طريق النشاط العصبي في القشرة السمعية من الدماغ، وتم قياسه على مجموعة من المرضى أثناء خضوعهم لجراحة الدماغ بالاستماع إلى جمل يتم التحدث بها بصوتٍ عالٍ.

مع هذا البنك من البيانات للاستفادة منها، سُجّلت إشارات الدماغ أثناء استماع المرضى للأرقام من 0 إلى 9 والتي كانت تُقرأ من خلال المشفر وتُصفّى وتُنظّم بمساعدة المزيد من عمليات تحليل الذكاء الاصطناعي، ثم وُضعت لتتناسب مع الأصوات التي قد سُمعت، حتى لو كانت النتيجة النهائية ما تزال صوتًا روبوتيًا تمامًا.

أثبتت هذه التقنية فعالية أكبر بكثير من الجهود السابقة التي تمت باستخدام نماذج حاسوبية أبسط على صور طيفية (تمثيل بصري للترددات الصوتية).

يقول ميسغراني: «وجدنا أنه يمكن للناس أن تفهم وتكرر الأصوات بحوالي 75% من الوقت، وهذا ما يتجاوز أكثر بكثير أي محاولات سابقة.

قد مثّل المشفر الصوتي الحساس والشبكات العصبونية القوية الأصوات التي استمع إليها المرضى بدقةٍ مدهشة».

هناك الكثير من العمل الذي ما يزال يتعين علينا القيام به، ولكن الجهد كبير.

مرةً أخرى، يجدر التأكيد على أن النظام لا يحول الأفكار الذهنية الفعلية إلى كلمات منطوقة، ولكنه قد يكون قادرًا على القيام بذلك في نهاية المطاف. وهذا هو التحدي القادم الذي يريد الباحثون معالجته.

في وقت ما في المستقبل قد تكون قادرًا على التفكير في رسائل البريد الإلكتروني الخاصة بك وعرضها على الشاشة أو تشغيل أضواء هاتفك الذكي فقط عن طريق إصدار أمر ذهني.

مع ذلك سيستغرق هذا بعض الوقت؛ لأسباب ليس أقلها أن جميع أدمغتنا تعمل بشكل مختلف بعض الشيء؛ لذا ستكون هنالك حاجة إلى كمية كبيرة من بيانات التدريب من كل شخص لتفسير جميع أفكارنا بدقة.

في المستقبل غير البعيد، من المحتمل أن نتحدث عن الأشخاص الذين لا يستطيعون الكلام وحصولهم على صوت، سواء كانوا يعانون من متلازمة المُنحَبِس، أو يتعافون من جلطة دماغية، أو مصابين بمرض التصلب الجانبي الضموري (ALS) كما في حالة الراحل ستيفن هوكينغ.

يقول ميسغراني: «وفق هذا السيناريو، إذا كان مرتديها يُفكر بـ “أحتاج إلى كوب من الماء”، فيمكن لنظامنا أن يأخذ إشارات الدماغ التي تولدها تلك الفكرة، ويحولها إلى كلامٍ لفظي.

سيُغيِّر هذا قواعد اللعبة؛ فهو سيعطي أي شخص فقد قدرته على الكلام -سواء من خلال الإصابة أو المرض- الفرصة المتجددة للاتصال بالعالم من حوله».


  • ترجمة: ليلى خالد
  • تدقيق: براءة ذويب
  • تحرير: محمد سفنجة
  • المصدر