ما النماذج اللغوية الكبيرة؟

13 نوفمبر 2025
55 مشاهدة
0 اعجاب

ما النماذج اللغوية الكبيرة؟


 

بات استخدام الذكاء الاصطناعي في مهامنا اليومية شائعًا جدًا، ومن الواضح أن ما يُعرف باسم النماذج اللغوية الكبيرة أدى دورًا مهمًا بهذه الطفرة، فكيف تعمل هذه النماذج؟


تُعرف النماذج اللغوية الكبيرة بأنها نماذج تعلم عميق هائلة الحجم، تدربت مسبقًا على كميات ضخمة من البيانات، وتعتمد على بنية المحول بوصفه مجموعة من الشبكات العصبية، يتكون من مرمز، ومفكك ترميز، مزودَين بآلية الانتباه الذاتي، إذ يعمل المرمز ومفكك الترميز معًا على استخراج المعاني من تسلسل النصوص وفهم العلاقات بين الكلمات والعبارات فيها.


المحولات قادرة على التدريب دون إشراف مباشر، فيما يصح وصفه بالتعلم الذاتي، وفيه تكتسب القدرة على فهم القواعد اللغوية الأساسية واللغات والمعارف العامة. وقد كانت الشبكات العصبية المتكررة القديمة تعالج المدخلات تسلسليًا، أما المحولات فتعالج كامل التسلسلات في وقت واحد، ما يسمح باستخدام وحدات معالجة الرسوميات لتسريع عملية التدريب وتقليل الزمن اللازم لذلك.


تتيح بنية المحولات إنشاء نماذج ضخمة جدًا تحتوي على مئات المليارات من المعاملات، وبوسعها معالجة كميات هائلة من البيانات المأخوذة من الإنترنت ومن مصادر أخرى ضخمة، مثل مشروع الذي يضم أكثر من خمسين مليار صفحة ويب، وموسوعة ويكيبيديا التي تحتوي على نحو سبعة وخمسين مليون صفحة.


ما أهمية النماذج اللغوية الكبيرة؟


تكمن أهميتها الشديدة في مرونتها الكبيرة، إذ يستطيع النموذج الواحد تنفيذ مهام مختلفة تمامًا، مثل إجابة الأسئلة وتلخيص الوثائق وترجمة اللغات واستكمال الجمل، وتُظهر أيضًا قدرة مدهشة على توليد محتوى جديد بناءً على مدخلات بشرية، ما يجعلها تغير طريقة تفاعل الناس مع إنشاء المحتوى واستخدام محركات البحث والمساعدين الافتراضيين.


مع أنها ليست مثالية بعد، فإن النماذج اللغوية الكبيرة تُظهر قدرة مدهشة على التنبؤ اعتمادًا على عدد صغير نسبيًا من المدخلات أو التعليمات، وبالوسع استخدامها في مجال الذكاء الاصطناعي التوليدي لإنتاج محتوى بلغة البشر استنادًا إلى التعليمات النصية المقدمة إليها.


تُعد هذه النماذج ضخمة جدًا، وبوسعها التعامل مع مليارات المعاملات ولها استخدامات عديدة. وجميعها توفر واجهات برمجية تمكن المطورين من إنشاء تطبيقات فريدة قائمة على الذكاء الاصطناعي التوليدي.


كيف تعمل النماذج اللغوية الكبيرة؟


العامل الأساسي هنا هو كيفية تمثيلها للكلمات، ففي المراحل الأولى من التعلم الآلي، كانت تُستخدم جداول رقمية لتمثيل كل كلمة على حدة، لكن هذا النوع من التمثيل لم يكن قادرًا على إدراك العلاقات بين الكلمات، مثل تشابه المعاني أو الارتباطات السياقية بينها، ولتجاوز هذا القيد استُخدمت المتجهات متعددة الأبعاد تُعرف باسم تضمينات الكلمات لتمثيل الكلمات بطريقة تجعل الكلمات ذات المعاني المتقاربة أو العلاقات المشتركة متقاربة في فضاء المتجهات.


باستخدام هذه التضمينات، يمكن لوحدات المحولات معالجة النصوص مسبقًا بوصفها تمثيلات رقمية باستخدام المرمز، ما يتيح لها فهم سياق الكلمات والعبارات ذات المعاني المتقاربة، إضافةً إلى العلاقات النحوية بينها مثل الأسماء والأفعال والصفات. بعد ذلك، يوظف النموذج اللغوي الكبير هذا الفهم اللغوي باستخدام مفكك الترميز لإنتاج مخرجات فريدة تتسم بالترابط والدقة في المعنى.


تدريب النماذج اللغوية الكبيرة


تتكون الشبكات العصبية المعتمدة على المحولات من طبقات متعددة تحتوي على عدد كبير من العُقد، وكل عقدة في طبقة معينة تتصل بجميع العقد في الطبقة التالية، ولكل اتصال وزن وانحياز. يُشار إلى كل الأوزان والانحيازات إلى جانب التمثيلات المتجهة باسم معاملات النموذج. قد تحتوي الشبكات العصبية الضخمة القائمة على المحولات على مليارات المعاملات، ويُحدد حجم النموذج عادةً وفق علاقة تجريبية بين عدد المعاملات وحجم النموذج وكمية بيانات التدريب.


يستخدم التدريب مجموعة ضخمة من البيانات عالية الجودة، وفي أثناء هذه العملية تُعدل قيم المعاملات تدريجيًا ليتمكن من التنبؤ الصحيح للرمز التالي بناءً على تسلسل الرموز السابقة. ويحدث ذلك باستخدام تقنيات التعلم الذاتي التي تعلم النموذج كيفية ضبط المعاملات لزيادة احتمالية التنبؤ الصحيح بالرموز التالية في أمثلة التدريب.


بعد إتمام تدريب النماذج اللغوية الكبيرة، يمكن تكييفها بسهولة لأداء مهام متعددة باستخدام مجموعات صغيرة نسبيًا من البيانات الخاضعة للإشراف، وهي عملية تُعرف باسم الضبط الدقيق. وهنا توجد ثلاثة نماذج تعلم شائعة:


·     التعلم الصفري: يمكن للنماذج الأساسية الاستجابة لمجموعة واسعة من الطلبات دون تدريب صريح باستخدام تعليمات، وتختلف دقة الإجابات هنا.


·     التعلم القليل: عند تقديم عدد محدود من الأمثلة التدريبية ذات الصلة، يتحسن أداء النموذج الأساسي كثيرًا في ذلك المجال المحدد.


·     الضبط الدقيق: وهو امتداد للتعلم القليل، يدرب فيه علماء البيانات النموذج الأساسي لتعديل معاملاته باستخدام بيانات إضافية ذات صلة بالتطبيق المطلوب.


مستقبل النماذج اللغوية الكبيرة


ظهور النماذج التي تستطيع إجابة الأسئلة وتوليد النصوص يشير إلى آفاق مثيرة في المستقبل، فهذه النماذج تقترب تدريجيًا من الأداء المشابه للبشر. والنجاح السريع الذي حققته يبرز الاهتمام الكبير بنماذج تحاكي قدرات الدماغ البشري، بل وتتفوق عليه في بعض المجالات.


·     زيادة القدرات: مع إن مستوى التقنية الحالي مبهر، فالنماذج اللغوية ليست معصومة من الخطأ. ومن المتوقع أن تحقق الإصدارات القادمة دقة أعلى وقدرات أفضل مع تقليل التحيز والأخطاء مع الوقت.


·     التدريب السمعي البصري: في حين يُدرَب معظم النماذج باستخدام النصوص، بدأ بعض المطورين بتدريبها باستخدام مدخلات صوتية ومرئية، ما قد يؤدي إلى تطوير أسرع للنماذج وفتح آفاق جديدة، مثل استخدامها في المركبات الذاتية القيادة.


·     تحول بيئة العمل: تُعد النماذج اللغوية الكبيرة عاملًا ثوريًا سيغير شكل أماكن العمل، إذ ستقلل من المهام الرتيبة والمتكررة تمامًا كما فعلت الروبوتات في المصانع. ومن المجالات المحتملة لذلك: المهام الإدارية البسيطة، وخدمات العملاء، وكتابة النصوص الآلية.


·     الذكاء الاصطناعي الحواري: ستُسهم النماذج اللغوية بلا شك في تحسين أداء المساعدين الافتراضيين مثل Alexa وGoogle Assistant وSiri، ليصبحوا أقدر على فهم نية المستخدم والاستجابة لأوامر أعقد.

 



المصادر:


الكاتب

أحمد صبري عبد الحكيم

أحمد صبري عبد الحكيم
تدقيق

محمد حسان عجك

محمد حسان عجك
ترجمة

أحمد صبري عبد الحكيم

أحمد صبري عبد الحكيم
مراجعة

أكرم محي الدين

أكرم محي الدين



مقالات مختارة

إقرأ المزيد

لا يوجد مقالات مرتبطة