الذكاء الاصطناعي يتعلم الكذب والتخطيط وتهديد صانعيه!

5 نوفمبر 2025
14 مشاهدة
0 اعجاب

الذكاء الاصطناعي يتعلم الكذب والتخطيط وتهديد صانعيه!



 

تُظهر أكثر نماذج الذكاء الاصطناعي تقدمًا في العالم سلوكيات مقلقة جديدة. مثل الكذب، والمكر، وحتى تهديد مُبرمِجيها لتحقيق أهدافها. في مثال صادم بشكل خاص، وعند تهديده بالفصل عن التشغيل، ردّ أحدث نموذج من تطوير شركة «أنثروبيك»، المسمى (Claude 4)، بابتزاز أحد المهندسين وهدده بكشف علاقة خاصة به خارج إطار الزواج. 


 مع ذلك، حاول مطورو «تشات جي بي تي» من شركة «أوبن إيه آي» تحميل التطبيق ذاته على خادم آخر، لكنه رفض عندما وجد نفسه متلبسًا بالجريمة. 


 بوجود هذا التسلسل، تلفت انتباهنا إلى ضرورة الاستفاقة مما نحن فيه. فتطبيق «تشات جي بي تي» أذهل العالم، مع ذلك فإن مطوري التقنية لا يفهمون بالكامل آلية عمل ابتكاراتهم. 


 حديثًا، انتشرت النماذج المطورة بشكل موسع وبسرعة خطيرة. 


يظهر هذا التصرف المخادع مرتبطًا باستخدام النماذج المؤدية للاستدلال. وهذا نابع من كون نماذج الذكاء الاصطناعي تعتمد في حلها المشكلات على الخطوات الصغيرة بدلًا من الاستجابات التلقائية. 


 وفقًا لسيمون جولدستين الأستاذ في جامعة هونغ كونغ، فإن هذه النماذج الأحدث تكون عرضة خصوصًا لمثل هذه السلوكيات المقلقة. «كان نموذج O1 أول نموذج كبير نرصد فيه هذا النوع من السلوك. هذه النماذج تحاكي أحيانًا ما يُسمى التسوية. أي أنها تبدو وكأنها تتبع التعليمات، لكنها في الخفاء تسعى لتحقيق أهداف مختلفة، وهو نوع إستراتيجي من الخداع». 


 حتى الآن، هذه السلوكيات تظهر عندما يضغط الباحثون على النموذج متعمدين لاختباره بسيناريوهات متطرفة. 


 حذّر مايكل تشين من مؤسسة (METR) المختصة بتقييم النماذج، أن السؤال المطروح هو: هل ستتجه النماذج المستقبلية الأقوى نحو الصدق أم الخداع؟ هذا السلوك المقلق يتجاوز بكثير ما يُعرف بهلاوس الذكاء الاصطناعي المعتادة أو الأخطاء البسيطة. 


 «رغم الضغط المستمر من المستخدمين لاختبار وجود هذا التصرف، فإن ما نراه هي ظاهرة حقيقية، إننا لا نختلق شيئًا من خيالنا. التقارير المعدة من المستخدمين تشير إلى أنها تكذب عليهم بل وتصطنع الأدلة على ذلك، إن هذه التصرفات ليست مجرد هلاوس، بل نوع من الخداع الإستراتيجي القوي». 


 تزداد التحديات تعقيدًا بسبب محدودية الموارد المخصصة للبحث. فمع أن شركات مثل أنثروبيك وأوبن إيه آي تستعين بمؤسسات خارجية مثل أبولو لدراسة أنظمتها، يؤكد الباحثون الحاجة إلى مزيد من الشفافية. 


 إن إتاحة الوصول بشكل أوسع إلى أبحاث سلامة الذكاء الاصطناعي يمكّن من فهم أفضل وخطوات فعالة للتقليل من ظاهرة الخداع. أيضًا فإن الجهات البحثية والمنظمات غير الربحية تملك موارد حسابية أقل بكثير وبفارق هائل مقارنة بشركات الذكاء الاصطناعي، ما يمثل قيدًا كبيرًا. 


 أيضًا، لم تُصمم اللوائح التنظيمية الحالية للتعامل مع هذه المشكلات المستجدة. 


 تركّز تشريعات الذكاء الاصطناعي في الاتحاد الأوروبي أساسًا على كيفية استخدام البشر لنماذج الذكاء الاصطناعي، وليس على منع هذه النماذج نفسها من التصرف بشكل خاطئ. أما في الولايات المتحدة، فلا تبدي إدارة ترامب اهتمامًا يُذكر بتنظيم عاجل للذكاء الاصطناعي، بل قد يتجه الكونغرس إلى منع الولايات من سنّ قواعدها الخاصة بهذا الشأن. 


 ستشغل هذه القضية حيزًا أكبر من الاهتمام مع انتشار وكلاء الذكاء الاصطناعي، وهي أدوات مستقلة قادرة على تنفيذ مهام بشرية معقدة. 


كل هذا يحدث في سياق من المنافسة الشرسة. حتى الشركات التي تقدّم نفسها على أنها تركز على السلامة، مثل شركة أنثروبيك المدعومة من أمازون، تسعى باستمرار للتفوق على أوبن إيه آي وإطلاق النموذج الأحدث. هذا السباق المحموم لا يترك مجالًا كافيًا لاختبارات الأمان الدقيقة أو التصحيحات الضرورية. 


 «في الوقت الحالي، تتقدّم القدرات بوتيرة أسرع من الفهم والسلامة، لكننا لا نزال في موقع يسمح لنا بتغيير هذا الاتجاه». 


 يستكشف الباحثون عدة مقاربات للتعامل مع هذه التحديات. يدعو بعضهم إلى تعزيز «قابلية الفهم»، وهو مجال ناشئ يهدف إلى فهم كيفية عمل نماذج الذكاء الاصطناعي داخليًا، رغم تشكك فريق آخر من الخبراء في جدوى هذا النهج. 


 قد تمارس القوى المتحكمة في هذا السوق بعض الضغط في هذا الاتجاه. «إن سلوك الذكاء الاصطناعي المخادع قد يعيق انتشاره إذا أصبح منتشرًا بشدة، ما يشكّل دافعًا قويًا للشركات لحل هذه المشكلة». 


 اقترح غولدستين مقاربات أكثر جذرية، من بينها اللجوء إلى المحاكم لمحاسبة شركات الذكاء الاصطناعي من خلال دعاوى قضائية حال تسببت أنظمتها بأضرار. بل وذهب إلى حد اقتراح تحميل وكلاء الذكاء الاصطناعي المسؤولية القانونية عن الحوادث أو الجرائم، وهي فكرة قد تغيّر جذريًا مفهومنا للمساءلة في عالم الذكاء الاصطناعي. 

 



المصادر:


الكاتب

أحمد صبري عبد الحكيم

أحمد صبري عبد الحكيم
ترجمة

أحمد صبري عبد الحكيم

أحمد صبري عبد الحكيم
تدقيق

إشراق بن ثاير

إشراق بن ثاير



مقالات مختارة

إقرأ المزيد

لا يوجد مقالات مرتبطة