الذكاء الاصطناعي يتفوق على 30 من أفضل علماء الرياضيات في العالم!
دُهش كبار علماء الرياضيات في العالم من مدى براعة الذكاء الاصطناعي في أداء المهام الموكلة إليه، وذلك اجتماع رياضي سري في بيركلي كاليفورنيا في منتصف مايو 2025، فماذا حدث؟
سافر ثلاثون من أشهر علماء الرياضيات في العالم -بعضهم من أماكن بعيدة مثل المملكة المتحدة- لهذا الاجتماع، وفيه واجهوا روبوت دردشة يستطيع الاستنتاج، إذ كلفوه بحل مسائل لاختبار قدراته الرياضية، وبعد يومين من طرح أسئلة بمستوى أساتذة جامعيين على الروبوت، ذُهل الباحثون عندما اكتشفوا أنه قادر على حل بعض أعقد المسائل القابلة للحل في العالم، يقول كين أونو، عالم الرياضيات بجامعة فيرجينيا: «لدي زملاء قالوا حرفيًا إن هذه النماذج تقترب من العبقرية الرياضية».
الروبوت المعني هنا يعمل بنموذج لغوي ضخم اسمه (o4-mini) صممته شركة أوبن إيه آي ودربته للاستدلال وليكون قادرًا على إجراء استنتاجات شديدة التعقيد. ويُعرف نظيره لدى جوجل باسم Gemini 2.5 Flash، وله قدرات مماثلة.
يتعلم (o4-mini)، التنبؤ بالكلمة التالية في تسلسل معين كأي نموذج لغوي كبير سبق استخدامه لتغذية شات جي بي تي، لكنه يتميز عن النماذج السابقة بكونه أخف وزنًا، وأكثر سرعة، وأن تدريبه تضمن مجموعات بيانات متخصصة مع تعزيز أقوى من البشر، وقد أدى هذا النهج إلى روبوت قادر على الغوص في تفاصيل مسائل رياضية معقدة، على نحو يفوق قدرات النماذج التقليدية.
لمتابعة تقدم (o4-mini)، كلفت أوبن إيه آي منظمة (Epoch AI) بوضع 300 مسألة رياضية لم تُنشر حلولها بعد، إذ تتخصص هذه المنظمة غير الربحية في تقييم أداء النماذج اللغوية. ومع إن النماذج التقليدية قادرة على حل كثير من المسائل المعقدة، فإن أداءها أمام هذه المسائل -التي تختلف عن تلك التي تدربت عليها- لم يتعدَّ نسبة 2%، ما كشف ضعف قدرتها على الاستدلال. لكن (o4-mini) كان مختلفًا تمامًا.
استعانت (Epoch AI) بإيليوت غليزر الحاصل مؤخرًا على درجة الدكتوراه في الرياضيات للمشاركة في مشروع التقييم المسمى (FrontierMath) في سبتمبر 2024. وقد جمع المشروع مسائل جديدة متنوعة الصعوبة، تتدرج من مستوى البكالوريوس إلى الدراسات العليا إلى مستوى الأبحاث، بحلول أبريل 2025، وجد غليزر أن (o4-mini) قادر على حل نحو 20% من الأسئلة، ثم انتقل إلى المستوى الرابع وهو مجموعة من الأسئلة التي تُعدّ تحديًا حتى لأكاديمي متخصص، إذ لا يستطيع سوى عدد قليل جدًا من الناس في العالم وضع مثل هذه الأسئلة ناهيك بحلها.
كان على المشاركين توقيع موافقة على عدم إفشاء الأسرار تلزمهم بالتواصل فقط عبر تطبيق سيجنال، لأن الوسائل التقليدية مجموعة البريد الإلكتروني قد تفحصها أحد نماذج اللغة ما يؤدي إلى «تلويث» مجموعة البيانات.
كانت مكافأة وضع مسألة يعجز النموذج عن حلها 7500 دولار لصاحبها. ومع إن التقدم في إيجاد مثل هذه الأسئلة كان بطيئًا، أراد غليزر تسريع العملية. فاستضافت (Epoch AI) لقاءً مباشرًا في منتصف مايو 2025، وقُسّم الحضور إلى مجموعات من ستة ليتنافسوا طوال يومين على وضع مسائل يستطيعون حلها ويعجز عنها الذكاء الاصطناعي.
في أول مساء شعر أونو بالإحباط من أداء النموذج، الذي أظهر براعة رياضية غير متوقعة أعاقت تقدّم المجموعة، ويقول واصفًا تجربته: «وضعتُ مسألة قد يعدها خبراء مجالنا من المسائل المفتوحة في نظرية الأعداد، أي مسألة بمستوى الدكتوراه». وعندما طلب من (o4-mini) حلّها، شاهد في ذهول وخلال عشر دقائق كيف عرض الروبوت الحل خطوة بخطوة مشيرًا إلى طريقة تفكيره. وأمضى النموذج أول دقيقتين في دراسة الأدبيات المتعلقة بالمجال، ثم كتب أنه يرغب في تجربة نسخة مبسطة من المسألة أولًا للتعلّم. وبعد دقائق، أعلن أنه صار مستعدًا لحل المسألة المعقدة، وبعد خمس دقائق أخرى، قدّم حلًا صحيحًا. وقد وصف أونو ما بدر من (o4-mini) بأنه شيء من الغرور إذ بدأ بالتذاكي وكتب في نهاية الحل: «لا حاجة إلى مصدر، لأن الرقم الغامض حسبته بنفسي».
شعر أونو بالهزيمة، فكتب على تطبيق Signal في الصباح التالي ليُنبّه باقي المشاركين قائلًا: «لم أكن مستعدًا للتعامل مع نموذج كهذا، لم أرَ من قبل مثل هذا النوع من الاستدلال في النماذج. هذا هو ما يفعله العلماء، إنه أمرٌ مُخيف».
ومع أن الفريق نجح في نهاية المطاف في إيجاد عشر مسائل عجز النموذج عن حلها، فقد أصابت الدهشة الباحثين من مدى التطور الذي حققه الذكاء الاصطناعي في عام واحد فقط.
شبّه أونو العمل مع النموذج بأنه مثل التعاون مع زميل متمكن، أما يانغ هوي هي الباحث بمعهد لندن للعلوم الرياضية، والرائد في استخدام الذكاء الاصطناعي بالرياضيات، فقال: «هذا هو بالضبط ما يفعله طالب دراسات عليا موهوب جدًا، بل أكثر من ذلك».
كان الروبوت أيضًا أسرع بكثير من الرياضيين البشر، إذ استغرق دقائق فقط في أداء ما يتطلب من الخبير البشري أسابيع أو شهورًا لإنجازه.
مع أن التحدي أمام (o4-mini) كان مثيرًا، يُعد تطوره مقلقًا أيضًا، إذ أعرب أونو وهي عن قلقهما من أن تُؤخذ نتائج النموذج بثقة مفرطة، يقول هي: «نرى البرهان بالاستقراء، والبرهان بالتناقض، ثم يظهر البرهان بالتخويف. إذا قلت شيئًا بثقة كافية، فالجميع يصمت. وأعتقد أن (o4-mini) قد أتقن البرهان بالتخويف، فهو يقول كل شيء بثقة مطلقة»
مع نهاية اللقاء، بدأ الحاضرون بالتفكير حول مستقبل الرياضيات. ودارت النقاشات حول المستوى الخامس المنتظر أسئلة يعجز حتى أفضل الرياضيين عن حلها، وإذا بلغ الذكاء الاصطناعي هذا المستوى، فإن دور علماء الرياضيات سيتغير جذريًا، وقد يتحول عملهم إلى طرح الأسئلة والتفاعل مع نماذج الاستدلال للمساعدة في اكتشاف حقائق رياضية جديدة، تمامًا كما يتعامل الأستاذ مع طلاب الدراسات العليا، ويتوقع أونو أن يصبح تعزيز الإبداع في التعليم العالي عنصرًا أساسيًا في الحفاظ على تطور الرياضيات في المستقبل.
يقول أونو: «كنت أقول لزملائي إنه من الخطأ الفادح القول بأن الذكاء الاصطناعي العام لن يأتي أبدًا، وأنه فقط حاسوب. لا أريد تأجيج الذعر ولكن، في بعض النواحي، هذه النماذج اللغوية الضخمة قد تجاوزت بالفعل أداء معظم طلاب الدراسات العليا المتميزين في العالم».
اقرأ أيضًا:
https://www.ibelieveinsci.com/لماذا-تختار-معظم-نماذج-الذكاء-الاصطنا/
https://www.ibelieveinsci.com/كيف-نتحقق-من-صحة-المعلومات-التي-يولدها/
المصادر:
الكاتب
أحمد صبري عبد الحكيم

تدقيق
محمد حسان عجك

ترجمة
أحمد صبري عبد الحكيم
