أعلنت شركة Z.ai الصينية أن نموذجها الجديد GLM-5.2 حقق أداءً يتجاوز GPT-5.5 في مجموعة من أهم اختبارات الذكاء الاصطناعي، خاصة في مجالات الاستدلال المعقد والهندسة البرمجية. ويأتي ذلك في وقت يتسارع فيه السباق العالمي لتطوير نماذج أكثر قدرة على التعامل مع مهام طويلة ومعقدة، ما يعزز المنافسة بين الشركات الصينية ونظيراتها في الولايات المتحدة.
ما الذي حدث؟
كشفت الشركة، المعروفة سابقاً باسم Zhipu AI، عن نموذجها الجديد GLM-5.2، والذي يمثل تحديثاً كبيراً في قدرات الاستدلال، البرمجة، وإدارة المهام متعددة الخطوات.
ووفقاً للبيانات التي نشرتها الشركة، حقق النموذج:
- 54.7 نقطة في اختبار Humanity’s Last Exam
مقابل 52.2 لنموذج GPT-5.5. - أداء متقدم في اختبار FrontierSWE الخاص بالهندسة البرمجية وحل المشكلات المفتوحة.
ما الذي يميز النموذج؟
يركز GLM-5.2 على ما تسميه الشركة “المهام طويلة الأفق”، وهي المهام التي تتطلب:
- استمرارية في التفكير عبر خطوات متعددة
- تخطيط وتنفيذ متسلسل
- قدرة على معالجة سياقات طويلة دون فقدان المعلومات
ويعتمد النموذج على نافذة سياق تصل إلى مليون رمز (tokens)، ما يسمح له بالتعامل مع قواعد بيانات ضخمة، مشاريع برمجية كاملة، ومستندات طويلة ضمن نفس السياق التشغيلي.
لماذا يهم هذا التطور؟
يشير هذا النوع من النماذج إلى تحول واضح في صناعة الذكاء الاصطناعي، من أنظمة تعتمد على المحادثة والإجابة السريعة، إلى أنظمة “وكيليّة” قادرة على:
- تنفيذ مشاريع برمجية متكاملة
- التعامل مع مهام تطوير معقدة
- إدارة عمليات متعددة الخطوات بشكل شبه مستقل
كيف يبدو المشهد التنافسي؟
تأتي هذه الخطوة في سياق احتدام المنافسة بين:
- شركات الذكاء الاصطناعي الصينية الصاعدة
- اللاعبين الأمريكيين الكبار وعلى رأسهم OpenAI
ويرى محللون أن الفجوة التقنية بين الطرفين تتقلص تدريجياً، خصوصاً في مجالات البرمجة والتطبيقات الهندسية، مع صعود نماذج مفتوحة أو هجينة.
ما الذي يجب الانتباه إليه؟
- الحاجة إلى تحقق مستقل من نتائج الاختبارات
- مدى قابلية النموذج للاستخدام التجاري واسع النطاق
- الأداء الفعلي خارج بيئات الاختبار
- اعتبارات السلامة والموثوقية في المهام المعقدة
- سرعة تبني الشركات له في التطبيقات الواقعية
الصورة الأوسع
تعكس هذه الادعاءات اتجاهاً متسارعاً نحو إعادة تشكيل سباق الذكاء الاصطناعي العالمي، حيث لم يعد التفوق يقاس فقط بقدرة النموذج على المحادثة، بل بقدرته على تنفيذ مهام معقدة تشبه العمل البشري المتخصص. وفي هذا السياق، يصبح GLM-5.2 جزءاً من موجة جديدة تحاول نقل الذكاء الاصطناعي من “مساعد ذكي” إلى “نظام منفذ مستقل”.
اذا كنت ترى شيءً غير صحيح او ترغب بالمساهمه في هذا الموضوع، قم بمراجعه قسم السياسة التحريرية.