نماذج جوجل وOpenAI وأنثروبيك الجديدة للذكاء الاصطناعي تثير جدلاً

لم تعد القفزة الأخيرة في نماذج الذكاء الاصطناعي مجرد زيادة رقمية في مؤشرات الأداء أو تحسناً طفيفاً في جودة الإجابات، بل تعكس تحولاً أعمق في فلسفة بناء هذه الأنظمة وتشغيلها.

ووفق التقارير وخبراء فإن البشر أمام انتقال تدريجي من نموذج يجيب عن سؤال، إلى نظام يفهم الهدف، ويضع خطة عمل، وينفذها عبر أدوات متعددة، ثم يراجع ما أنجزه ويصححه، مع قدرة على الاستمرار في المهمة لساعات أو أيام دون أن يفقد السياق أو تتراجع الدقة.

هذا التحول يستند إلى 3 مرتكزات واضحة، وهي ذاكرة أطول قادرة على استيعاب كميات ضخمة من المعلومات دفعة واحدة، وتفكير ممتد يسمح للنموذج بإعطاء المسائل المعقدة وقتاً إضافياً للتحليل، ومفهوم" الوكيل الذكي" الذي لا يكتفي بالاقتراح، بل ينفذ فعلياً باستخدام أدوات وبرمجيات حقيقية.

في هذا السياق، برزت 3 نماذج تمثل ملامح المرحلة الجديدة وهي Claude Opus 4.

6 من أنثروبيك، وGPT-5.

3-Codex من OpenAI، وتحديث وضع التفكير المتخصص Gemini 3 Deep Think من جوجل.

ورغم اختلاف تركيز كل منها، فإنها جميعا تعكس انتقال الذكاء الاصطناعي من" مُجيب" إلى" منفّذ ومفكّر".

Claude Opus 4.

ذاكرة أطول وتجربة أكثر استقراراً.

ركزت" أنثروبيك" في Claude Opus 4.

6 على تحسين الأداء في المهام الطويلة والمعقدة، خاصة في البرمجة والعمل مع مستندات كبيرة.

إضافة نافذة سياق تصل إلى مليون توكن تعني ببساطة أن النموذج يستطيع قراءة ملفات ضخمة – عقود، تقارير، مراسلات طويلة – والتعامل معها كوحدة واحدة دون أن ينسى التفاصيل.

عندما سجل النموذج 76% في اختبار MRCR v2 مقابل 18.

5% للإصدار السابق، فهذا يعني عملياً أنه أصبح أفضل بكثير في العثور على" المعلومة الصغيرة الحاسمة" داخل كم هائل من النصوص.

بالنسبة لمستخدم يعمل في القانون أو المال أو البحث، يعني ذلك تقليل احتمالية تجاهل بند مهم أو استثناء حساس.

وفي اختبارات مثل Terminal-Bench 2.

0، وHumanity’s Last Exam، وGDPval-AA، أظهر النموذج قدرة أعلى على حل مشكلات متعددة الخطوات، وإنجاز مهام ذات قيمة مهنية حقيقية.

هذه النتائج لا تعني" تفوقاً أكاديمياً" فقط، بل تعني تجربة أكثر استقراراً في العمل اليومي: تقارير أدق، تحليلات أعمق، ومهام طويلة لا تنهار في منتصف الطريق.

كما أضافت أنثروبيك أدوات مثل Adaptive Thinking، ومستويات الجهد المختلفة، ما يسمح للمستخدم باختيار سرعة أعلى للمهام السريعة، أو دقة أكبر للمهام الحساسة.

يمكن للمستخدمين تجربة النموذج عبر موقع claude.

ai مباشرة من المتصفح، سواء للأفراد أو الفرق، كما يتوفر عبر Claude API للمطورين الراغبين في دمجه داخل تطبيقاتهم.

كما أنه متاح عبر منصات سحابية كبرى للشركات التي تحتاج إلى تكامل مؤسسي أوسع.

GPT-5.

3-Codex.

من مساعد برمجي إلى زميل.

ركزت OpenAI مع GPT-5.

3-Codex على تحويل الذكاء الاصطناعي إلى" وكيل يعمل فعليا على الكمبيوتر".

النموذج لا يكتفي بشرح ما يجب فعله، بل يمكنه تنفيذ سلسلة خطوات: تشغيل مشروع، تثبيت مكتبات، اختبار الكود، إصلاح الأخطاء، وتحسين الأداء.

تفوقه في SWE-Bench Pro وTerminal-Bench 2.

0 يعني أنه أكثر قدرة على إصلاح مشكلات برمجية حقيقية.

وأداؤه في OSWorld، الذي يقيس استخدام الكمبيوتر بصرياً، يشير إلى أنه أصبح أقرب إلى تنفيذ مهام إنتاجية فعلية تشبه ما يقوم به الموظف أو المطور يومياً.

تحسين السرعة بنسبة 25% ينعكس مباشرة على تجربة الاستخدام، فالمهام الطويلة تصبح أقل زمناً وأكثر تفاعلية.

كما أن التفاعل اللحظي، حيث يرسل تحديثات أثناء التنفيذ، يجعل التجربة أقرب إلى العمل مع زميل بشري.

يتوفر النموذج ضمن خطط ChatGPT المدفوعة عبر تطبيق ChatGPT على الويب والهواتف، وكذلك عبر بيئات التطوير من خلال Codex CLI وإضافات IDE.

ويمكن للمطورين استخدامه في بيئاتهم البرمجية، مع خطط لإتاحة الوصول عبر API بشكل أوسع.

Gemini 3 Deep Think.

ذكاء علمي وهندسي أعمق.

اتجهت جوجل DeepMind مع Gemini 3 Deep Think إلى رفع مستوى الاستدلال العلمي والرياضي.

النتائج التي حققها النموذج في اختبارات مثل ARC-AGI-2 وHumanity’s Last Exam، وتصنيفات Codeforces، وأولمبياد الرياضيات تعني أنه أصبح أكثر قدرة على التفكير الخوارزمي وحل مسائل غير نمطية.

بالنسبة للمستخدم، يترجم ذلك إلى دعم أقوى في مجالات البحث والهندسة: تحليل بيانات معقدة، بناء نماذج رياضية، تفسير نتائج علمية، وحتى تحويل رسم تخطيطي إلى نموذج ثلاثي الأبعاد قابل للطباعة.

يتاح الوضع المحدث لمشتركي Google AI Ultra داخل تطبيق Gemini.

كما يمكن للباحثين والمهندسين التقدم لبرنامج الوصول المبكر لاستخدامه عبر Gemini API، ما يسمح بدمجه في بيئات البحث والتطوير المؤسسية.

في الحياة العملية اليومية، تعني هذه التطورات إمكانية إعداد تقارير وعروض أكثر احترافية في وقت أقل، وتحليل مستندات ضخمة دون فقدان التفاصيل، بجانب تطوير تطبيقات أو إصلاح أخطاء برمجية بسرعة أكبر.

كما ستتيح النماذج الذكية الجديدة دعماً أعمق في المهام العلمية والهندسية المعقدة.

لكن مع هذه القدرات المتزايدة، يظل دور الإنسان في المراجعة والتوجيه ضرورياً، خاصة في القرارات الحساسة.

الذكاء الاصطناعي أصبح أكثر قدرة على التنفيذ، لكنه ما زال أداة تحتاج إلى إشراف واعٍ.

باختصار، لم يعد السؤال" هل النموذج ذكي؟ " بل" كيف يمكن توظيفه بذكاء في العمل اليومي؟ ، وهو سؤال سيحدد الفارق بين مستخدم يستفيد من هذه القفزة، وآخر يكتفي بمشاهدتها، لإن النوع الأخير قد يكون عرضة لخطر استبداله لإنه لم يسمع" ناقوس الخطر" الذي دقه عشرات الباحثين مؤخراً بعد مغادرتهم كبرى الشركات التقنية العاملة في قطاع الذكاء الاصطناعي.