العربي الجديد - الحجر قبل البشر: مصر تنفق 10 تريليونات جنيه على البنية التحتية القدس العربي - احتجاجا على إبادة غزة.. تزايد الدعوات في أيرلندا لمقاطعة مواجهة إسرائيل في دوري الأمم الأوروبية العربية نت - إنقاذ طفلتين قبل إعلان زواجهما عرفياً في مصر Euronews عــربي - فيديو. دوا ليبا وكالوم تورنر يحتفلان مع الضيوف بحفل زفاف في صقلية فرانس 24 - مونديال 2026: منتخب إيران يتوجه إلى المكسيك مع اندلاع أزمة حول التأشيرات الأميركية العربي الجديد - الذهب ملاذ الغزيين في مواجهة أزمة المصارف Euronews عــربي - تجدّد الهجمات في الخليج يهدد بتقويض الهدنة بين واشنطن وطهران العربي الجديد - شقق بلا مشترين وشباب بلا مساكن: تونس أمام مفارقة عقارية العربية نت - مدرب إسبانيا يكشف عن أكبر مخاوفه في كأس العالم CNN بالعربية - إعلام: وزير داخلية باكستان سيصل طهران لمواصلة جهود الوساطة مع أمريكا
عامة

نماذج جوجل وOpenAI وأنثروبيك الجديدة للذكاء الاصطناعي تثير جدلاً

لم تعد القفزة الأخيرة في نماذج الذكاء الاصطناعي مجرد زيادة رقمية في مؤشرات الأداء أو تحسناً طفيفاً في جودة الإجابات، بل تعكس تحولاً أعمق في فلسفة بناء هذه الأنظمة وتشغيلها. .ووفق التقارير وخبراء فإن...

ملخص مرصد
أطلقت جوجل وOpenAI وأنثروبيك نماذج ذكاء اصطناعي جديدة تركز على التنفيذ والتفكير الممتد بدلاً من مجرد الإجابة، مع تحسينات في الذاكرة والاستدلال العلمي والبرمجة. هذه النماذج تهدف لتحويل الذكاء الاصطناعي من مجرد مساعد إلى وكيل قادر على تنفيذ مهام معقدة عبر أدوات متعددة.
  • Claude Opus 4.6 يوفر نافذة سياق بمليون توكن لمعالجة مستندات ضخمة بدقة عالية
  • GPT-5.3-Codex ينفذ مهام برمجية كاملة على الكمبيوتر بما في ذلك تثبيت المكتبات وإصلاح الأخطاء
  • Gemini 3 Deep Think يركز على الاستدلال العلمي والرياضي مع تحسينات في حل المسائل غير النمطية
من: جوجل وOpenAI وأنثروبيك أين: عالمياً

لم تعد القفزة الأخيرة في نماذج الذكاء الاصطناعي مجرد زيادة رقمية في مؤشرات الأداء أو تحسناً طفيفاً في جودة الإجابات، بل تعكس تحولاً أعمق في فلسفة بناء هذه الأنظمة وتشغيلها.

ووفق التقارير وخبراء فإن البشر أمام انتقال تدريجي من نموذج يجيب عن سؤال، إلى نظام يفهم الهدف، ويضع خطة عمل، وينفذها عبر أدوات متعددة، ثم يراجع ما أنجزه ويصححه، مع قدرة على الاستمرار في المهمة لساعات أو أيام دون أن يفقد السياق أو تتراجع الدقة.

هذا التحول يستند إلى 3 مرتكزات واضحة، وهي ذاكرة أطول قادرة على استيعاب كميات ضخمة من المعلومات دفعة واحدة، وتفكير ممتد يسمح للنموذج بإعطاء المسائل المعقدة وقتاً إضافياً للتحليل، ومفهوم" الوكيل الذكي" الذي لا يكتفي بالاقتراح، بل ينفذ فعلياً باستخدام أدوات وبرمجيات حقيقية.

في هذا السياق، برزت 3 نماذج تمثل ملامح المرحلة الجديدة وهي Claude Opus 4.

6 من أنثروبيك، وGPT-5.

3-Codex من OpenAI، وتحديث وضع التفكير المتخصص Gemini 3 Deep Think من جوجل.

ورغم اختلاف تركيز كل منها، فإنها جميعا تعكس انتقال الذكاء الاصطناعي من" مُجيب" إلى" منفّذ ومفكّر".

Claude Opus 4.

6.

ذاكرة أطول وتجربة أكثر استقراراً.

ركزت" أنثروبيك" في Claude Opus 4.

6 على تحسين الأداء في المهام الطويلة والمعقدة، خاصة في البرمجة والعمل مع مستندات كبيرة.

إضافة نافذة سياق تصل إلى مليون توكن تعني ببساطة أن النموذج يستطيع قراءة ملفات ضخمة – عقود، تقارير، مراسلات طويلة – والتعامل معها كوحدة واحدة دون أن ينسى التفاصيل.

عندما سجل النموذج 76% في اختبار MRCR v2 مقابل 18.

5% للإصدار السابق، فهذا يعني عملياً أنه أصبح أفضل بكثير في العثور على" المعلومة الصغيرة الحاسمة" داخل كم هائل من النصوص.

بالنسبة لمستخدم يعمل في القانون أو المال أو البحث، يعني ذلك تقليل احتمالية تجاهل بند مهم أو استثناء حساس.

وفي اختبارات مثل Terminal-Bench 2.

0، وHumanity’s Last Exam، وGDPval-AA، أظهر النموذج قدرة أعلى على حل مشكلات متعددة الخطوات، وإنجاز مهام ذات قيمة مهنية حقيقية.

هذه النتائج لا تعني" تفوقاً أكاديمياً" فقط، بل تعني تجربة أكثر استقراراً في العمل اليومي: تقارير أدق، تحليلات أعمق، ومهام طويلة لا تنهار في منتصف الطريق.

كما أضافت أنثروبيك أدوات مثل Adaptive Thinking، ومستويات الجهد المختلفة، ما يسمح للمستخدم باختيار سرعة أعلى للمهام السريعة، أو دقة أكبر للمهام الحساسة.

يمكن للمستخدمين تجربة النموذج عبر موقع claude.

ai مباشرة من المتصفح، سواء للأفراد أو الفرق، كما يتوفر عبر Claude API للمطورين الراغبين في دمجه داخل تطبيقاتهم.

كما أنه متاح عبر منصات سحابية كبرى للشركات التي تحتاج إلى تكامل مؤسسي أوسع.

GPT-5.

3-Codex.

من مساعد برمجي إلى زميل.

ركزت OpenAI مع GPT-5.

3-Codex على تحويل الذكاء الاصطناعي إلى" وكيل يعمل فعليا على الكمبيوتر".

النموذج لا يكتفي بشرح ما يجب فعله، بل يمكنه تنفيذ سلسلة خطوات: تشغيل مشروع، تثبيت مكتبات، اختبار الكود، إصلاح الأخطاء، وتحسين الأداء.

تفوقه في SWE-Bench Pro وTerminal-Bench 2.

0 يعني أنه أكثر قدرة على إصلاح مشكلات برمجية حقيقية.

وأداؤه في OSWorld، الذي يقيس استخدام الكمبيوتر بصرياً، يشير إلى أنه أصبح أقرب إلى تنفيذ مهام إنتاجية فعلية تشبه ما يقوم به الموظف أو المطور يومياً.

تحسين السرعة بنسبة 25% ينعكس مباشرة على تجربة الاستخدام، فالمهام الطويلة تصبح أقل زمناً وأكثر تفاعلية.

كما أن التفاعل اللحظي، حيث يرسل تحديثات أثناء التنفيذ، يجعل التجربة أقرب إلى العمل مع زميل بشري.

يتوفر النموذج ضمن خطط ChatGPT المدفوعة عبر تطبيق ChatGPT على الويب والهواتف، وكذلك عبر بيئات التطوير من خلال Codex CLI وإضافات IDE.

ويمكن للمطورين استخدامه في بيئاتهم البرمجية، مع خطط لإتاحة الوصول عبر API بشكل أوسع.

Gemini 3 Deep Think.

ذكاء علمي وهندسي أعمق.

اتجهت جوجل DeepMind مع Gemini 3 Deep Think إلى رفع مستوى الاستدلال العلمي والرياضي.

النتائج التي حققها النموذج في اختبارات مثل ARC-AGI-2 وHumanity’s Last Exam، وتصنيفات Codeforces، وأولمبياد الرياضيات تعني أنه أصبح أكثر قدرة على التفكير الخوارزمي وحل مسائل غير نمطية.

بالنسبة للمستخدم، يترجم ذلك إلى دعم أقوى في مجالات البحث والهندسة: تحليل بيانات معقدة، بناء نماذج رياضية، تفسير نتائج علمية، وحتى تحويل رسم تخطيطي إلى نموذج ثلاثي الأبعاد قابل للطباعة.

يتاح الوضع المحدث لمشتركي Google AI Ultra داخل تطبيق Gemini.

كما يمكن للباحثين والمهندسين التقدم لبرنامج الوصول المبكر لاستخدامه عبر Gemini API، ما يسمح بدمجه في بيئات البحث والتطوير المؤسسية.

في الحياة العملية اليومية، تعني هذه التطورات إمكانية إعداد تقارير وعروض أكثر احترافية في وقت أقل، وتحليل مستندات ضخمة دون فقدان التفاصيل، بجانب تطوير تطبيقات أو إصلاح أخطاء برمجية بسرعة أكبر.

كما ستتيح النماذج الذكية الجديدة دعماً أعمق في المهام العلمية والهندسية المعقدة.

لكن مع هذه القدرات المتزايدة، يظل دور الإنسان في المراجعة والتوجيه ضرورياً، خاصة في القرارات الحساسة.

الذكاء الاصطناعي أصبح أكثر قدرة على التنفيذ، لكنه ما زال أداة تحتاج إلى إشراف واعٍ.

باختصار، لم يعد السؤال" هل النموذج ذكي؟ " بل" كيف يمكن توظيفه بذكاء في العمل اليومي؟ ، وهو سؤال سيحدد الفارق بين مستخدم يستفيد من هذه القفزة، وآخر يكتفي بمشاهدتها، لإن النوع الأخير قد يكون عرضة لخطر استبداله لإنه لم يسمع" ناقوس الخطر" الذي دقه عشرات الباحثين مؤخراً بعد مغادرتهم كبرى الشركات التقنية العاملة في قطاع الذكاء الاصطناعي.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك