العربية نت - اليابان تراقب التأثير المحتمل للتعريفات الأميركية الإضافية روسيا اليوم - هنغاريا وسلوفاكيا تبدآن في استخدام احتياطياتهما النفطية وكرواتيا تسمح بعبور النفط غير الروسي وكالة ستيب نيوز - الفصائل العراقية تدخل على خط تشكيل الحكومة وتوجه تهديدا لأمريكا القدس العربي - بريطانيا.. زعيم يهودي يدعم تصنيف الحركة الصهيونية “عنصرية” BBC عربي - هل حاول أبستين فتح قناة تواصل خلفية بين قطر وإسرائيل؟ DW عربية - اتجاهات اللياقة تزاوج بين "المشي الياباني" والمدرب الذكي Independent عربية - التوتر في الشرق الأوسط يدعم استمرار صعود أسعار النفط الجزيرة نت - باكستان تتأهب وتعتقل العشرات تحسبا لهجمات بعد غاراتها على أفغانستان العربية نت - الداخلية السورية: فرار جماعي من مخيم الهول بعد انسحاب قسد روسيا اليوم - أسهم أوروبا تسجل مستويات قياسية
عامة

أطاح بـ"جيميناي".. اليكم أفضل نموذج ذكاء اصطناعي في 2026

لبنان 24
لبنان 24 منذ 1 أسبوع

خلال عام 2025، انحصر التنافس على لقب أفضل روبوت محادثة في العالم بين" شات جي بي تي" و" جيميناي"، حيث نجحت في تحقيق قفزة مهمة مع إطلاق" جيميناي 3 Flash"، ما منحها تقدماً واضحاً في سباق. .لكن بعيداً ع...

ملخص مرصد
تفوق نموذج "كلاود Opus 4. 6" من شركة "أنثروبيك" على منافسه "جيميناي 3 Flash" في سباق أفضل روبوت محادثة لعام 2026، وفقاً لتوماس جايد. يتميز النموذج الجديد بقدرات متقدمة في التفكير المعمق وتنفيذ المهام المعقدة بدقة عالية، ما جعله الأفضل في التطبيقات المهنية والعملية.
  • تفوق "كلاود Opus 4. 6" على "جيميناي 3 Flash" في اختبارات برمجة الوكلاء بنسبة 65. 4%
  • حقق النموذج أعلى نسبة إشادة في منصة "OSWorld" بـ 72. 7%
  • تصدر "كلاود Opus 4. 6" مقياس "GDPval-AA" بـ 1606 نقاط متفوقاً على "GPT-5. 2"
من: شركة أنثروبيك متى: عام 2026

خلال عام 2025، انحصر التنافس على لقب أفضل روبوت محادثة في العالم بين" شات جي بي تي" و" جيميناي"، حيث نجحت في تحقيق قفزة مهمة مع إطلاق" جيميناي 3 Flash"، ما منحها تقدماً واضحاً في سباق.

لكن بعيداً عن الأضواء، كانت شركة" أنثروبيك" تعمل في صمت على تطوير نموذجها" Claude"، لتفاجئ السوق بإطلاق" كلاود Opus 4.

6"، الذي لم يكتفِ بتحسين الأداء، بل نجح في التفوق على" غيميناي" في جوانب تُعد الأكثر أهمية في الاستخدامات المهنية والعملية.

، وفق" توماس جايد".

واليوم باتت المعادلة مختلفة؛ فاختيار أفضل نموذج لم يعد قائماً على السرعة أو تعدد الوسائط فقط، بل على القدرة الحقيقية على التفكير المعمق وإنجاز المهام المعقدة بدقة وموثوقية.

لا يمكن إنكار قوة" غيميناي 3 Flash"، إذ يقدم نموذجاً متطوراً بقدرات تقنية لافتة تشمل نافذة سياقية ضخمة تصل إلى مليون رمز، ودعماً متكاملاً للنصوص والصور والصوت والفيديو وملفات" بي دي إف"، فضلًا عن سرعة معالجة تفوق الإصدارات السابقة بشكل ملحوظ.

لكن المنافسة في سوق الذكاء الاصطناعي تجاوزت حدود الأداء التقني المجرد، فمع إطلاق" كلاود Opus 4.

6"، ركزت" أنثروبيك" على تحويل الذكاء الاصطناعي من أداة محادثة متقدمة إلى نظام قادر على تنفيذ المهام الواقعية بكفاءة عالية.

نافذة بمليون رمز تُستخدم بذكاء أكبر.

رغم أن" جيميناي" و" كلاود" يقدمان نافذة سياقية متقاربة الحجم، فإن الاختلاف الحقيقي يكمن في طريقة إدارة هذه البيانات، حيث اعتمدت" أنثروبيك" تقنية جديدة تُعرف باسم" الضغط السياقي"، تسمح للنموذج بتلخيص البيانات تلقائياً خلال المهام طويلة الأمد، ما يمنحه قدرة أعلى على الحفاظ على الترابط الفكري والاستمرارية في المشروعات المعقدة، مثل الأبحاث متعددة المراحل أو عمليات البرمجة المطولة.

كما ركز تدريب" Opus 4.

6" على تحسين التخطيط طويل المدى وتنفيذ المهام الآلية لفترات زمنية أطول، إضافة إلى قدرته على مراجعة الأخطاء واكتشافها ذاتياً داخل الأكواد البرمجية المعقدة.

وتدعم المؤشرات الرقمية هذا التفوق، حيث سجل النموذج نتائج متقدمة في اختبارات برمجة الوكلاء والأنظمة التشغيلية، ما يعزز مكانته كأحد أكثر النماذج كفاءة في التطبيقات العملية.

وتؤكد الأرقام أن هذه التحسينات حوّلت الذكاء الاصطناعي إلى روبوت محادثة يتصرف فعلياً كمهندس أو محلل مبتدئ، حيث تشير الإحصاءات الخاصة بمنصة" Terminal-Bench 2.

0"، الرائدة في مجال برمجة الوكلاء، إلى تفوق" كلاود Opus 4.

6" على جميع النماذج الأخرى بنسبة 65.

4%، فيما حصل النموذج على" و72.

7%" وهي أعلى نسبة إشادة في منصة" OSWorld"، ما يجعله الأفضل على الإطلاق.

كلاود يتفوق في العمل المعرفي الواقعي.

يتجلى التفوق بشكل أوضح في معايير قياس الإنتاجية المهنية، فقد أظهر" كلاود Opus 4.

6" أداءً متقدماً في اختبارات تقيس القدرة على تنفيذ المهام الاقتصادية في مجالات مثل القانون والتمويل والاستشارات المهنية، متجاوزاً نماذج منافسة بفارق ملحوظ.

كما تصدر النموذج اختبارات البحث المتقدم على الإنترنت، واختبارات التفكير متعدد التخصصات التي تُعد من أصعب معايير تقييم قدرات الذكاء الاصطناعي.

وفي مقياس" GDPval-AA" - وهو معيار مصمم لقياس العمل ذي القيمة الاقتصادية في المجالات المالية والقانونية والمهنية - تفوق برنامج" كلاود Opus 4.

6" على برنامج" شات جي بي تي"، لاسيما النموذج الأحدث" GPT-5.

2" بحوالي 144 نقطة متصدراً الترتيب بمعدل (1606) نقطة.

كما تفوق على سلفه (Opus 4.

5) بـ 190 نقطة، فضلاً عن تصدره في مقياس النماذج الرائدة في اختبار" Humanity's Last Exam"، وهو اختبار تفكير قاسٍ متعدد التخصصات.

ورغم ذلك، لا يزال" غيميناي" يحتفظ ببعض نقاط القوة، خاصة في سرعة الاستجابة، والتعامل المتقدم مع الوسائط المتعددة، والتكامل العميق مع منظومة خدمات جوجل، إضافة إلى قدراته في إنشاء الصور، وهي ميزة لا تزال غائبة في" كلاود"، إلا أن الأخير يفرض تفوقه عندما يتعلق الأمر بالتحليل المعقد، والتخطيط طويل المدى، والبرمجة الاحترافية، وتنفيذ المهام متعددة الخطوات بدقة عالية.

إلى جانب التطوير في نموذج" Opus 4.

6"، قدمت" أنثروبيك" مجموعة أدوات جديدة عززت من كفاءة الاستخدام المهني للذكاء الاصطناعي، ومن أبرز هذه الأدوات خاصية" فرق الوكلاء" داخل" كلاود كود"، والتي تسمح بتعاون عدة وكلاء ذكاء اصطناعي في تنفيذ المهام المعقدة، إلى جانب تحسينات في أنظمة التفكير التكيفي، وأدوات مخصصة للعمل داخل برامج مثل" إكسيل" و" باوربوينت".

وتعكس هذه الميزات تحولًا استراتيجياً في فلسفة التطوير؛ فبينما تسعى غوغل إلى تقديم حلول واسعة النطاق لجميع المستخدمين، تركز" أنثروبيك" بشكل أكبر على تطوير أدوات موجهة للمحترفين وبيئات العمل المتخصصة.

أما على مستوى التكلفة، فتقدم جوجل نموذج" غيميناي 3 Flash"، مجاناً للمستخدمين، في حين يتطلب الوصول إلى" Opus 4.

6" الاشتراك في خدمة" كلاود برو" مقابل 20 دولارًا شهريًا، وهو عامل قد يؤثر على قرارات المستخدمين رغم التفوق التقني للنموذج.

بإجراء مقارنة نهائية، فإن" غيميناي 3" يمثل أحد أكثر نماذج الذكاء الاصطناعي تطوراً وانتشاراً، إلا أن إطلاق" كلاود Opus 4.

6" أعاد رسم ملامح المنافسة في هذا القطاع سريع التطور.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك