أطلقت شركة أنثروبيك نموذج Claude Sonnet 5، أحدث إصداراتها من سلسلة Sonnet، في خطوة تستهدف جعل قدرات الوكلاء الأذكياء (Agentic AI) متاحة ضمن نموذج متوسط الحجم، بدلاً من حصرها في النماذج الأكبر والأعلى تكلفة.
ويأتي الإصدار الجديد بعد أشهر شهدت تركيز الشركة على تطوير نماذج Opus، إذ تقول إن Sonnet 5 أصبح يقدم أداءً يقترب من Opus 4.
8 في عدد من المهام، مع تكلفة تشغيل أقل وسرعة أعلى، ما يجعله مناسبًا لتطبيقات التطوير اليومية وأتمتة سير العمل.
جيل جديد من الوكلاء الأذكياءتركز" أنثروبيك" في هذا الإصدار على تعزيز مفهوم الوكيل الذكي القادر على تنفيذ المهام بصورة مستقلة.
فالنموذج الجديد لا يكتفي بالإجابة عن الأسئلة أو توليد النصوص، بل يستطيع التخطيط للمهمة، واستخدام أدوات خارجية مثل متصفحات الإنترنت وسطر الأوامر (Terminal)، ثم متابعة تنفيذ العمل حتى نهايته دون تدخل مستمر من المستخدم.
وتشير الشركة إلى أن مثل هذه القدرات كانت، حتى وقت قريب، تتطلب نماذج أكبر وأكثر استهلاكًا للموارد، بينما أصبح بالإمكان الآن الحصول عليها ضمن نموذج أصغر حجمًا.
كما أصبح Sonnet 5 أكثر قدرة على مراجعة نتائجه ذاتيًا أثناء تنفيذ المهمة، والتأكد من صحة الخطوات قبل الانتقال إلى المرحلة التالية، وهو ما يقلل الحاجة إلى تدخل المستخدم لتصحيح الأخطاء أو إعادة توجيه النموذج.
تقول" أنثروبيك" إن الهدف من Sonnet 5 لم يكن التفوق على Opus 4.
8، وإنما تقليص الفارق بين الفئتين مع الحفاظ على انخفاض التكلفة.
وأظهرت اختبارات الشركة أن النموذج الجديد حقق تحسنًا ملحوظًا مقارنة بالإصدار السابق Sonnet 4.
6 في أربعة مجالات رئيسية، هي الاستدلال المنطقي، واستخدام الأدوات، وكتابة البرمجيات، وإنجاز الأعمال المعرفية.
وفي اختبارات البرمجة المعتمدة على الوكلاء الأذكياء، اقترب أداء Sonnet 5 من نتائج Opus 4.
8، كما تمكن في بعض سيناريوهات العمل المعرفي من تحقيق نتائج مماثلة، بينما احتفظ Opus بأفضليته في المهام الأكثر تعقيدًا، مثل الأبحاث المطولة واتخاذ القرارات الدقيقة.
وترى الشركة أن المستخدمين أصبح بإمكانهم الاختيار بين النموذجين بحسب طبيعة العمل، سواء كان الهدف تحقيق أعلى أداء ممكن أو تحقيق أفضل توازن بين الأداء والتكلفة.
اعتمدت" أنثروبيك" في Sonnet 5 على مستويات مختلفة من الجهد الحاسوبي (Effort Levels)، تسمح بزيادة قدرة النموذج على التفكير وتنفيذ المهام عند الحاجة، أو تقليل استهلاك الموارد في الأعمال اليومية.
وتوضح الشركة أن هذه الآلية تمنح المستخدم مرونة أكبر في الموازنة بين سرعة الإنجاز، وجودة النتائج، وتكلفة التشغيل، خصوصًا في التطبيقات التي تعتمد على تنفيذ عدد كبير من المهام بصورة آلية.
وأشارت اختبارات أجرتها الشركة وشركاؤها قبل الإطلاق إلى أن النموذج أصبح أكثر قدرة على إكمال المهام المعقدة التي كانت الإصدارات السابقة تتوقف في منتصفها، كما بات يراجع مخرجاته تلقائيًا ويصححها أثناء التنفيذ.
تكلفة أقل.
لكن الصورة أكثر تعقيدًاأصبح Claude Sonnet 5 متاحًا لجميع مستخدمي خدمات Claude، وهو النموذج الافتراضي لمشتركي الخطتين Free وPro، كما يتوفر عبر واجهة برمجة التطبيقات (API) ومنصة Claude Code.
وحتى 31 أغسطس 2026، يبلغ سعر الاستخدام دولارين لكل مليون رمز إدخال (Input Tokens)، و10 دولارات لكل مليون رمز إخراج (Output Tokens)، قبل أن ترتفع الأسعار إلى 3 دولارات و15 دولارًا على التوالي.
ورغم أن هذه الأسعار تقل عن تكلفة Opus 4.
8، فإن" أنثروبيك" أوضحت أن Sonnet 5 يستخدم نظامًا جديدًا لتقسيم النصوص إلى رموز (Tokenizer)، وهو مشابه لذلك المستخدم في Opus 4.
7.
ويعني ذلك أن النص نفسه قد ينتج عددًا أكبر من الرموز مقارنة بالإصدارات السابقة، بنسبة تتراوح بين 1 و1.
35 مرة، ما قد يرفع التكلفة الفعلية لبعض الاستخدامات رغم انخفاض السعر المعلن لكل مليون رمز.
ولهذا السبب، رأى بعض المطورين أن تكلفة تشغيل النموذج في المشاريع الواقعية قد تكون أعلى مما توحي به قائمة الأسعار الرسمية، خاصة في التطبيقات التي تعتمد على معالجة كميات كبيرة من النصوص.
أمان أعلى ومعدل أقل من الهلوسةأكدت" أنثروبيك" أن Sonnet 5 يقدم تحسينات واضحة في جانب الأمان مقارنة بالإصدار السابق.
وأظهرت اختبارات ما قبل الإطلاق انخفاضًا في معدلات الهلوسة، إضافة إلى تراجع السلوك التوافقي المفرط مع المستخدم (Sycophancy)، كما أصبح النموذج أكثر قدرة على رفض الطلبات الضارة ومقاومة هجمات Prompt Injection التي تحاول خداعه أثناء تنفيذ المهام بصورة مستقلة.
ورغم ذلك، لا يزال Opus 4.
8 ونسخة Claude Mythos Preview يتفوقان عليه في اختبارات السلوك المعقدة، إذ سجل Sonnet 5 معدلًا أعلى قليلًا من السلوكيات غير المرغوبة مقارنة بهذين النموذجين.
قدرات محدودة في الأمن السيبرانيتؤكد" أنثروبيك" أنها لم تدرب Sonnet 5 خصيصًا على تنفيذ مهام الأمن السيبراني، ولذلك فإن قدراته في هذا المجال تبقى محدودة مقارنة بنماذجها الأكبر.
وأظهرت الاختبارات أن النموذج يستطيع تنفيذ بعض المهام الأمنية الروتينية، لكنه فشل في تطوير استغلالات (Exploits) كاملة لثغرات برمجية، بما في ذلك اختبارات أجريت على ثغرات في متصفح Firefox.
ورغم تسجيله تحسنًا طفيفًا مقارنة بالإصدار السابق، فإن الشركة ترى أن هذا التطور يعود إلى تحسن قدراته العامة في الاستدلال، وليس إلى تدريب متخصص في مجال الأمن السيبراني.
ولهذا السبب، أطلقت" أنثروبيك" النموذج مع تفعيل وسائل حماية إلكترونية افتراضيًا، تعمل على رصد محاولات الاستخدام الضار ومنعها في الوقت الفعلي، مع اعتماد قيود أقل تشددًا من تلك المفروضة على بعض نماذجها الأعلى خطورة.
يمثل Claude Sonnet 5 محاولة من" أنثروبيك" لإعادة فئة النماذج متوسطة الحجم إلى صدارة سباق الوكلاء الأذكياء، بعدما تركزت القفزات التقنية خلال الأشهر الماضية في النماذج الأكبر.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك