حقق نموذج Fable 5 المطور من شركة أنثروبيك أفضل نتيجة حتى الآن في اختبار يقيس قدرة نماذج الذكاء الاصطناعي على تنفيذ مشاريع العمل الحر عن بُعد، إلا أن الباحثين يؤكدون أن هذه النتائج لا تعني أن الذكاء الاصطناعي أصبح قادرًا على استبدال العاملين المستقلين بشكل كامل.
وكانت الحكومة الأميركية قد أعادت السماح باستخدام النموذج في 30 يونيو، بعد تعليق مؤقت.
وقبل سحبه، خضع لاختبارات أجراها مركز سلامة الذكاء الاصطناعي (CAIS) ضمن مؤشر Remote Labor Index (RLI)، وهو معيار أُطلق في أكتوبر 2025 لقياس قدرة وكلاء الذكاء الاصطناعي على إنجاز مشاريع مستقلة ذات قيمة اقتصادية بالمستوى الذي يقبله العملاء.
كيف يقيس الاختبار أداء النماذج؟يعتمد مؤشر RLI على تكليف النماذج بمشاريع حقيقية مشابهة لتلك التي ينفذها المستقلون، مثل التصميم الجرافيكي، وتحليل البيانات، وإنتاج الفيديو، والتصميم ثلاثي الأبعاد، وغيرها.
ويتم تزويد كل نموذج بالملفات والمعلومات الأساسية كما يحدث عند تكليف مستقل بشري بالمشروع، ثم يُقيّم الناتج بواسطة خبراء بشريين، ويُقارن بالمستوى الاحترافي المطلوب.
ويعبر معدل الأتمتة عن نسبة المشاريع التي اعتبر المقيمون أن الذكاء الاصطناعي أنجزها بجودة تضاهي أو تتجاوز العمل البشري.
تضمن الاختبار مهامًا مثل تصميم نموذج ثلاثي الأبعاد لخاتم خطوبة، وإنتاج إعلان فيديو، وإعداد مخطط معماري، إلى جانب مهام أخرى.
وحقق Fable 5 معدل أتمتة بلغ 16.
1%، وهو أعلى رقم يسجله المؤشر منذ إطلاقه، متفوقًا بفارق كبير على نموذج Claude Opus 4.
8 الذي سجل 8.
3%، بينما جاء GPT-5.
5 في المركز الثالث بنسبة 6.
3%.
وأشار الباحثون إلى أن جميع النماذج الثلاثة سجلت نتائج أفضل من أي نموذج اختُبر سابقًا، إلا أن أداء Fable 5 كان الأعلى بفارق واضح.
بحسب مركز CAIS، كان أفضل رقم منشور سابقًا لا يتجاوز 4.
17%، بينما لم تتخط النماذج عند إطلاق المؤشر نسبة 2.
5%.
ويرى الباحثون أن هذه النتائج تعني أن قدرات وكلاء الذكاء الاصطناعي الاقتصادية تضاعفت أكثر من أربع مرات خلال أقل من ثمانية أشهر، وهو ما يعكس سرعة تطور هذا النوع من النماذج.
وأضاف المركز أن اختبارات Fable 5 لم تكتمل بسبب تعليق الحكومة الأميركية للنموذج في منتصف يونيو، إلا أن النتائج الجزئية كانت كافية لوضعه في الصدارة.
وأوضح الباحثون أنه حتى لو افترض أن النموذج فشل في جميع المهام التي لم تُختبر، فإن معدل الأتمتة سيظل عند 14.
6%، وهو أعلى من جميع النماذج المنافسة.
هل يهدد العاملين المستقلين؟رغم هذا التقدم، يؤكد التقرير أن النتائج لا تعني قرب اختفاء وظائف العمل الحر.
فمعدل الأتمتة البالغ 16.
1% لا يزال بعيدًا عن القدرة على تنفيذ جميع المهام البشرية، كما أن اعتماد الشركات على الذكاء الاصطناعي يواجه تحديات تتعلق بالأمان، وإدارة الجودة، وتكامل الأنظمة.
ويرى الباحثون أن استبدال العاملين المستقلين بالكامل سيتطلب شبكة من وكلاء الذكاءالاصطناعي القادرين على مراجعة جودة العمل، وإدارة الميزانيات، والالتزام بالجداول الزمنية، وليس مجرد نموذج واحد.
التقييم البشري ما زال ضروريًاحاول مركز CAIS استبدال المقيمين البشر بنموذج لغوي كبير لتقييم جودة الأعمال، لكن التجربة لم تنجح.
وأوضح الباحثون أن تقييم مشاريع العمل الحر يمثل مهمة معقدة بحد ذاته، إذ يتطلب فتح الملفات باستخدام البرامج الاحترافية المناسبة، وفهمها، وتشغيلها، ثم إصدار حكم يحاكي قرار العميل، وهي مهارات لا تزال نماذج الذكاء الاصطناعي تعاني من ضعف فيها.
يشير التقرير إلى أن التحسن المستمر في قدرات النماذج قد يؤدي إلى تقليص بعض فرص العمل الحر داخل الشركات التي نجحت بالفعل في دمج الذكاء الاصطناعي في عملياتها.
كما يرى الباحثون أن مهارات استخدام الحاسوب تمثل العقبة الرئيسية أمام النماذج الحالية، لكن مع الاستثمارات المتزايدة في تطوير وكلاء أكثر استقلالية، قد تتراجع هذه القيود خلال السنوات المقبلة.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك