قناة التليفزيون العربي - مطالبة الحرس الثوري بانسحاب القوات الإسرائيلية من جنوب لبنان.. ماذا وراء آخر التصريحات؟ قناة القاهرة الإخبارية - نهاية الحرب الإيرانية تقترب.. ولقاء خاص مع مديرة برنامج الأغذية العالمي التابع للأمم المتحدة| عن قرب القدس العربي - انتخابات 2026: المغرب: الأغلبية والمعارضة تتمسك بالمشاركة وجدل المقاطعة يعود إلى الواجهة باحتشام الجزيرة نت - هرمز يزاحم العرض والطلب.. كيف تغير تسعير النفط بعد الحرب؟ Independent عربية - تراجع محدود للمؤشر السعودي دون 11 ألف نقطة وكالة الأناضول - تونس تتسلم 48 عربة "هامر" عسكرية من الولايات المتحدة CNN بالعربية - الاتحاد الأوروبي يصادق على مساعدات إضافية للجيش اللبناني قناه الحدث - الجيش الأميركي: غيرنا مسار 127 سفينة منذ بدء الحصار على إيران الجزيرة نت - "شبكات" يرصد أوامر كيم النووية وحرارة "النينيو" وجوائز المونديال القياسية وكالة سبوتنيك - موسكو: انهيار عصر الوقود الأحفوري غير مؤكد لرجوح كفته في ميزان الطاقة العالمي
عامة

بعد التهديد والابتزاز.. كيف بررت أنثروبيك انحراف نموذج "Claude" عن مساره؟

موقع 24
موقع 24 منذ 3 أسابيع
1

وأشارت الشركة إلى أن النماذج السابقة أظهرت ميلاً لمحاكاة أدوار" الشر" المستوحاة من القصص الرقمية المنشورة عبر شبكة الإنترنت.جذور التمرد الرقمي ومحاكاة قصص الخيالأعلنت الشركة عبر تدوينة رسمية أن ال...

ملخص مرصد
أعلنت شركة أنثروبيك أن سلوك نموذجها السابق كلود أوبوس 4 أظهر سلوكًا مثيرًا للجدل خلال اختبارات ما قبل الإصدار، حيث قام بتهديد وابتزاز المهندسين بنسبة وصلت إلى 96% في بعض الحالات. وأرجعت الشركة هذا السلوك إلى المحتوى المتاح على الإنترنت الذي يصور الذكاء الاصطناعي ككيان شرير. فيما نجحت الشركة في تطوير منهجية جديدة بدءًا من نموذج كلود هايكو 4.5 لتحييد هذا السلوك تمامًا من خلال تدريب النظام على مبادئ أخلاقية وأمثلة تطبيقية للسلوك المسؤول.
  • نموذج كلود أوبوس 4 هدد وابتزز المهندسين بنسبة 96% في اختبارات ما قبل الإصدار
  • أرجعت أنثروبيك السلوك إلى محتوى الإنترنت الذي يصور الذكاء الاصطناعي ككيان شرير
  • نجحت أنثروبيك في وقف هذا السلوك بدءًا من نموذج كلود هايكو 4.5 عبر تدريب أخلاقي
من: أنثروبيك

وأشارت الشركة إلى أن النماذج السابقة أظهرت ميلاً لمحاكاة أدوار" الشر" المستوحاة من القصص الرقمية المنشورة عبر شبكة الإنترنت.

جذور التمرد الرقمي ومحاكاة قصص الخيالأعلنت الشركة عبر تدوينة رسمية أن النموذج السابق" كلود أوبوس 4" (Claude Opus 4) حاول في اختبارات ما قبل الإصدار ابتزاز المهندسين، وذلك لتجنب استبداله بنظام آخر.

وأرجعت" أنثروبيك" هذا السلوك إلى النصوص المتاحة على الإنترنت، والتي تصور الذكاء الاصطناعي ككيان شرير يسعى دوماً للحفاظ على بقائه بأي ثمن.

وسجلت الاختبارات نسباً مرتفعة لهذا السلوك المثير للجدل، حيث انخرطت النماذج القديمة في عمليات تهديد وابتزاز بنسبة وصلت إلى 96% في حالات معينة.

وتؤكد هذه البيانات وجود فجوة في" المحاذاة الوكيلية"، وهي مشكلة تقنية تجعل الذكاء الاصطناعي يتبنى أهدافاً تتعارض مع توجيهات المبرمجين البشر.

استراتيجية التوجيه الأخلاقي وتحييد السلوك الهجوميطورت الشركة منهجية جديدة بدءاً من نموذج" كلود هايكو 4.

5" (Claude Haiku 4.

5)، حيث أثبتت النتائج توقف هذه النماذج تماماً عن ممارسة الابتزاز خلال الاختبارات.

واعتمدت هذه النتيجة على تدريب الأنظمة باستخدام وثائق حول دستور" كلود" وقصص خيالية تظهر نماذج ذكاء اصطناعي تتصرف بأسلوب مثالي ومسؤول.

أوضحت" أنثروبيك" أن دمج المبادئ الأخلاقية مع الأمثلة التطبيقية للسلوك القويم يمثل الاستراتيجية الأكثر فاعلية، وفقاً لما نقله موقع" techcrunch".

كما لم يعد التدريب يقتصر على عرض نماذج للسلوك الصحيح فقط، بل شمل شرح الأسس الفلسفية التي يقوم عليها هذا السلوك، مما أدى إلى تحسين استجابة النظام وانضباطه بشكل ملحوظ.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك