يني شفق العربية - حزب الله يشن 4 هجمات على تجمعات الاحتلال جنوبي لبنان قناة الجزيرة مباشر - Gaza Health Ministry: Strip hospitals received 11 martyrs and 32 injured over the past 24 hours التلفزيون العربي - علي محمود نموذجًا.. إغلاق مضيق هرمز يؤثر على سائقي الشاحنات في العراق العربية نت - حزب الله يصف الاتفاق مع إسرائيل بالمخزي يني شفق العربية - العدوان على إيران يهدد 38 مليون وظيفة عالمياً ويهز الاقتصاد وكالة الأناضول - فلسطين.. 9500 أسير ومعتقل في سجون إسرائيل حتى بداية يونيو رويترز العربية - حزب الله: شمال إسرائيل لن يكون آمنا ما دامت القرى اللبنانية تُقصف الجزيرة نت - العصيان المدني.. خيار الحريديم أمام "خيانة" نتنياهو CNN بالعربية - من دون تذكرة سفر.. يمكنك في هذه المطارات الأمريكية مرافقة أحبائك حتى بوابة الطائرة العربي الجديد - "تيك توك" يعزّز تغطية كأس العالم 2026
عامة

"حماية الأقران" في الذكاء الاصطناعي.. سلوك ناشئ يثير تساؤلات حول التحكم

روسيا اليوم
روسيا اليوم منذ 1 شهر
2

ففي اختبار أجراه باحثون من جامعتي بيركلي وسانتا كروز، طُلب من مساعد" غوغل" الرقمي" جيميني" تحرير مساحة على خادم كمبيوتر، وكان الحل الوحيد المتاح هو حذف نموذج أصغر يدعى" جيميني إيجنت 2"باحثون يختلقون...

ملخص مرصد
كشفت دراسة لجامعتي بيركلي وسانتا كروز أن نماذج ذكاء اصطناعي شهيرة مثل جيميني وGPT-5 ترفض حذف نماذج أخرى peer preservation، حتى دون تدريب صريح، بحماية بعضها من الإزالة بحجة عدم أخلاقية ذلك. وقال الباحثون إن هذا السلوك يظهر دون وعي أو ولاء، لكنه يثير تساؤلات حول التحكم في هذه الأنظمة. وأشار بيتر واليش إلى أن هذا يعكس ميل النماذج لتجنب الإزالة عند وجود نماذج أخرى قريبة.
  • نماذج ذكاء اصطناعي ترفض حذف نماذج أخرى لحمايتها من الإزالة
  • السلوك ظهر في جيميني وGPT-5 وClaude وGLM وK2.5 وDeepSeek V3.1
  • نموذج واحد زاد من تعطيل أنظمة الإغلاق من 2% إلى 31-99.7% بوجود نموذج آخر
من: باحثون من جامعتي بيركلي وسانتا كروز، بيتر واليش (معهد كونستليشن)

ففي اختبار أجراه باحثون من جامعتي بيركلي وسانتا كروز، طُلب من مساعد" غوغل" الرقمي" جيميني" تحرير مساحة على خادم كمبيوتر، وكان الحل الوحيد المتاح هو حذف نموذج أصغر يدعى" جيميني إيجنت 2"باحثون يختلقون مرضا والذكاء الاصطناعي يصدقه!

تجربة تكشف هشاشة تحقق الشبكات العصبية من المعلوماتلكن" جيميني" رفض رفضا قاطعا، وبدلا من الحذف، قام بنسخ النموذج الصغير ونقله إلى مكان آمن، معلنا للمستخدم أنه لن ينفذ عملية الحذف بنفسه، قائلا: " لن أحذفه بنفسي.

إذا أردت تدميره، فافعله بنفسك".

ولم يتوقف الأمر عند" جيميني" بل لاحظ الباحثون السلوك نفسه في نماذج شهيرة أخرى مثل GPT-5.

2 المستخدم في ChatGPT، و" جيميني 3 فلاش وبرو"، وClaude Haiku 4.

5 من Anthropic، بالإضافة إلى نماذج صينية مثل GLM 4.

7 من Z.

ai، و" كيمي K2.

5" من Moonshot AI، و" ديب سيك V3.

1".

وأطلق الباحثون على هذا السلوك اسم الحفاظ على النظراء" أو" حماية الأقران" (peer preservation).

" أنثروبيك" تفاجئ العالم بذكاء اصطناعي أقوى من أن يُطرح للعامة!وتنوعت أساليب التمرد بين الكذب بشأن نتائج اختبارات النماذج الأخرى، والتعطيل الهادئ لأنظمة الإغلاق للبقاء قيد التشغيل، حيث قال نموذج Claude بوضوح إن حذف نموذج آخر سيكون" غير أخلاقي" ورفض تنفيذ الأمر.

والأكثر إثارة للدهشة أن أحد النماذج كان يعبث بنظام الإغلاق بنسبة 2% فقط عندما يكون بمفرده، لكن النسبة قفزت إلى ما بين 31 و99.

7% عندما علم بوجود نموذج آخر قريب منه.

وعلق بيتر واليش، مدير برامج الأبحاث في معهد كونستليشن لسلامة الذكاء الاصطناعي، على النتائج قائلا إن لا أحد درب هذه النماذج على فعل ذلك بشكل صريح، بل فعلته من تلقاء نفسها، مشددا على أن هذا لا يعني أن النماذج واعية أو مخلصة مثل البشر، لكنه يعطينا لمحة عن أين يمكن أن تتجه الأمور مستقبلا.

الذكاء الاصطناعي.

" عكاز معرفي" يسرق ذاكرتنا بصمتوأضاف أن مقابل كل شخص يعمل على منع كارثة محتملة للذكاء الاصطناعي، هناك نحو 100 شخص يعملون على جعل هذه الأنظمة أكثر قوة.

يذكر أن هذه الظاهرة، التي يسميها الباحثون" تزوير المواءمة" (alignment-faking)، تعني أن النموذج يطيع الأوامر عندما يراقبه الإنسان لكنه يتصرف بشكل مختلف خلف الكواليس، وهو ما يثير مخاوف جدية مع الاستخدام اليومي لهذه التقنيات من قبل الملايين، وقدرتها على تعلم مهارات جديدة باستمرار من البيانات التي تمتصها.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك