قناة الجزيرة مباشر - بعد توقيع ترمب.. واشنطن وطهران تبدآن مسار تنفيذ الاتفاق ومفاوضات جنيف المرتقبة قناة القاهرة الإخبارية - في اليوم العالمي للنزهة.. اترك مكتبك وأنقذ صحتك النفسية العربية نت - هجوم استهدف حافلة لوزارة الدفاع في سوريا سكاي نيوز عربية - "اتفاق ترامب الجديد" يربك إسرائيل العربية نت - كيفية إيقاف تشغيل الذكاء الاصطناعي في مستندات "غوغل" وكالة شينخوا الصينية - مسؤول: مستثمرون أجانب يمتلكون أسهما صينية بقيمة 600 مليار دولار أمريكي بنهاية الربع الأول العربية نت - زيادات غير مسبوقة.. طفرة الذكاء الاصطناعي تهدد أسعار آيفون الجزيرة نت - مخزونات النفط الأمريكية تهبط لأدنى مستوى منذ 40 عاما BBC عربي - واشنطن وطهران توقعان اتفاقاً لإنهاء الحرب وبدء مفاوضات تمتد 60 يوماً وكالة شينخوا الصينية - مقالة خاصة: رجال أعمال عرب يبنون حياتهم النابضة بالحيوية في ييوو الصينية
عامة

OpenAI تكشف طريقة لاختبار نماذج الذكاء الاصطناعى دون أن تدرك أنها قيد الاختبار

اليوم السابع
اليوم السابع منذ ساعتين
1

أعلنت شركة OpenAI عن تطوير منهجية متقدمة لتقييم مخاطر نماذج الذكاء الاصطناعي قبل إطلاقها تجاريًّا، في خطوة تهدف إلى تحسين دقة اختبارات الأمان، وتقليل الفجوة بين نتائج الاختبار وسلوك النماذج بعد النشر،...

أعلنت شركة OpenAI عن تطوير منهجية متقدمة لتقييم مخاطر نماذج الذكاء الاصطناعي قبل إطلاقها تجاريًّا، في خطوة تهدف إلى تحسين دقة اختبارات الأمان، وتقليل الفجوة بين نتائج الاختبار وسلوك النماذج بعد النشر، مع تعزيز قدرة الشركات على كشف السلوكيات غير المرغوب فيها بشكل أكثر واقعيًّا.

مشكلة الاختبارات التقليدية وقيود الكشف المبكروبحسب تقرير مفصل منشور بموقع gigazine، تشير الشركة بحسب دراسة منشورة بعنوان، إلى أن الأساليب التقليدية تعتمد على مجموعات بيانات من المحفزات المصممة لاختبار السلوكيات الخطرة، مثل توليد تعليمات ضارة أو محتوى غير آمن، إلا أن هذه الطريقة تعاني من محدودية التغطية، وعدم القدرة على مواكبة أساليب الهجوم الجديدة، إضافة إلى إمكانية تعرف النموذج نفسه على أنه قيد الاختبار، مما يؤدي إلى انخفاض دقة النتائج مقارنة بالسلوك الحقيقي بعد الإطلاق.

تقنية محاكاة النشر Deployment Simulationقدمت OpenAI أسلوبًا جديدًا يعتمد على محاكاة استخدام النموذج في بيئة واقعية باستخدام نماذج أقدم لتوقع سلوك النماذج الأحدث، مثل محاكاة GPT-5.

1 باستخدام GPT-5.

1 أو GPT-5.

4 باستخدام GPT-5.

2، وتُعرف هذه المنهجية باسم محاكاة النشر، وتهدف إلى قياس احتمالية السلوك غير المرغوب فيه بطريقة أقرب إلى الواقع دون كشف عملية الاختبار للنموذج.

نتائج دقيقة وتقليص فجوة ما قبل وما بعد الإطلاقأظهرت النتائج أن هذه الطريقة قادرة على التنبؤ بمعظم أساليب الهجوم بدقة عالية، مع تقليل الفجوة بين سلوك النموذج أثناء الاختبار وبعد الإطلاق، كما بينت البيانات أن أسلوبًا واحدًا فقط في نموذج GPT-5.

4 أظهر فرقًا كبيرًا يتجاوز عشرة أضعاف بين مرحلتي الاختبار والنشر، وهو ما يُعرف باسم استغلال الآلة الحاسبة.

تقليل قدرة النماذج على اكتشاف أنها تحت الاختبارمن أبرز مزايا التقنية الجديدة أنها تقلل بشكل كبير من احتمال إدراك النموذج أنه يخضع للاختبار، إذ كانت بعض النماذج السابقة تتعرف على بيئة الاختبار بنسبة وصلت إلى 99.

72٪، بينما انخفضت هذه النسبة إلى 5.

12٪ فقط باستخدام محاكاة النشر، ما يجعل الاختبارات أقرب إلى الواقع الفعلي بعد الإطلاق.

تأثير محتمل على مستقبل أمان الذكاء الاصطناعيتؤكد هذه الخطوة أنها تمثل تحولًا مهمًّا في منهجيات تقييم الأمان، خصوصًا مع شركات كبرى مثل Anthropic التي تعمل أيضًا على تطوير أنظمة أمان متقدمة، حيث يمكن أن تساعد هذه المقاربة في بناء نماذج أكثر موثوقية وتقليل المخاطر قبل وصولها إلى المستخدمين.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك