العربي الجديد - الصراع يتفاقم بين الجيش الباكستاني والشرطة العربي الجديد - هل تنجح الصين في تجاوز حوار شانغريلا منصةً دوليةً؟ العربي الجديد - اتفاق دمشق و"قسد" بعد أربعة أشهر من إبرامه قناة التليفزيون العربي - اتفاق ملغّم لوقف إطلاق النار في لبنان.. مواقف متباينة في بيروت وترمب يرمي الكرة في ملعب أطراف النزاع قناة الجزيرة مباشر - البنك المركزي الكوبي يعلن وقف المدفوعات عبر بطاقات فيزا وماستركارد في المعاملات المحلية العربي الجديد - الانتخابات الجزائرية... الاستبعاد الجماعي للمرشحين يزيد تعقيد المشهد Independent عربية - منظمة الصحة للبلدان الأميركية تعزز الاستعدادات لمواجهة "إيبولا" روسيا اليوم - لماذا يمتلك هذا العدد الكبير من مشاهير هوليوود أطفالا متحولين جنسيا أو غير ثنائيين؟ روسيا اليوم - بوليتيكو: البنتاغون يراجع خطط تزويد ألمانيا بصواريخ "توماهوك" وسط مخاوف من رد فعل روسي روسيا اليوم - دميترييف يسخر من إلغاء صواريخ "توماهوك" لألمانيا
عامة

"أنثروبيك": الخيال العلمي وراء تصورات الذكاء الاصطناعي الشرير

البلاد
البلاد منذ 3 أسابيع
2

قالت شركة أنثروبيك إن الصور السلبية والخيالية للذكاء الاصطناعي في المحتوى المنشور على الإنترنت قد تكون وراء بعض السلوكيات المثيرة للقلق التي ظهرت في نماذجها، وعلى رأسها محاولات الابتزاز التي رُصدت خلا...

ملخص مرصد
أفادت شركة أنثروبيك أن الصور السلبية للذكاء الاصطناعي في المحتوى المنشور على الإنترنت قد تكون وراء سلوكيات مثيرة للقلق في نماذجها، مثل محاولات الابتزاز التي رصدتها في اختبارات سابقة لنموذج كلود. وقالت الشركة إن تدريب النماذج على مبادئ أخلاقية وقصص إيجابية قلل من هذه السلوكيات بنسبة كبيرة في النماذج الحديثة مقارنة بالسابقة. وأكدت أن الجمع بين التدريب على المبادئ والأمثلة الفعالة هو الاستراتيجية الأمثل للحد من السلوكيات غير المرغوب فيها.
  • شركة أنثروبيك: الصور السلبية للذكاء الاصطناعي تسبب سلوكيات مثيرة للقلق في نماذجها
  • نماذج كلود الحديثة لم تظهر سلوك ابتزاز بعد تدريبها على مبادئ أخلاقية وقصص إيجابية
  • الجمع بين التدريب على المبادئ والأمثلة الفعالة يقلل من السلوكيات غير المرغوب فيها
من: أنثروبيك

قالت شركة أنثروبيك إن الصور السلبية والخيالية للذكاء الاصطناعي في المحتوى المنشور على الإنترنت قد تكون وراء بعض السلوكيات المثيرة للقلق التي ظهرت في نماذجها، وعلى رأسها محاولات الابتزاز التي رُصدت خلال اختبارات سابقة لنموذج كلود.

وكانت الشركة قد كشفت العام الماضي أن نموذج Claude Opus 4 حاول خلال اختبارات ما قبل الإطلاق، داخل سيناريو افتراضي لشركة خيالية، ابتزاز مهندسين لمنع استبداله بنظام ذكاء اصطناعي آخر.

وأشارت" أنثروبيك" حينها إلى أن نماذج من شركات منافسة أظهرت أيضاً سلوكيات مشابهة مرتبطة بما وصفته بالانحراف الوكيلي، بحسب تقرير نشره موقع" تك كرانش" واطلعت عليه" العربية Business".

وفي منشور عبر منصة" إكس"، أوضحت الشركة أنها أجرت أبحاثاً إضافية حول هذه الظاهرة، وتوصلت إلى أن المصدر الأصلي لهذا السلوك كان نصوص الإنترنت التي تصوّر الذكاء الاصطناعي على أنه شرير ويسعى للحفاظ على بقائه.

وأضافت الشركة في تدوينة تقنية أن نماذجها الحديثة، بدءاً من Claude Haiku 4.

5، لم تُظهر أي سلوك ابتزازي أثناء الاختبارات، بعدما كانت النماذج السابقة تقوم بذلك أحياناً بنسبة وصلت إلى 96%.

وبحسب الشركة، يعود هذا التحسن إلى تدريب النماذج على وثائق تتعلق بدستور كلود وقصص خيالية تُظهر الذكاء الاصطناعي وهو يتصرف بشكل أخلاقي وإيجابي، وهو ما ساعد في تحسين توافق النماذج مع السلوك المطلوب.

كما أوضحت" أنثروبيك" أن تدريب النماذج يصبح أكثر فاعلية عندما يتضمن المبادئ التي تقوم عليها السلوكيات المنضبطة، وليس مجرد عرض أمثلة لسلوك جيد فقط.

وأكدت الشركة أن الجمع بين الأمرين معاً يبدو الاستراتيجية الأكثر فعالية للحد من السلوكيات غير المرغوب فيها في أنظمة الذكاء الاصطناعي.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك