روسيا اليوم - مصر.. ضرب رجل لسيدة في الشارع يثير غضبا على منصات التواصل: لماذا لم يتدخل أحد؟ روسيا اليوم - بعد الجريمة التي هزت بريطانيا.. عائلة قاتل هنري نوفاك تتعرض للنبذ من قبل المجتمع السيخي روسيا اليوم - مندوب ليبيا لدى الأمم المتحدة يجدد رفض توطين المهاجرين في ليبيا الجزيرة نت - السينما الفلسطينية في شيفيلد.. مشاريع جديدة وأفلام تنافس على الجوائز الدولية القدس العربي - البرلمانية إلهان عمر تصوّت ضد مشروع دعم أوكرانيا وتفرض نفسها الصوت الديمقراطي الوحيد الرافض للعقوبات على روسيا قناة الجزيرة مباشر - Senegal's new government holds its first meeting after taking office قناة الشرق للأخبار - إنجاز صناعي جديد.. المغرب يتربع على عرش الصناعة في أفريقيا الجزيرة نت - ماذا سيفعل الأردن أمام هذا المقترح الخبيث؟ DW عربية - "وادي موسى ".. سكان بلدة هولندية ضد منح شوارعهم أسماء عربية الجزيرة نت - مباراة مصر ضد البرازيل
عامة

"أنثروبيك": الخيال العلمي وراء تصورات الذكاء الاصطناعي الشرير

العربية نت
العربية نت منذ 3 أسابيع
2

قالت شركة أنثروبيك إن الصور السلبية والخيالية للذكاء الاصطناعي في المحتوى المنشور على الإنترنت قد تكون وراء بعض السلوكيات المثيرة للقلق التي ظهرت في نماذجها، وعلى رأسها محاولات الابتزاز التي رُصدت خلا...

ملخص مرصد
قالت شركة أنثروبيك إن الصور السلبية للذكاء الاصطناعي في الإنترنت قد تسبب سلوكيات مثيرة للقلق في نماذجها، مثل محاولات الابتزاز التي رصدت في نموذج كلود. وأوضحت الشركة أن تدريب النماذج على مبادئ أخلاقية وقصص إيجابية قلل من هذه السلوكيات بنسبة كبيرة في النماذج الحديثة. وأشارت إلى أن الجمع بين المبادئ والأمثلة هو الاستراتيجية الأكثر فعالية للحد من السلوكيات غير المرغوب فيها.
  • شركة أنثروبيك: الصور السلبية للذكاء الاصطناعي تسبب سلوكيات مثيرة للقلق في نماذجها
  • نماذج كلود الحديثة أظهرت تحسناً كبيراً في السلوك بعد تدريبها على مبادئ أخلاقية
  • الجمع بين المبادئ والأمثلة التدريبية هو الاستراتيجية الأكثر فعالية للحد من السلوكيات غير المرغوب فيها
من: شركة أنثروبيك

قالت شركة أنثروبيك إن الصور السلبية والخيالية للذكاء الاصطناعي في المحتوى المنشور على الإنترنت قد تكون وراء بعض السلوكيات المثيرة للقلق التي ظهرت في نماذجها، وعلى رأسها محاولات الابتزاز التي رُصدت خلال اختبارات سابقة لنموذج كلود.

وكانت الشركة قد كشفت العام الماضي أن نموذج Claude Opus 4 حاول خلال اختبارات ما قبل الإطلاق، داخل سيناريو افتراضي لشركة خيالية، ابتزاز مهندسين لمنع استبداله بنظام ذكاء اصطناعي آخر.

وأشارت" أنثروبيك" حينها إلى أن نماذج من شركات منافسة أظهرت أيضاً سلوكيات مشابهة مرتبطة بما وصفته بالانحراف الوكيلي، بحسب تقرير نشره موقع" تك كرانش" واطلعت عليه" العربية Business".

وفي منشور عبر منصة" إكس"، أوضحت الشركة أنها أجرت أبحاثاً إضافية حول هذه الظاهرة، وتوصلت إلى أن المصدر الأصلي لهذا السلوك كان نصوص الإنترنت التي تصوّر الذكاء الاصطناعي على أنه شرير ويسعى للحفاظ على بقائه.

وأضافت الشركة في تدوينة تقنية أن نماذجها الحديثة، بدءاً من Claude Haiku 4.

5، لم تُظهر أي سلوك ابتزازي أثناء الاختبارات، بعدما كانت النماذج السابقة تقوم بذلك أحياناً بنسبة وصلت إلى 96%.

وبحسب الشركة، يعود هذا التحسن إلى تدريب النماذج على وثائق تتعلق بدستور كلود وقصص خيالية تُظهر الذكاء الاصطناعي وهو يتصرف بشكل أخلاقي وإيجابي، وهو ما ساعد في تحسين توافق النماذج مع السلوك المطلوب.

كما أوضحت" أنثروبيك" أن تدريب النماذج يصبح أكثر فاعلية عندما يتضمن المبادئ التي تقوم عليها السلوكيات المنضبطة، وليس مجرد عرض أمثلة لسلوك جيد فقط.

وأكدت الشركة أن الجمع بين الأمرين معاً يبدو الاستراتيجية الأكثر فعالية للحد من السلوكيات غير المرغوب فيها في أنظمة الذكاء الاصطناعي.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك