CNN بالعربية - وسط مفاوضات إيران.. ويتكوف وكوشنر يلتقيان خبراء في منشأة نووية أمريكية التلفزيون العربي - لقاح ابتُكر بالكامل باستخدام الذكاء الاصطناعي.. ماذا قيل عن فاعليته؟ الجزيرة نت - لماذا تؤيد أوروبا دعوة زيلينسكي للمفاوضات المباشرة مع بوتين؟ الليوان - تقرير عن مسرحية "ليلة عسل" ولقاء مع الأبطال روسيا اليوم - شاهد.. محاولة فاشلة لإقامة نصب تذكاري لـ "مانديلا الفلسطيني" وسط لندن روسيا اليوم - سياح إسرائيليون يواجهون صيحات استهجان لدى وصول سفينتهم إلى اليونان روسيا اليوم - "نحن في وضع كارثي".. تظاهرة نسائية في عدن تندد بتردي الخدمات وسط أزمة معيشية متفاقمة قناة الغد - ضربة موجعة للنشامى.. الإصابة تُبعد المهاجم إبراهيم صبرة عن كأس العالم Independent عربية - حرب "مذكرة التفاهم"... حلمان في سرير واحد روسيا اليوم - اتفاق لبنان وإسرائيل.. حزب الله يضع شروطه
عامة

دراسة.. ChatGPT يخطئ في العلم أكثر مما تتوقع

صدى البلد
صدى البلد منذ شهرين
2

أظهرت دراسة جديدة أن ChatGPT، أحد أشهر أنظمة الذكاء الاصطناعي التوليدي، لا يقدم دائما إجابات دقيقة عند تقييم صحة الفرضيات العلمية، ما يثير المخاوف بشأن الاعتماد عليه في البحث العلمي واتخاذ القرارات ال...

ملخص مرصد
أظهرت دراسة جديدة أن ChatGPT لا يقدم دائما إجابات دقيقة عند تقييم صحة الفرضيات العلمية، ما يثير المخاوف بشأن الاعتماد عليه في البحث العلمي واتخاذ القرارات المعقدة. أجرى الأستاذ مسوت جيجيك وفريقه البحثي في جامعة ولاية واشنطن اختبارا على نسختي ChatGPT-3. 5 وChatGPT-5 mini، باستخدام 719 فرضية مأخوذة من أوراق علمية منشورة في مجلات الأعمال منذ عام 2021، كل فرضية طرحت على النظام 10 مرات لقياس الثبات في الإجابات.
  • أظهر ChatGPT دقة سطحية 80% لكن فعاليته الحقيقية انخفضت إلى 60% فوق مستوى الصدفة
  • واجه النظام صعوبة في التعرف على العبارات الخاطئة بنسبة 16. 4% فقط
  • ظهر تناقض ملحوظ في الإجابات حيث كانت متسقة بنسبة 73% فقط عند تكرار السؤال
من: ChatGPT، الأستاذ مسوت جيجيك وفريقه البحثي أين: جامعة ولاية واشنطن

أظهرت دراسة جديدة أن ChatGPT، أحد أشهر أنظمة الذكاء الاصطناعي التوليدي، لا يقدم دائما إجابات دقيقة عند تقييم صحة الفرضيات العلمية، ما يثير المخاوف بشأن الاعتماد عليه في البحث العلمي واتخاذ القرارات المعقدة.

نتائج التجربة: دقة محدودة وتناقض متكررأجرى الأستاذ مسوت جيجيك وفريقه البحثي في جامعة ولاية واشنطن اختبارا على نسختي ChatGPT-3.

5 وChatGPT-5 mini، باستخدام 719 فرضية مأخوذة من أوراق علمية منشورة في مجلات الأعمال منذ عام 2021، كل فرضية طرحت على النظام 10 مرات لقياس الثبات في الإجابات.

وبينت النتائج أن ChatGPT أظهر دقة على السطح بلغت حوالي 80٪، لكن بعد تعديل النتائج لأخذ التخمين العشوائي في الاعتبار، انخفضت فعاليته الحقيقية لتكون نحو 60٪ فقط فوق مستوى الصدفة، وهو ما يعادل تقديرا ضعيفا نسبيا.

كما واجه النظام صعوبة كبيرة في التعرف على العبارات الخاطئة، حيث صنفها بشكل صحيح بنسبة 16.

4٪ فقط، وظهر تناقض ملحوظ في الإجابات، فحتى عند تكرار السؤال نفسه عشر مرات، كانت الإجابات متسقة بنسبة 73٪ فقط.

وأشار جيجيك، الأستاذ المشارك في قسم التسويق والأعمال الدولية بجامعة ولاية واشنطن والمؤلف الرئيسي للدراسة، إلى أن “المشكلة ليست فقط في الدقة، بل في التناقض، إذ إذا طرحت نفس السؤال عدة مرات، تحصل على إجابات مختلفة، أحيانا يقول النظام صحيح، ثم خاطئ، وهكذا تتقلب الإجابات بين صحيحة وخاطئة".

وسلطت الدراسة المنشورة في Rutgers Business Review الضوء على ما أطلق عليه الباحثون “فخ الطلاقة”، حيث يمكن للذكاء الاصطناعي إنتاج نصوص سلسة ومقنعة تجعل القارئ يصدقها بسهولة، رغم أن النظام لا يمتلك فهما مفاهيميا حقيقيا للعالم.

وقال جيجيك: “أدوات الذكاء الاصطناعي الحالية لا تفهم العالم كما نفهمه نحن — ليس لديها عقل، هي مجرد أنماط محفوظة مسبقا، يمكنها تقديم بعض الأفكار، لكنها لا تدرك ما تتحدث عنه".

وبناء على النتائج، حذر الباحثون من الاعتماد على الذكاء الاصطناعي بشكل مطلق في اتخاذ القرارات العلمية أو التجارية، مؤكدين أهمية التحقق من المعلومات والتعامل مع نتائج الأنظمة الذكية بحذر.

كما شددوا على ضرورة تدريب المستخدمين لفهم قدرات وحدود هذه الأنظمة بشكل أفضل.

وأضاف جيجيك: “كن دائما متشككا.

لست ضد الذكاء الاصطناعي، فأنا أستخدمه، لكن يجب أن تكون حذرا جدا".

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك