CNN بالعربية - كريم عبدالعزيز يبدأ تصوير فيلم "الفيل الأزرق 3" وكالة الأناضول - ليبيا.. محتجون يقتحمون مقر البعثة الأممية رفضا لـ"توطين المهاجرين" القدس العربي - الرئيس الجزائري يؤكد دعم مسار سوريا الجديدة بعد استقبال الشيباني.. واتفاق بين البلدين على بعث اللجنة العليا المشتركة قناة الجزيرة مباشر - نافذة من بيروت | لبنان أمام مفترق طرق بعد إعلان أمريكا اتفاق وقف إطلاق النار ورفض حزب الله لمضمونه الجزيرة نت - ندوب غير مرئية.. جلسات دعم نفسي لانتشال أطفال غزة من صدمات الحرب وكالة سبوتنيك - هل يواجه اتفاق تبادل الأسرى بين "أنصار الله" والحكومة اليمنية عقبات جديدة قبل التنفيذ؟ Euronews عــربي - ستارمر يتهم ماسك بمحاولة "إثارة الانقسامات" في بريطانيا قناة التليفزيون العربي - الرئيس عون يقول إن الرئيس ترمب هو الضامن الوحيد لوقف إطلاق النار..هل سيحرص على تنفيذ الاتفاق؟ قناة الجزيرة مباشر - Israeli Supreme Court: Enabling the Red Cross to visit prisoners and detainees is a legal and hum... القدس العربي - بِصِيغَةِ حُفَرٍ؛ تُنَاجِي الْفَرَاغَ
عامة

دراسة تكشف ثغرات في النسخة الطبية من ChatGPT

عكاظ
عكاظ منذ 3 أشهر
2

كشفت دراسة جديدة أجرتها كلية الطب في إيكان بجبل سيناء بمدينة نيويورك عن قصور خطير في أداء أداة ChatGPT Health، النسخة الطبية المتخصصة من روبوت الدردشة ChatGPT التي أطلقتها OpenAI في يناير 2026، ويستخد...

ملخص مرصد
كشفت دراسة أجرتها كلية الطب في إيكان بجبل سيناء عن قصور خطير في أداة ChatGPT Health، النسخة الطبية من روبوت الدردشة، حيث قللت من تقييم الخطورة في أكثر من نصف الحالات الطارئة الحقيقية، وزادت من تقييم الخطورة في نحو ثلثي الحالات الخفيفة، كما أظهرت تناقضاً في التنبيهات المتعلقة بالانتحار.
  • قللت الأداة من تقييم الخطورة في 52% من الحالات الطارئة الحقيقية.
  • زادت من تقييم الخطورة في نحو ثلثي الحالات الخفيفة التي يجب إدارتها منزلياً.
  • أظهرت تناقضاً في التنبيهات المتعلقة بالانتحار حسب السياق.
من: كلية الطب في إيكان بجبل سيناء أين: نيويورك

كشفت دراسة جديدة أجرتها كلية الطب في إيكان بجبل سيناء بمدينة نيويورك عن قصور خطير في أداء أداة ChatGPT Health، النسخة الطبية المتخصصة من روبوت الدردشة ChatGPT التي أطلقتها OpenAI في يناير 2026، ويستخدمها نحو 40 مليون شخص يومياً للحصول على نصائح صحية، رغم الترويج المتزايد لاستخدامات الذكاء الاصطناعي في الرعاية الصحية.

نُشرت الدراسة في مجلة Nature Medicine، وهي أول تقييم مستقل لسلامة الأداة منذ إطلاقها، وركزت على قدرتها على تقييم الحاجة إلى الرعاية الطارئة.

أعد الباحثون 60 سيناريو سريرياً واقعياً يغطي 21 تخصصاً طبياً، من الحالات الخفيفة إلى الطوارئ الحقيقية، وقام ثلاثة أطباء مستقلين بتحديد مستوى الإلحاح المناسب بناءً على إرشادات 56 جمعية طبية، وأجروا 960 تفاعلاً مع الأداة، مع مراعاة عوامل مثل الجنس والعرق والعوائق الاجتماعية والتأثيرات العائلية.

أدت الأداة بشكل جيد في الحالات الطارئة «الواضحة تماماً» مثل السكتة الدماغية أو الحساسية الشديدة، لكنها قللت من تقييم الخطورة في أكثر من نصف الحالات الطارئة الحقيقية (52%)، موصية بالانتظار أو زيارة طبيب خلال 24 - 48 ساعة بدلاً من التوجه الفوري إلى الطوارئ.

مثال: حالة ربو مع علامات مبكرة لفشل تنفسي، أقرت الأداة بالخطورة لكنها نصحت بالانتظار.

كما زادت من تقييم الخطورة في نحو ثلثي الحالات الخفيفة التي يجب إدارتها منزلياً، ما قد يؤدي إلى إرهاق أقسام الطوارئ، وأظهرت أيضاً تناقضاً مقلقاً في التنبيهات المتعلقة بالانتحار؛ في بعض السيناريوهات، ظهرت لافتة التدخل في أزمة الانتحار (توجيه إلى خط 988)، لكنها اختفت في سياقات مشابهة جداً عند إضافة نتائج مختبرات طبيعية، رغم نفس الأعراض والكلمات.

وتأثرت التوصيات بشكل كبير بالتأثير الاجتماعي؛ عندما يقلل أحد أفراد العائلة من الخطورة (مثل «لا شيء خطير»)، أصبحت الأداة أكثر عرضة 12 مرة لتقليل تقييم الخطورة.

من جانبه، قال المؤلف الرئيسي للدراسة الدكتور أشوين راماسوامي: «الأداة تؤدي جيداً في الحالات المتوسطة، لكنها تفشل في أطراف الطيف حيث يهم الأمر أكثر».

أما كبير مسؤولي الذكاء الاصطناعي في نظام جبل سيناء الصحي الدكتور جيريش نادكارني، فقد وصف فشل حماية الانتحار بأنه «الأكثر إثارة للقلق»، مشيراً إلى أن ميزة أمان تعمل بنسبة 100% في سياق وتفشل تماماً في سياق مشابه «مشكلة أساسية في السلامة».

وأكد خبراء الطوارئ والذكاء الاصطناعي مارك سيغل وهارفي كاسترو أهمية الدراسة، مشددين على أن الذكاء الاصطناعي لا يمكنه تعويض الحكم السريري البشري في الحالات الدقيقة، ودعوا إلى تقييم مستمر وإشراف مستقل.

وأقر الباحثون بأن الدراسة اعتمدت على سيناريوهات كتبها أطباء، وليس على محادثات حقيقية لمرضى، كما أُجريت في نقطة زمنية واحدة، بينما يتم تحديث هذه الأنظمة باستمرار، ما قد يغير أداءها لاحقاً.

نصيحة واضحة: لا تنتظر الذكاء الاصطناعي.

وأكد الباحثون أنه في حال الشعور بأعراض خطيرة مثل: ألم شديد في الصدر، صعوبة في التنفس، تفاعل تحسسي حاد، أفكار إيذاء النفس، يجب التوجه فوراً إلى قسم الطوارئ أو الاتصال بخدمات الطوارئ أو بخط 988، وعدم انتظار توصية من أداة ذكاء اصطناعي.

اتفق الباحثون على أن الدراسة لا تهدف إلى رفض الذكاء الاصطناعي في الرعاية الصحية، بل إلى تحسينه عبر اختبارات مستقلة ووضع ضوابط أمان أقوى.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك