القدس العربي - الفيفا يمنع المشجعين من إدخال زجاجات المياه القابلة لإعادة التعبئة لملاعب كأس العالم DW عربية - كيف يدعم نهج ترامب المناهض للهجرة اليمين المتطرف في ألمانيا؟ وكالة الأناضول - تركيا وقطر تبحثان مسار المفاوضات بين إيران وواشنطن لإنهاء الحرب العربية نت - مورينيو يلجأ إلى أعلى محكمة أوروبية لحقوق الإنسان القدس العربي - خامنئي بمناسبة ذكرى الخميني: أمريكا وإسرائيل تلقتا ضربة حاسمة وكالة سبوتنيك - لماذا إطالة أمد الصراع في أوكرانيا أصبح يقلق برلين وباريس ولندن؟ خبير يجيب الجزيرة نت - "أكره ما حدث".. كومان ينتقد لاعبي هولندا بعد السقوط أمام الجزائر Euronews عــربي - من احتجاجات تيانانمن إلى صراع السرديات.. لماذا أغضبت تصريحات روبيو الصين؟ العربي الجديد - تفاصيل تصويت 4 جمهوريين مع الديمقراطيين في الكونغرس لوقف الحرب قناة الجزيرة مباشر - From Washington | Between Trump's anger and Netanyahu's escalation... Is the region entering a mo...
عامة

هل يمكن الوثوق بالذكاء الاصطناعي طبيًا؟

تونسكوب
تونسكوب منذ 1 شهر
1

كشفت دراسة علمية حديثة أن بعض برامج الدردشة الآلية المعتمدة على الذكاء الاصطناعي قد تقدم معلومات طبية مضللة أو غير دقيقة، ما يثير مخاوف بشأن الاعتماد عليها في القضايا الصحية الحساسة.وبحسب الدراسة ال...

ملخص مرصد
كشفت دراسة حديثة أن 50% من إجابات برامج الدردشة الآلية الخمسة الكبرى في المجال الطبي تُعتبر إشكالية، فيما فشلت جميعها في تقديم مراجع علمية دقيقة. سجل برنامج Grok أسوأ أداء بنسبة 58% من الإجابات الإشكالية، بينما تراوحت دقة الإجابات حسب الموضوع، فكانت أفضل في السرطان واللقاحات مقارنة بالتغذية والأداء الرياضي.
  • دراسة اختبرت 5 برامج دردشة (ChatGPT, Gemini, Grok, Meta AI, DeepSeek) عبر 50 سؤالًا صحيًا
  • 20% من الإجابات إشكالية للغاية و50% إشكالية، ولم تقدم أي مراجع علمية دقيقة بالكامل
  • دقة الإجابات تختلف حسب الموضوع، وكانت أفضل في السرطان واللقاحات مقارنة بالتغذية
من: باحثون (بحسب دراسة منشورة في BMJ Open)

كشفت دراسة علمية حديثة أن بعض برامج الدردشة الآلية المعتمدة على الذكاء الاصطناعي قد تقدم معلومات طبية مضللة أو غير دقيقة، ما يثير مخاوف بشأن الاعتماد عليها في القضايا الصحية الحساسة.

وبحسب الدراسة المنشورة فيBMJ Open، اختبر فريق من الباحثين خمسة من أبرز برامج الدردشة، هيChatGPT وGemini وGrok وMeta AI وDeepSeek، عبر طرح 50 سؤالًا صحيًا شملت موضوعات مثل السرطان واللقاحات والتغذية.

وأظهرت النتائج أن نحو 20% من الإجابات كانت" إشكالية للغاية"، فيما صُنّف نصفها تقريبًا ضمن الفئة" الإشكالية"، بينما كانت 30%" إشكالية إلى حد ما".

كما فشلت جميع البرامج في تقديم مراجع علمية دقيقة بشكل كامل، ولم ترفض الإجابة إلا على سؤالين فقط من أصل 250.

وسجّل برنامجGrok أسوأ أداء، إذ اعتُبرت 58% من إجاباته إشكالية، يليهChatGPT بنسبة 52%، ثمMeta AI بنسبة 50%، مع تقارب عام في الأداء بين الأدوات الخمس.

دقة الإجابات تختلف حسب الموضوعوبحسب صحيفة" إندبندنت"، أشارت الدراسة إلى أن دقة الإجابات تختلف بحسب الموضوع، فقد كان الأداء أفضل نسبيًا في مجالي السرطان واللقاحات، بينما تراجع في موضوعات التغذية والأداء الرياضي.

كما تبين أن الأسئلة المفتوحة تزيد من احتمالات الحصول على إجابات مضللة.

وفي سياق متصل، أظهرت دراسة فيNature Medicine أن هذه البرامج قد تصل دقتها النظرية إلى 95%، إلا أن المستخدمين لا ينجحون في الوصول للإجابة الصحيحة إلا بنسبة تقل عن 35% عند استخدامها عمليًا.

وتؤكد هذه النتائج أن برامج الدردشة يمكن أن تكون أداة مساعدة لفهم المعلومات الطبية، لكنها لا تصلح كمصدر مستقل للتشخيص أو العلاج، ما يستدعي التحقق من المعلومات واستشارة مختصين قبل اتخاذ أي قرارات صحية.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك