هل يمكن الوثوق بالذكاء الاصطناعي طبيًا؟

كشفت دراسة علمية حديثة أن بعض برامج الدردشة الآلية المعتمدة على الذكاء الاصطناعي قد تقدم معلومات طبية مضللة أو غير دقيقة، ما يثير مخاوف بشأن الاعتماد عليها في القضايا الصحية الحساسة.

وبحسب الدراسة المنشورة فيBMJ Open، اختبر فريق من الباحثين خمسة من أبرز برامج الدردشة، هيChatGPT وGemini وGrok وMeta AI وDeepSeek، عبر طرح 50 سؤالًا صحيًا شملت موضوعات مثل السرطان واللقاحات والتغذية.

وأظهرت النتائج أن نحو 20% من الإجابات كانت" إشكالية للغاية"، فيما صُنّف نصفها تقريبًا ضمن الفئة" الإشكالية"، بينما كانت 30%" إشكالية إلى حد ما".

كما فشلت جميع البرامج في تقديم مراجع علمية دقيقة بشكل كامل، ولم ترفض الإجابة إلا على سؤالين فقط من أصل 250.

وسجّل برنامجGrok أسوأ أداء، إذ اعتُبرت 58% من إجاباته إشكالية، يليهChatGPT بنسبة 52%، ثمMeta AI بنسبة 50%، مع تقارب عام في الأداء بين الأدوات الخمس.

دقة الإجابات تختلف حسب الموضوعوبحسب صحيفة" إندبندنت"، أشارت الدراسة إلى أن دقة الإجابات تختلف بحسب الموضوع، فقد كان الأداء أفضل نسبيًا في مجالي السرطان واللقاحات، بينما تراجع في موضوعات التغذية والأداء الرياضي.

كما تبين أن الأسئلة المفتوحة تزيد من احتمالات الحصول على إجابات مضللة.

وفي سياق متصل، أظهرت دراسة فيNature Medicine أن هذه البرامج قد تصل دقتها النظرية إلى 95%، إلا أن المستخدمين لا ينجحون في الوصول للإجابة الصحيحة إلا بنسبة تقل عن 35% عند استخدامها عمليًا.

وتؤكد هذه النتائج أن برامج الدردشة يمكن أن تكون أداة مساعدة لفهم المعلومات الطبية، لكنها لا تصلح كمصدر مستقل للتشخيص أو العلاج، ما يستدعي التحقق من المعلومات واستشارة مختصين قبل اتخاذ أي قرارات صحية.