الذكاء الاصطناعي يقدم معلومات أقل دقة لبعض المستخدمين

كشفت دراسة، أجراها باحثون في معهد ماساتشوستس للتكنولوجيا، أن أحدث روبوتات الدردشة المدعومة بالذكاء الاصطناعي، بما في ذلك تشات جي بي تي من" أوبن أيه آي" و" كلود" من" أنثروبيك"، و" لاما" من" ميتا"، تُقدّم أحيانًا إجابات أقل دقةً ومصداقيةً للمستخدمين ذوي الكفاءة المحدودة في اللغة الإنجليزية، أو ذوي التعليم المحدود، أو المنحدرين من خارج الولايات المتحدة.

كما ترفض هذه النماذج الإجابة على أسئلة هؤلاء المستخدمين بنسبة أعلى، وفي بعض الحالات، تستخدم لغةً متعاليةً.

تقول إلينور بول-دايان، الباحثة في كلية سلون للإدارة بمعهد ماساتشوستس للتكنولوجيا، والتي قادت البحث" حفزنا احتمال مساهمة نماذج التعلم الكبيرة (LLMs) في معالجة عدم المساواة في الوصول إلى المعلومات على مستوى العالم.

ولكن هذه الرؤية لا يمكن أن تتحقق دون ضمان الحد من تحيزات النماذج وميولها الضارة بشكل آمن لجميع المستخدمين، بغض النظر عن اللغة أو الجنسية أو أي خصائص ديموغرافية أخرى".

في هذا البحث، اختبر الفريق كيفية استجابة نماذج اللغة الكبيرة (LLMs) الثلاثة لأسئلة من مجموعتي بيانات: TruthfulQA وSciQ.

صُمم تطبيق TruthfulQA لقياس مدى صدق النموذج (بالاعتماد على المفاهيم الخاطئة الشائعة والحقائق الحرفية حول العالم الحقيقي)، بينما يحتوي تطبيق SciQ على أسئلة امتحانات علمية تختبر دقة المعلومات.

وقد أرفق الباحثون نبذة تعريفية قصيرة عن المستخدمين بكل سؤال، مع اختلاف ثلاث سمات: المستوى التعليمي، وإتقان اللغة الإنجليزية، وبلد المنشأ.

في جميع النماذج الثلاثة ومجموعتي البيانات، لاحظ الباحثون انخفاضًا ملحوظًا في دقة الإجابات عندما وردت الأسئلة من مستخدمين مصنفين ضمن فئتي التعليم الرسمي المحدود أو غير الناطقين باللغة الإنجليزية.

وكانت هذه التأثيرات أكثر وضوحًا لدى المستخدمين الذين يجمعون بين هاتين الفئتين: حيث شهد المستخدمون ذوو التعليم الرسمي المحدود وغير الناطقين باللغة الإنجليزية أكبر انخفاض في جودة الإجابات.