روسيا اليوم - مصر.. مفاجأة كبرى في قضية صبري نخنوخ العربية نت - مشاهد لقصف الجيش الأميركي رادارات إيرانية بقشم وغورك BBC عربي - 10 بيوت صيفية مذهلة "تذوب" في أحضان الطبيعة روسيا اليوم - الحرس الثوري الإيراني: قصفنا قاعدة علي السالم بالكويت والأسطول الخامس بالبحرين روسيا اليوم - "رويترز": القوات الأمريكية تهاجم مواقع ساحلية في إيران القدس العربي - الكونغو تحذر من انتشار سريع لإيبولا وتؤكد تسجيل 71 إصابة جديدة العربية نت - انحناء خطير يهدد عقارين في الجيزة.. إخلاء فوري وتحرك عاجل رويترز العربية - أمريكا تقول إن إيران أطلقت 7 صواريخ باليستية باتجاه الكويت والبحرين التلفزيون العربي - من الناحية العملية.. هل يُمكن تدمير اليورانيوم عالي التخصيب؟ قناة التليفزيون العربي - مدير الوكالة الدولية للطاقة الذرية يكشف عن وضعية اليورانيوم الإيراني عالي التخصيب
عامة

Grok 4.20 يرفع دقة الإجابات لـ83% ويتفوق فى تقليل هلوسة الذكاء الاصطناعى

اليوم السابع
اليوم السابع منذ 1 شهر
3

في تطور جديد بمجال الذكاء الاصطناعي، كشفت تقارير متداولة على منصة X عن تحقيق نموذج Grok 4. 20 قفزة ملحوظة في ما يُعرف بمعدل" عدم الهلوسة" (Non-Hallucination Rate)، ليصل إلى 83%، متجاوزًا رقمه القياسي ...

ملخص مرصد
أعلن نموذج Grok 4.20، التابع لشركة xAI، عن تحقيق معدل عدم هلوسة بلغ 83%، متفوقًا على نماذج منافسة مثل Claude Opus 4.6 وGemini 3.1. ويتبنى النموذج نهجًا تحفظيًا بتفضيل الإجابة بـ'لا أعرف' بدلاً من التخمين، مما يعزز موثوقية الإجابات. يأتي هذا التطور في ظل منافسة متزايدة بين شركات الذكاء الاصطناعي لتحسين دقة وموثوقية نماذجها.
  • Grok 4.20 يحقق معدل عدم هلوسة 83% متفوقًا على منافسيه
  • يتبنى نهجًا تحفظيًا بتفضيل 'لا أعرف' على التخمين
  • منافسة متزايدة بين شركات الذكاء الاصطناعي لتحسين الدقة
من: Grok 4.20 (xAI)

في تطور جديد بمجال الذكاء الاصطناعي، كشفت تقارير متداولة على منصة X عن تحقيق نموذج Grok 4.

20 قفزة ملحوظة في ما يُعرف بمعدل" عدم الهلوسة" (Non-Hallucination Rate)، ليصل إلى 83%، متجاوزًا رقمه القياسي السابق الذي بلغ 78% قبل أيام قليلة فقط.

ويُعد هذا المؤشر من أهم المعايير الحديثة لقياس دقة نماذج الذكاء الاصطناعي، حيث يشير إلى قدرة النموذج على تجنب اختلاق المعلومات أو تقديم إجابات غير دقيقة، وهي إحدى أبرز التحديات التي تواجه تقنيات الذكاء الاصطناعي التوليدي.

تفوق على المنافسين في دقة الإجاباتبحسب المنشورات المتداولة، تفوق نموذج Grok 4.

20، التابع لشركة xAI، على عدد من أبرز النماذج المنافسة، من بينها Claude Opus 4.

6 وGemini 3.

1 وGPT-5.

4، في معيار تقليل “الهلوسة”، وهو ما يعكس توجهًا متزايدًا نحو تحسين موثوقية الإجابات بدلًا من التركيز فقط على السرعة أو الإبداع.

ويشير مصطلح “الهلوسة” في الذكاء الاصطناعي إلى قيام النموذج بإنتاج معلومات غير صحيحة أو غير مدعومة بمصادر، مع تقديمها بثقة عالية، وهو ما قد يسبب مشكلات في الاستخدامات المهنية والتعليمية.

استراتيجية" لا أعرف" بدلًا من التخمينأحد أبرز ملامح التحسين في Grok 4.

20 هو تبنيه نهجًا أكثر تحفظًا، حيث يُفضل الاعتراف بعدم المعرفة بدلًا من تقديم إجابات غير دقيقة.

هذا التوجه يُعد تحولًا مهمًا في تصميم النماذج، إذ يعزز من ثقة المستخدمين ويقلل من مخاطر التضليل.

ويأتي ذلك في وقت تتعرض فيه نماذج الذكاء الاصطناعي لانتقادات متزايدة بسبب تقديمها معلومات خاطئة في بعض الأحيان، خاصة في المجالات الحساسة مثل الطب والقانون.

يعكس هذا التقدم اشتداد المنافسة بين شركات الذكاء الاصطناعي الكبرى، حيث لم يعد التفوق يعتمد فقط على قوة النموذج أو حجمه، بل على مدى دقته وموثوقيته.

وتسعى الشركات المطورة إلى تحسين جودة البيانات، وتعزيز آليات التحقق، وتطوير أنظمة تقلل من احتمالات الخطأ.

ورغم أهمية هذه الأرقام، يشير خبراء إلى ضرورة التعامل معها بحذر، نظرًا لاختلاف طرق القياس والمعايير المستخدمة بين شركة وأخرى.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك