قناة التليفزيون العربي - لماذا يختار نتنياهو التصعيد والوعيد بتكرار سيناريو غزة في جنوب لبنان في هذا التوقيت تحديدَا؟ الليوان - تعليق "طارق شو" على دراسة تقول إن المرأة تخجل أمام الرجل الوسيم روسيا اليوم - بوتين: مأساة فلسطين "نُسيت" لكنها لم تختفِ.. والحل الوحيد هو إقامة دولة فلسطينية مكتملة الأركان روسيا اليوم - العثور على مقبرة جماعية ثانية قرب مدينة قارة بريف دمشق قناة التليفزيون العربي - ما هو "الحل الوسط" الذي يتحدث الرئيس الروسي عن انفتاحه بشأنه بخصوص الحرب ضد أوكرانيا؟ العربي الجديد - فرنسا تدخل كأس العالم 2026 بسلاح النجوم وخبرة ديشان قناة القاهرة الإخبارية - بين القصف والاشتباكات.. النبطية ومحيط الشقيف في قلب التصعيد العسكري روسيا اليوم - مقتل ضابط إسرائيلي بصاروخ موجه أطلقه "حزب الله" في جنوب لبنان (صورة) روسيا اليوم - بوتين: "سو-57" أفضل طائرة مقاتلة في العالم قناه الحدث - مستشار خامنئي: المسودة الحالية لمذكرة التفاهم مع واشنطن غامضة
منوعات

OpenAI تطلق GPT-5.4 بقدرات استخدام الحاسوب الأصلية وتحسينات في الاستدلال

سفارى نت
سفارى نت منذ شهرين
2

يمثّل إطلاق GPT-5. 4 أحدث خطوة لشركة OpenAI في تطوير نماذج الذكاء الاصطناعي الحدية، إذ يجمع هذا النموذج بين قدرات الاستدلال والبرمجة وسير العمل الوكيلي في نموذج واحد صدر في 12 فبراير 2026. يتوفر النمو...

ملخص مرصد
أطلقت OpenAI نموذج GPT-5.4 بقدرات استخدام الحاسوب الأصلية وتحسينات في الاستدلال، مما يمكّن وكلاء الذكاء الاصطناعي من تشغيل أجهزة الكمبيوتر وتنفيذ سير عمل معقدة عبر التطبيقات. يتوفر النموذج في ChatGPT وواجهة برمجة التطبيقات وCodex، مع إصدار نسخة Pro للمستخدمين الذين يحتاجون إلى أقصى أداء في المهام المعقدة.
  • حقق GPT-5.4 معدل نجاح 75% على معيار OSWorld-Verified متجاوزاً أداء الإنسان البالغ 72.4%
  • قلّل البحث عن الأدوات استخدام الرموز بنسبة 47% مع الحفاظ على الدقة ذاتها
  • صنّفت OpenAI GPT-5.4 ضمن فئة 'القدرة السيبرانية العالية' مع منظومة أمن موسّعة
من: OpenAI

يمثّل إطلاق GPT-5.

4 أحدث خطوة لشركة OpenAI في تطوير نماذج الذكاء الاصطناعي الحدية، إذ يجمع هذا النموذج بين قدرات الاستدلال والبرمجة وسير العمل الوكيلي في نموذج واحد صدر في 12 فبراير 2026.

يتوفر النموذج في ChatGPT تحت مسمى GPT-5.

4 Thinking، وفي واجهة برمجة التطبيقات (API)، وفي Codex.

كما أصدرت الشركة GPT-5.

4 Pro للمستخدمين الذين يحتاجون إلى أقصى أداء في المهام المعقدة.

إطلاق GPT-5.

4: القدرات الرئيسية ونتائج المعايير.

على معيار GDPval الذي يختبر الوكلاء عبر 44 مهنة، يتفوق GPT-5.

4 على المتخصصين في الصناعة أو يساويهم في 83.

0% من المقارنات، مقارنةً بـ 70.

9% لنموذج GPT-5.

2.

وعلى معيار داخلي لنمذجة جداول البيانات، حقق GPT-5.

4 متوسط درجة 87.

3%، مقابل 68.

4% لـ GPT-5.

2.

كما فضّل المقيّمون البشريون العروض التقديمية الصادرة عن GPT-5.

4 في 68.

0% من الحالات.

قالت OpenAI إن GPT-5.

4 هو أكثر نماذجها دقةً حتى الآن؛ إذ تقل احتمالية كذب الادعاءات الفردية بنسبة 33%، وتقل احتمالية احتواء الردود الكاملة على أخطاء بنسبة 18%، مقارنةً بـ GPT-5.

2.

وقال Brendan Foody، الرئيس التنفيذي لشركة Mercor، إن النموذج “يتفوق في إنشاء مخرجات طويلة الأمد كعروض الشرائح والنماذج المالية والتحليل القانوني، محققاً أداءً متميزاً بسرعة أعلى وتكلفة أقل.

”.

استخدام الحاسوب الأصلي وسير العمل الوكيلي.

يُعدّ GPT-5.

4 أول نموذج للأغراض العامة من OpenAI يمتلك قدرات أصلية لاستخدام الحاسوب، مما يُمكّن وكلاء الذكاء الاصطناعي من تشغيل أجهزة الكمبيوتر وتنفيذ سير عمل معقدة عبر التطبيقات.

على معيار OSWorld-Verified، حقق النموذج معدل نجاح 75.

0%، متجاوزاً أداء الإنسان البالغ 72.

4% وأداء GPT-5.

2 البالغ 47.

3%.

وعلى معيار WebArena-Verified، حقق معدل نجاح 67.

3%، مقارنةً بـ 65.

4% لـ GPT-5.

2.

يدعم النموذج ما يصل إلى مليون رمز من السياق، مما يتيح للوكلاء التخطيط والتنفيذ والتحقق من المهام عبر آفاق زمنية طويلة.

وقال Dod Fraser، الرئيس التنفيذي لشركة Mainstay، إن GPT-5.

4 حقق معدل نجاح 95% في المحاولة الأولى عبر نحو 30,000 بوابة ضريبية وعقارية، مع إتمام الجلسات بسرعة أعلى بثلاثة أضعاف واستخدام أقل للرموز بنسبة 70%.

البحث عن الأدوات وتحسينات الكفاءة.

يُقدّم GPT-5.

4 ميزة البحث عن الأدوات (Tool Search) في واجهة برمجة التطبيقات، مما يتيح للنماذج استرداد تعريفات الأدوات عند الطلب بدلاً من تحميلها جميعاً مسبقاً.

في اختبار شمل 250 مهمة من معيار MCP Atlas مع تفعيل جميع خوادم MCP الـ 36، خفّض هذا النهج إجمالي استخدام الرموز بنسبة 47% مع الحفاظ على الدقة ذاتها.

وقال Wade، الرئيس التنفيذي لشركة Zapier، إن GPT-5.

4 “أنجز المهمة حيث استسلمت النماذج السابقة”، واصفاً إياه بأنه أكثر النماذج مثابرةً عبر مئات من سير العمل المتقدمة.

على معيار BrowseComp الذي يقيس التصفح المستمر للويب للعثور على معلومات يصعب تحديد موقعها، تحسّن GPT-5.

4 بمقدار 17 نقطة مئوية عن GPT-5.

2.

كما سجّل GPT-5.

4 Pro نتيجة 89.

3% على هذا الاختبار، وهي نتيجة قياسية جديدة.

وتعني هذه التحسينات أن الذكاء الاصطناعي أصبح أكثر قدرةً على الإجابة عن الأسئلة التي تتطلب جمع المعلومات من مصادر متعددة على الويب.

يدمج GPT-5.

4 قدرات البرمجة من GPT-5.

3-Codex، ويساويه أو يتفوق عليه في معيار SWE-Bench Pro مع تقديم زمن استجابة أقل.

في Codex، يوفر الوضع السريع سرعة رموز أعلى بمقدار 1.

5 مرة باستخدام النموذج ذاته.

كما أصدرت OpenAI مهارة Codex التجريبية Playwright (Interactive)، التي تُمكّن من تصحيح الأخطاء البصري لتطبيقات الويب وتطبيقات Electron.

قال Lee Robinson، نائب رئيس تعليم المطورين في Cursor، إن المهندسين يجدون GPT-5.

4 “أكثر طبيعيةً وحزماً من النماذج السابقة”، مشيراً إلى أنه يعالج المشكلات الغامضة دون تردد ويوازي العمل بشكل استباقي.

وقال Niko Grupen، رئيس الأبحاث التطبيقية في Harvey، إن النموذج سجّل 91% على تقييم BigLaw Bench للعمل القانوني الذي يعتمد على المستندات.

صنّفت OpenAI GPT-5.

4 ضمن فئة “القدرة السيبرانية العالية” وفق إطار الاستعداد الخاص بها، ونشرته مع منظومة أمن سيبراني موسّعة تشمل أنظمة المراقبة وضوابط الوصول الموثوقة والحجب غير المتزامن للطلبات عالية المخاطر.

كما أصدرت الشركة تقييماً جديداً مفتوح المصدر يُسمى CoT controllability لقياس قدرة النماذج على إخفاء استدلالها لتفادي المراقبة، وأفادت بأن قدرة GPT-5.

4 Thinking على التحكم في سلسلة تفكيره منخفضة، وهو ما وصفته بأنه خاصية إيجابية للسلامة.

في ChatGPT، يتوفر GPT-5.

4 Thinking اعتباراً من اليوم لمستخدمي خطط Plus وTeam وPro، ليحل محل GPT-5.

2 Thinking.

يظل GPT-5.

2 Thinking متاحاً لمدة ثلاثة أشهر ضمن قسم النماذج القديمة قبل إيقافه في 5 يونيو 2026.

يمكن لمستخدمي خطط Enterprise وEdu تفعيل الوصول المبكر عبر إعدادات المسؤول.

في واجهة برمجة التطبيقات، يتوفر GPT-5.

4 بالمعرّف gpt-5.

4، وGPT-5.

4 Pro بالمعرّف gpt-5.

4-pro.

تتوفر أسعار Batch وFlex بنصف السعر القياسي، فيما تتوفر المعالجة ذات الأولوية بضعف السعر القياسي.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك