كشفت شركة OpenAI عن تطوير جديد في مجال الذكاء الاصطناعي البصري، بعد إطلاق نموذج ChatGPT Images 2.
0، الذي يقدم تحسينات كبيرة في إنشاء الصور ودمج النصوص داخلها بشكل أكثر دقة وواقعية، مقارنة بالإصدارات السابقة التي كانت تعاني من أخطاء واضحة في كتابة الكلمات داخل الصور.
ويمثل النموذج الجديد تحولًا مهمًا في قدرات الذكاء الاصطناعي، خاصة في المهام التي تتطلب تصميمات احترافية مثل القوائم الإعلانية، والمواد التسويقية، والقصص المصورة متعددة المشاهد، إلى جانب دعم أفضل للغات غير اللاتينية.
مشكلة قديمة.
النصوص المشوهة داخل الصورخلال السنوات الماضية، كان من السهل اكتشاف الصور المولدة بالذكاء الاصطناعي بسبب الأخطاء الواضحة في النصوص المكتوبة داخلها، إذ كانت النماذج السابقة تنتج كلمات غير مفهومة أو مشوهة، خاصة عند محاولة إنشاء قوائم طعام أو لافتات إعلانية.
فعند طلب تصميم قائمة طعام لمطعم مكسيكي، كانت بعض النماذج القديمة تبتكر أسماء غير موجودة لأطباق مثل “burrto” و“margartas”، وهو ما كان يكشف بسهولة أن الصورة مولدة بواسطة الذكاء الاصطناعي.
أما مع نموذج Images 2.
0 الجديد، فقد أصبح بالإمكان إنشاء قائمة طعام تبدو احترافية وقابلة للاستخدام الفعلي داخل المطاعم أو الحملات التجارية، دون ملاحظة أخطاء بارزة من النظرة الأولى.
لماذا كانت النماذج السابقة تفشل في كتابة الكلمات؟اعتمدت مولدات الصور القديمة بشكل أساسي على ما يُعرف باسم Diffusion Models أو نماذج الانتشار، وهي تقنية تعمل على إعادة بناء الصور انطلاقًا من الضوضاء الرقمية.
وبسبب أن النصوص تمثل جزءًا صغيرًا جدًا من إجمالي الصورة، كانت هذه النماذج تركز على الشكل العام والتفاصيل البصرية الكبرى، بينما تهمل الدقة المطلوبة في الحروف والكلمات.
ومع تطور الأبحاث، بدأ الاتجاه نحو استخدام نماذج أكثر تطورًا مثل Autoregressive Models، التي تعتمد على التنبؤ التدريجي بمكونات الصورة، بطريقة أقرب لآلية عمل نماذج اللغة الكبيرة، ما ساهم في تحسين جودة النصوص داخل الصور.
OpenAI: النموذج الجديد يمتلك قدرات “تفكير”ورغم أن OpenAI لم تكشف بشكل مباشر عن البنية التقنية الكاملة للنموذج الجديد، فإنها أوضحت أن Images 2.
0 يتمتع بما وصفته بـ" قدرات التفكير"، وهي ميزة تمنحه إمكانية تنفيذ مهام أكثر تعقيدًا.
وتشمل هذه القدرات البحث عبر الإنترنت، وإنشاء عدة نسخ من الصورة نفسها من خلال طلب واحد، إضافة إلى مراجعة النتائج والتحقق منها قبل عرضها على المستخدم.
وتسمح هذه الإمكانيات بإنتاج محتوى بصري متقدم مثل الحملات التسويقية متعددة المقاسات، والقصص المصورة، وعناصر واجهات المستخدم، والرموز البصرية الدقيقة.
دعم محسّن للغات اليابانية والكورية والهنديةأكدت الشركة أن النموذج الجديد يوفر أداءً أفضل في التعامل مع اللغات غير اللاتينية، مثل اليابانية والكورية والهندية والبنغالية، وهو ما يمثل تطورًا مهمًا للمستخدمين في الأسواق العالمية خارج اللغة الإنجليزية.
كما أشارت إلى أن قاعدة بيانات النموذج المعرفية تمتد حتى ديسمبر 2025، ما يعني أن دقته قد تتأثر عند التعامل مع الأحداث أو الأخبار التي وقعت بعد هذا التاريخ.
جودة أعلى ودقة تصل إلى 2Kبحسب البيان الرسمي الصادر عن OpenAI، فإن Images 2.
0 يقدم مستوى متقدمًا من الدقة في تنفيذ التعليمات، مع قدرة أكبر على الحفاظ على التفاصيل الدقيقة التي كانت تمثل تحديًا سابقًا، مثل النصوص الصغيرة، والأيقونات، وواجهات التطبيقات، والتصميمات المعقدة.
كما يدعم النموذج إنشاء الصور بدقة تصل إلى 2K، ما يجعله مناسبًا للاستخدام التجاري والاحترافي في مجالات متعددة.
ورغم أن إنتاج الصور المعقدة لا يتم بسرعة الردود النصية المعتادة في ChatGPT، فإن إنشاء محتوى متقدم مثل القصص المصورة متعددة الإطارات لا يستغرق سوى دقائق قليلة.
أعلنت OpenAI أن جميع مستخدمي ChatGPT وCodex سيتمكنون من استخدام Images 2.
0 بدءًا من يوم الثلاثاء 21 أبريل 2026، بينما سيحصل المشتركون في الخطط المدفوعة على إمكانيات أوسع وخيارات أكثر تقدمًا.
كما ستوفر الشركة واجهة برمجة التطبيقات الجديدة gpt-image-2 API، على أن يتم تحديد الأسعار وفقًا لجودة الصور المطلوبة ومستوى الدقة النهائي.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك