أطلقت شركة “أوبن إيه آي” تحديثًا جديدًا لمنظومة توليد الصور داخل “تشات جي بي تي” تحت اسم “تشات جي بي تي إيميجز 2.
0”، في خطوة تعكس تحولًا جذريًا في طريقة إنتاج المحتوى البصري.
ويأتي هذا التحديث بعد أشهر قليلة من إصدار “جي بي تي إيميج 1.
5”، لكنه يقدم قدرات أكثر تقدمًا تتجاوز التحسينات التقنية التقليدية نحو نموذج أكثر شمولًا وذكاءً.
يعتمد التوجه الجديد على فكرة أساسية مفادها أن الصورة لم تعد عنصرًا تجميليًا، بل وسيلة للتعبير ونقل المعلومات بشكل منظم.
وبحسب ما توضحه الشركة، فإن الصورة الجيدة تقوم بالدور نفسه الذي تقوم به الجملة المكتوبة، من حيث اختيار العناصر وترتيبها وكشف المعنى.
يوفر الإصدار الجديد مجموعة واسعة من الإمكانات التي لم تكن متاحة سابقًا بهذا المستوى من التكامل.
إذ أصبح بإمكان النظام إنشاء إنفوغرافيك متكامل يحتوي على نصوص دقيقة، وتصميم شرائح عرض تعليمية، وإنتاج خرائط جغرافية قابلة للقراءة، إلى جانب توليد واجهات تطبيقات ومواقع تحاكي الواقع بشكل كبير.
كما يمكنه إعداد مخططات طوابق وتصاميم داخلية، بالإضافة إلى إنتاج قصص مصورة بأسلوب “مانغا” أو كتب أطفال أو مجموعات صور مترابطة ضمن سياق واحد.
ولا تقتصر هذه القدرات على الإنشاء من الصفر، بل يمكن للنظام أيضًا تحليل الصور التي يرفعها المستخدم وتعديلها أو إعادة إنتاجها بأساليب مختلفة مع الحفاظ على بنيتها الأصلية.
أحد أبرز التحولات في هذا الإصدار هو إدخال ما يُعرف بقدرات “التفكير”، حيث لم يعد النظام يعتمد على توليد مباشر للصورة بناءً على الوصف فقط، بل يقوم بعملية تحليل وبحث وتخطيط قبل التنفيذ.
فعند التعامل مع محتوى معقد، مثل عرض تقديمي، يستطيع النظام استخراج المعلومات الأساسية، وفهم السياق، ثم تحويله إلى تصميم بصري متكامل يعكس الفكرة بدقة.
كما يدعم هذا النموذج البحث عبر الإنترنت في الوقت الحقيقي، ما يسمح بإنتاج صور تستند إلى معلومات حديثة، مع الاستفادة من قاعدة معرفة محدثة حتى نهاية عام 2025.
تحسن ملحوظ في النصوص وتعدد اللغاتلطالما كانت النصوص داخل الصور المولدة بالذكاء الاصطناعي نقطة ضعف، إلا أن هذا الإصدار يقدم قفزة واضحة في هذا المجال.
إذ أصبح قادرًا على إنتاج نصوص دقيقة وواضحة حتى في التصاميم المعقدة، مثل المجلات أو المخططات العلمية.
كما يدعم النظام عددًا كبيرًا من اللغات غير اللاتينية، مثل اليابانية والكورية والصينية والهندية والبنغالية، مع الحفاظ على سلاسة اللغة داخل التصميم، بحيث تبدو النصوص جزءًا طبيعيًا من الصورة وليست مجرد ترجمة.
من الميزات اللافتة أيضًا القدرة على إنتاج عدة صور مترابطة من طلب واحد، مع الحفاظ على ثبات الشخصيات والعناصر داخلها.
هذه الخاصية تتيح إنشاء سلاسل كاملة من الصور، سواء لقصص مصورة أو حملات تسويقية أو محتوى تعليمي، دون الحاجة لإعادة ضبط كل صورة بشكل منفصل.
مستويات الاستخدام والنماذج المتاحةتعتمد “أوبن إيه آي” في هذا النظام على عدة مستويات من الاستخدام.
فالمستخدمون العاديون يمكنهم الوصول إلى النموذج الأساسي لتوليد الصور، بينما يحصل المشتركون في الخطط المدفوعة على ميزات متقدمة تشمل “التفكير”، مثل التحليل والبحث وتوليد صور متعددة.
أما المطورون، فيمكنهم استخدام نموذج “جي بي تي إيميج 2” عبر واجهة برمجة التطبيقات، مع دعم دقة تصل إلى 4K وخيارات متعددة لنسب الأبعاد.
تؤكد الشركة أن النظام مزود بطبقات متعددة من الحماية، تشمل وضع علامات تعريفية على الصور المولدة، وأنظمة للكشف عن المحتوى الضار أو المسيء، إضافة إلى مراقبة مستمرة لضمان الالتزام بسياسات الاستخدام، خاصة فيما يتعلق بالمحتوى السياسي أو التضليل.
تحول من أداة إلى نظام بصري متكامليمثل “تشات جي بي تي إيميجز 2.
0” انتقالًا من كونه أداة لتوليد الصور إلى نظام متكامل قادر على التفكير والتحليل والإنتاج في آن واحد.
وهذا التحول يعزز استخدام الذكاء الاصطناعي في مهام إبداعية معقدة، مثل التصميم والتسويق والتعليم، مع تقليل الوقت والجهد اللازمين لإنتاج محتوى بصري احترافي.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك