العربي الجديد - المعاناة تلف جنوب السودان: فساد وأزمة اقتصادية طاحنة ومجاعة العربي الجديد - شبح الهجرة الطوعية في غزة...استغلال الإنهاك الاقتصادي الجزيرة نت - الجيش السوداني يعلن صد هجوم للدعم السريع بالنيل الأزرق روسيا اليوم - بيلاروس.. علماء آثار يكتشفون قطعا نادرة تعود للسلافيين القدماء في مينسك روسيا اليوم - دراسة: الوجبات السريعة في الطفولة قد تعيد برمجة الدماغ وتؤثر على الشهية الجزيرة نت - "هزيمة نادرة" لترمب.. هل يتمكن النواب الأمريكيون أخيرا من إنهاء حرب إيران؟ روسيا اليوم - اكتشاف جديد يعمق حيرة العلماء حول أصل "شبيه القمر" المرافق للأرض روسيا اليوم - بورليايف: سوق السينما يبحث عن التسلية لا الأفكار العميقة وعلينا إحياء "غوسكينو" السوفيتية Independent عربية - هل يترك "الاتفاق المحتمل" إيران مثخنة بالجراح لكن دون انكسار؟ العربي الجديد - عبد الله مكسور في "عبور مؤجل" على هامش التغريبة الفلسطينية
عامة

كيفية الاستفادة من «Gemini Omni» في إنتاج الفيديوهات باستخدام الذكاء الاصطناعي

مبتدا
مبتدا منذ يومين
1

وقالت الشركة إن النموذج يمثل تطورًا مهمًا في تقنيات الذكاء الاصطناعي التوليدي متعدد الوسائط، إذ يجمع بين قدرات الفهم والاستدلال السياقي لنماذج Gemini، وبين إمكانيات إنتاج فيديوهات إبداعية يمكن التحكم ...

ملخص مرصد
أطلقت جوجل نموذج «Gemini Omni» لإنتاج الفيديوهات عبر الذكاء الاصطناعي، إذ يسمح بتعديل المشاهد عبر الأوامر النصية دون أدوات مونتاج تقليدية. ويتميز النموذج بالحفاظ على الاتساق البصري وإضافة مؤثرات معقدة، كما يدعم دمج مدخلات متعددة مثل الصور والصوت. وبدأت جوجل طرح النسخة الأولى «Gemini Omni Flash» لمشتركي بعض خطط Google AI عبر تطبيقاتها ومنصات إنتاج المحتوى.
  • نموذج «Gemini Omni» يسمح بتعديل الفيديوهات عبر الأوامر النصية فقط
  • يدعم دمج صور وصوت وفيديوهات مرجعية داخل مشهد واحد متكامل
  • تضمن جوجل وضع علامة مائية رقمية على الفيديوهات المنتجة عبر النموذج
من: جوجل

وقالت الشركة إن النموذج يمثل تطورًا مهمًا في تقنيات الذكاء الاصطناعي التوليدي متعدد الوسائط، إذ يجمع بين قدرات الفهم والاستدلال السياقي لنماذج Gemini، وبين إمكانيات إنتاج فيديوهات إبداعية يمكن التحكم بها بشكل مباشر عبر الأوامر النصية.

ويعتمد" Gemini Omni" على نظام تفاعلي يسمح للمستخدمين بإجراء تعديلات على الفيديوهات من خلال المحادثة فقط، دون الحاجة إلى أدوات مونتاج تقليدية، حيث يمكن تغيير المشاهد أو تعديل العناصر أو إعادة بناء القصة بالكامل باستخدام اللغة الطبيعية.

وأكدت جوجل أن النموذج يتميز بالحفاظ على الاتساق البصري للشخصيات والعناصر داخل المشاهد حتى مع التعديلات المتكررة، إضافة إلى قدرته على تنفيذ تغييرات معقدة تشمل البيئة والحركة وإضافة شخصيات جديدة أو إعادة تصور السيناريوهات.

كما أوضحت الشركة أن النموذج يدعم دمج مدخلات متعددة مثل الصور والرسومات والمقاطع الصوتية ومقاطع الفيديو المرجعية داخل مشهد واحد متكامل، مع تطبيق أنماط بصرية ومؤثرات مختلفة بشكل تلقائي عبر الأوامر النصية.

ويستفيد" Gemini Omni" من فهم متقدم للعوامل الفيزيائية مثل الجاذبية وديناميكيات الحركة والسوائل، إلى جانب قاعدة معرفية واسعة تغطي مجالات متعددة، ما يساهم في إنتاج محتوى أكثر واقعية واتساقًا من الناحية البصرية والسردية.

وكشفت جوجل أيضًا عن ميزة جديدة باسم" Avatars"، تتيح إنشاء شخصيات رقمية تحاكي المستخدمين ويمكن استخدامها داخل الفيديوهات، مع تأكيد الشركة أنها تعمل على تطويرها وفق ضوابط تمنع إساءة الاستخدام.

وفي إطار مكافحة المحتوى المضلل، أكدت جوجل أن جميع الفيديوهات المنتجة عبر" Gemini Omni" ستتضمن علامة مائية رقمية غير مرئية عبر تقنية SynthID، بما يتيح التحقق من كون المحتوى مُنتجًا أو معدّلًا بالذكاء الاصطناعي.

وبدأت الشركة طرح النسخة الأولى" Gemini Omni Flash" لمشتركي بعض خطط Google AI، مع إتاحته عبر تطبيق Gemini ومنصات إنتاج المحتوى مثل Google Flow وYouTube Shorts، على أن يتم توسيع الإتاحة تدريجيًا.

ويأتي هذا الإطلاق في ظل احتدام المنافسة بين شركات التكنولوجيا العالمية، وعلى رأسها OpenAI وميتا، لتطوير نماذج قادرة على إنتاج الفيديوهات عبر الأوامر النصية، في سباق متسارع نحو أدوات ذكاء اصطناعي أكثر تقدمًا في صناعة المحتوى المرئي.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك