القدس العربي - معاريف..الحل الوحيد: إخضاع نتنياهو بتردد ترامب.. وسقوطه في الانتخابات المقبلة وكالة سبوتنيك - نائب لبناني سابق: لبنان لا يزال تحت النار وإسرائيل لا تتجاوب مع الإدارة الأمريكية Euronews عــربي - وسط تحذيرات من تداعيات اقتصادية وغذائية.. أسراب "الجراد المغربي" تجتاح شرق إيران الجزيرة نت - تزوير الانتخابات وحروب لا تنتهي.. أولمرت ينتقد نتنياهو وحكومته من "المجانين" Euronews عــربي - حرب إيران والإضرابات و"إي إي إس": لماذا يتراجع عدد المسافرين جوا في أوروبا فرانس 24 - باكستان تتهم الهند باستخدام "المياه كسلاح" عبر مشروعين يهددان معاهدة السند وكالة الأناضول - لبنان.. 10 قتلى خلال 24 ساعة يرفعون حصيلة عدوان إسرائيل إلى 3526 فرانس 24 - كيف تقود الأبحاث الحديثة ثورة في علاج السرطان؟ روسيا اليوم - وسائل إعلام عبرية: مقتل وإصابة جنود إسرائيليين في هجوم صعب لحزب الله Euronews عــربي - منظمة العفو الدولية: أكثر من ألف حالة اعتقال وسحب جنسيات في دول الخليج على خلفية الحرب مع إيران
عامة

نتفليكس تطور نموذجاً ذكياً لإزالة عناصر من المشاهد بعد المونتاج

 الشرق للأخبار
2

كشفت نتفليكس عن نموذج ذكاء اصطناعي جديد يحمل اسم VOID، يستهدف تطوير قدرات الذكاء الاصطناعي في تحرير الفيديو، خاصة في إزالة العناصر من المشاهد مع الحفاظ على منطقية التفاعلات الفيزيائية، وهي واحدة من أب...

ملخص مرصد
أعلنت نتفليكس عن تطوير نموذج ذكاء اصطناعي جديد يُسمى VOID، يهدف إلى إزالة عناصر من الفيديوهات مع الحفاظ على التفاعلات الفيزيائية المنطقية. يعتمد النموذج على تحليل المشهد وتحديد المناطق المتأثرة، ثم إعادة توليد المشهد بالكامل بشكل واقعي. أظهرت التجارب تفوق النموذج على نماذج أخرى في الحفاظ على ديناميكيات المشاهد بعد الإزالة.
  • نموذج VOID الجديد لإزالة عناصر من الفيديوهات مع الحفاظ على التفاعلات الفيزيائية
  • يعتمد على تحليل المشهد وتحديد المناطق المتأثرة قبل إعادة التوليد
  • تفوق النموذج على نماذج أخرى مثل ProPainter وDiffuEraser في التجارب
من: نتفليكس

كشفت نتفليكس عن نموذج ذكاء اصطناعي جديد يحمل اسم VOID، يستهدف تطوير قدرات الذكاء الاصطناعي في تحرير الفيديو، خاصة في إزالة العناصر من المشاهد مع الحفاظ على منطقية التفاعلات الفيزيائية، وهي واحدة من أبرز نقاط الضعف في النماذج الحالية.

وأفادت ورقة بحثية نشرتها نتفليكس، بأن الأساليب الحالية لإزالة العناصر من الفيديو تحقق أداءً قويًا في مهام الاستكمال البصري (Inpainting)، إذ يمكنها إعادة بناء المحتوى" خلف" العنصر المحذوف، إلى جانب تصحيح العيوب المرتبطة بالمظهر مثل الظلال والانعكاسات.

لكن هذه النماذج تفشل عندما يكون العنصر المحذوف جزءًا من تفاعلات فيزيائية معقدة داخل المشهد، مثل الاصطدام بأجسام أخرى أو التأثير على حركتها، إذ تعجز عن تعديل هذه التفاعلات بشكل منطقي، ما يؤدي إلى نتائج غير واقعية بصريًا.

ويعتمد نموذج VOID نهجًا مختلفًا قائمًا على تنفيذ استكمال بصري يأخذ في الاعتبار القوانين الفيزيائية، إذ لا يقتصر دوره على حذف العنصر فقط، بل يعيد توليد المشهد بالكامل كما لو أن العنصر المحذوف لم يكن موجودًا من الأساس، مع إعادة بناء التفاعلات الفيزيائية الناتجة عن غيابه بشكل متماسك.

تبدأ آلية عمل النظام بتفاعل مباشر من المستخدم، الذي يحدد العنصر المراد إزالته من الفيديو.

بعد ذلك، يستخدم النظام نموذجًا يجمع بين الرؤية الحاسوبية واللغة لتحليل المشهد وتحديد المناطق الأخرى التي يمكن أن تتأثر طبيعتها بحذف هذا العنصر، مثل الأجسام التي ربما تسقط أو تصطدم أو تغيّر مسارها.

ويعمل النموذج على ترميز هذه المناطق ضمن قناع جرافيكي خاص يُعرف باسم" Quadmask"، والذي يُستخدم لاحقًا لتوجيه نموذج توليدي يعتمد على تقنيات الانتشار، من أجل إنتاج نسخة" افتراضية بديلة" من الفيديو توضح كيف كان سيبدو المشهد في حال عدم وجود العنصر، مع الحفاظ على الاتساق الفيزيائي للحركة والتفاعلات.

يعمل النظام عبر مرحلتين متكاملتين، تنتج المرحلة الأولى فيديو جديدًا يتم فيه حذف العنصر وإعادة ضبط التفاعلات المرتبطة به بشكل منطقي.

وفي حال ظهور تشوهات في شكل الأجسام، وهي مشكلة معروفة في نماذج الفيديو التوليدية، تبدأ المرحلة الثانية التي تعيد تنفيذ العملية باستخدام طريقة معدّلة وفق تدفق الحركة المستخلص من المرحلة الأولى، ما يساعد على تثبيت شكل العناصر أثناء حركتها ضمن المسارات الجديدة التي جرى توليدها، ويؤدي ذلك إلى نتائج أكثر استقرارًا.

ولأغراض التدريب، اعتمدت الدراسة على إنشاء مجموعة بيانات جديدة تتضمن أمثلة مزدوجة لعمليات إزالة عناصر في سيناريوهات افتراضية بديلة، باستخدام نظام Kubric لتوليد بيانات صناعية تحاكي التفاعلات الفيزيائية، إلى جانب HUMOTO لتمثيل حركات البشر داخل الفيديو.

وتضم كل عينة في البيانات الفيديو الأصلي، وقناع Quadmask الذي يحدد المناطق المتأثرة، إضافة إلى الفيديو الناتج المتوقع الذي يمثل الحقيقة المرجعية.

وأظهرت نتائج التجارب، التي شملت بيانات صناعية وأخرى واقعية، أن إطار VOID يتفوق على عدد من النماذج الحالية في الحفاظ على ديناميكيات المشهد بعد إزالة العناصر، بما في ذلك ProPainter وDiffuEraser وRunway وMiniMax-Remover وROSE وGen-Omnimatte.

ويتيح النظام واجهة مقارنة تفاعلية تسمح للمستخدمين بمقارنة الفيديو الأصلي، مع القناع، بمخرجات النماذج المختلفة عبر أداة تمرير تفاعلية.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك