وكالة الأناضول - جامعة مصرية تعلن اكتشاف موقع أحفوري نادر عمره 62 مليون سنة العربية نت - 5 مزايا خفية في تطبيق الطقس على آيفون تستحق التجربة CNN بالعربية - شاهد.. ترامب يُشبّه "بركة الانعكاس" في نصب لنكولن بناطحات السحاب Euronews عــربي - تحب قطارات الليل؟ خريطة جديدة تكشف كل رحلات المبيت في أوروبا عام 2026 روسيا اليوم - زاخاروفا: روسيا تسلّم الأمم المتحدة كل ما يدحض اتهام عسكرييها في أي انتهاكات العربية نت - تضم أفراناً فخارية وقطعاً حجرية.. "اكتشافات أثرية" جديدة تضاف إلى سجل الآثار السعودية القدس العربي - ليبيا: محتجون يغلقون مقر مفوضية اللاجئين في طرابلس إيلاف - "من يفعل شيئاً غير وطني كهذا؟".. ترامب يتهم الكونغرس بالخيانة بعد تحجيم نفوذه الحربي العربية نت - "بكاء وصراخ".. ردة فعل جنونية للاعبات كوريات أمام كيم روسيا اليوم - امتحانات الشهادات العامة في السويداء
عامة

"الصورة بألف كلمة".. لماذا وقعنا في حب المنتجات البصرية للذكاء الاصطناعي؟

الجزيرة نت
الجزيرة نت منذ 3 أسابيع
1

مع التطور المتسارع في نماذج الذكاء الاصطناعي التوليدي، لم تعد الصورة مجرد عنصر مكمل للنص، بل أصبحت" العملة" الأكثر قيمة في الاقتصاد الرقمي الجديد.ففي عام 2014، نشر باحثو معهد ماساتشوستس للتكنولوجيا ...

ملخص مرصد
أثبتت دراسات معهد ماساتشوستس للتكنولوجيا أن الدماغ البشري يعالج الصور الكاملة في 13 ملي ثانية فقط، أسرع بكثير من النصوص التي تحتاج إلى ترجمة داخلية. كما كشفت أبحاث أن الصور تزيد نسبة التذكر إلى 65% مقارنة بـ10% للنصوص بعد 3 أيام. وأصبحت المنتجات البصرية للذكاء الاصطناعي أداة أساسية في الاقتصاد الرقمي بفضل قدرتها على التواصل العابر للحدود دون الحاجة إلى ترجمة.
  • الدماغ يعالج الصور في 13 ملي ثانية أسرع من النصوص (بحسب معهد ماساتشوستس للتكنولوجيا)
  • 82% من قادة الأعمال استخدموا أدوات ذكاء اصطناعي لإنتاج محتوى بصري في 2024 (تقرير كانفا)
  • الصورة تزيد نسبة التذكر إلى 65% مقارنة بـ10% للنصوص بعد 3 أيام
من: باحثو معهد ماساتشوستس للتكنولوجيا، قادة أعمال، منظمة هيومن رايتس ووتش أين: العالم

مع التطور المتسارع في نماذج الذكاء الاصطناعي التوليدي، لم تعد الصورة مجرد عنصر مكمل للنص، بل أصبحت" العملة" الأكثر قيمة في الاقتصاد الرقمي الجديد.

ففي عام 2014، نشر باحثو معهد ماساتشوستس للتكنولوجيا (MIT) الأمريكي دراسة في مجلة أتنشن بيرسيبشن آند سايكوفيزيكس (Attention Perception & Psychophysics) أثبتت أن الدماغ البشري قادر على معالجة صورة كاملة في 13 ملي ثانية فقط، أي في لمح البصر الحرفي.

وهذا الرقم كان صادما لأن الدراسات السابقة كانت تقدر المدة بـ100 ملي ثانية على الأقل.

وتكشف الأبحاث الأحدث أن المعالجة البصرية واللغوية تسيران في قنوات متوازية لكنها مختلفة في الدماغ، فقناة البصر تمر عبر القشرة البصرية الأولية ثم المناطق الترابطية بسرعة هائلة دون الحاجة إلى ترجمة رمزية، في حين تحتاج اللغة المكتوبة إلى مراحل تفكيك رمزي إضافية.

وبعبارة أبسط، فإن الصورة تصل إلى الفهم مباشرة، أما النص فيحتاج إلى" ترجمة" داخلية أولا.

كما يشير الباحثون إلى ما يعرف بـ" تأثير تفوق الصورة"، وهو ظاهرة موثقة في علم النفس المعرفي، فبعد 3 أيام من قراءة نص، يتذكر الإنسان نحو 10% من المعلومات، لكن حين تقرن المعلومة بصورة ترتفع نسبة التذكر إلى 65%.

وهذا ما يجعل المنتجات البصرية للذكاء الاصطناعي تلامس وترا عميقا، حيث إنها لا تنتج محتوى فحسب، بل تنتج محتوى ذا قابلية استثنائية للبقاء في الذاكرة.

وقبل الذكاء الاصطناعي التوليدي، كان الإنتاج البصري الاحترافي محجوزا لأصحاب المهارة التقنية أو المال الكافي للاستعانة بالمصممين.

حيث تشير نتائج تقرير كانفا (Canva) للاقتصاد البصري عام 2024، الذي استطلع آراء 3700 قائد أعمال في 12 دولة، إلى أن 82% منهم استخدموا أدوات ذكاء اصطناعي لإنتاج محتوى بصري، وأن 77% يرون أن التواصل البصري حسّن أداءهم التجاري.

لماذا تتفوق الصورة تقنيا؟فالصورة هي اللغة الوحيدة التي لا تحتاج إلى ترجمة، ووفقا لتقارير المنتدى الاقتصادي العالمي حول مهارات المستقبل، فإن" التواصل البصري" أصبح مهارة عابرة للحدود، إذ سمح الذكاء الاصطناعي لشخص في اليابان بإنتاج محتوى بصري يفهمه شخص في البرازيل دون الحاجة إلى قاموس، ما جعل المنتجات البصرية الأداة المثالية للعولمة الرقمية.

كيف وقعنا في حب" البكسلات الذكية"؟لم يأت هذا الحب من فراغ، بل هو نتيجة تطور تقني مذهل في معمارية النماذج، فالتقنية تقف خلف أغلب الصور المذهلة اليوم، حيث تعمل هذه النماذج عبر إزالة" الضجيج" من صورة مشوشة تدريجيا حتى تصل إلى شكل نهائي مبهر.

وهذا التدرج في البناء يحاكي طريقة عمل العقل في صياغة الذكريات أو الأحلام.

إضافة إلى أن إنتاج صورة سينمائية في السابق كان يتطلب كاميرات بآلاف الدولارات وخبرة في الإضاءة، أما الآن، وبفضل تقنيات مثل ستيبل ديفيوجن (Stable Diffusion)، يمكن لأي جهاز حاسوب متوسط القوة إنتاج جودة تضاهي أعمال هوليوود.

لماذا الصورة أهم من النص في سياق الذكاء الاصطناعي؟في عالم البيانات الضخمة، تعد الصور" بيانات غنية"، وذلك لعدة أسباب تقنية وعملية، أهمها:التحقق والمصداقية البصرية: ففي مجالات مثل الصحافة والتحقيق الجنائي الرقمي، الصورة هي الدليل الأول.

ورغم مخاطر" التزييف العميق"، فإن الذكاء الاصطناعي البصري يساهم أيضا في بناء أدوات لكشف التزييف عبر تقنيات مثل" سي2بي إيه" (C2PA) التي تعني معايير منشأ المحتوى وتوثيقه، وتدعمها شركات مثل أدوبي ومايكروسوفت.

التدريب المتبادل: يتم تدريب نماذج اللغات الكبيرة (LLMs) بشكل متزايد على الصور لفهم العالم المادي بشكل أفضل.

أي أن الذكاء الاصطناعي لا يصبح ذكيا حقا إلا عندما" يرى".

مستقبل الصور في التطبيقاتينتقل العالم اليوم من مرحلة" توليد الصور للمتعة" إلى مرحلة" الوظيفية البصرية الكاملة"، حيث سيغير ذلك مستقبل التطبيقات، فلن تكون واجهات التطبيقات ثابتة، بل سيقوم الذكاء الاصطناعي بتوليد واجهة مستخدم بصرية مخصصة لكل فرد بناء على حالته المزاجية أو حاجته اللحظية، وإذا كان المستخدم يفضل النمط التبسيطي، سيعيد التطبيق رسم نفسه بصريا فورا.

أما التجارة الإلكترونية الغامرة، فستنتقل تطبيقات التسوق من عرض صور المنتجات إلى توليد" تجربة بصرية مخصصة"، وذلك بفضل تقنيات مثل القياس الافتراضي، حيث سيرى المستخدم صورا لنفسه وهو يرتدي الملابس بدقة مذهلة، ما يقلل معدلات الإرجاع بنسبة كبيرة.

إضافة إلى ذلك، ستحدث ثورة في التعليم والطب، ففي الطب، سيساعد تحويل بيانات الرنين المغناطيسي المعقدة إلى صور ثلاثية الأبعاد مولدة بالذكاء الاصطناعي الأطباء على شرح الحالات للمرضى بدقة أكبر.

وفي التعليم، سيتحول النص التاريخي الجاف إلى" فيلم بصري" تفاعلي داخل الفصل الدراسي.

ولا يمكن الحديث عن حب الصور دون ذكر المخاوف، فوفقا لمنظمة هيومن رايتس ووتش، فإن سهولة توليد الصور تزيد من خطر التضليل الرقمي.

كما أن حقوق الملكية الفكرية للفنانين الذين استُخدمت أعمالهم لتدريب هذه النماذج تظل نقطة صراع قانوني كبرى في محاكم الولايات المتحدة والاتحاد الأوروبي.

وعليه يقول الخبراء إن وقوعنا في حب المنتجات البصرية للذكاء الاصطناعي هو اعتراف بعجزنا السابق عن التعبير الكامل عن خيالنا، حيث منحنا الذكاء الاصطناعي" عيونا رقمية" نرى بها أفكارنا.

وفي المستقبل، لن تكون الصورة مجرد أداة للتوضيح، بل ستصبح هي الواجهة الأساسية للتفاعل بين الإنسان والآلة، حيث تتلاشى الحدود بين ما نتخيله وما يمكننا رؤيته حقيقة.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك