تعمل غوغل على تطوير جيل جديد من مؤشرات الفأرة المدعومة بالذكاء الاصطناعي، في محاولة لتحويل طريقة تفاعل المستخدمين مع الحواسيب والتطبيقات، بعد أكثر من نصف قرن بقي فيه مؤشر الفأرة تقريباً من دون تغييرات جوهرية.
وتقول غوغل إنها تستكشف قدرات جديدة تسمح للمؤشر ليس فقط بفهم ما يشير إليه المستخدم، بل أيضاً إدراك سبب أهمية ذلك بالنسبة له، عبر دمج تقنيات الذكاء الاصطناعي من «جيميناي» داخل تجربة الاستخدام اليومية.
وتهدف الشركة إلى التخلص من واحدة من أكثر المشكلات شيوعاً في أدوات الذكاء الاصطناعي الحالية، وهي اضطرار المستخدم إلى الانتقال إلى نافذة منفصلة لاستخدام المساعدات الذكية.
وبدلاً من ذلك، تريد غوغل أن يصبح الذكاء الاصطناعي جزءاً طبيعياً من جميع الأدوات والتطبيقات التي يستخدمها الشخص، من دون تعطيل سير عمله.
فعلى سبيل المثال، يمكن للمستخدم الإشارة إلى صورة مبنى وطلب «أرني الاتجاهات»، بينما يفهم النظام تلقائياً السياق والعنصر المقصود، من دون الحاجة إلى أوامر طويلة أو شرح إضافي.
وكشفت غوغل عن نماذج تجريبية لمؤشر ذكي مدعوم بـ«جيميناي»، يتيح تنفيذ مهام مختلفة بمجرد الإشارة والتحدث، مثل تعديل الصور أو البحث عن أماكن على الخرائط داخل «غوغل إيه آي ستوديو».
تقول غوغل إن رؤيتها الجديدة تعتمد على أربعة مبادئ رئيسية تهدف إلى نقل عبء شرح السياق من المستخدم إلى الحاسوب، واستبدال التعليمات النصية المعقدة بتفاعلات أكثر بساطة وطبيعية.
الذكاء الاصطناعي داخل جميع التطبيقاتبحسب غوغل، يجب أن تعمل قدرات الذكاء الاصطناعي داخل جميع التطبيقات بدلاً من إجبار المستخدم على مغادرة عمله للانتقال إلى أداة منفصلة.
وفي النموذج التجريبي، يمكن للمستخدم الإشارة إلى ملف «بي دي إف» وطلب ملخص مباشر، أو تمرير المؤشر فوق جدول بيانات لتحويله إلى رسم بياني، أو تحديد وصفة طعام وطلب مضاعفة جميع المكونات تلقائياً.
ترى غوغل أن أنظمة الذكاء الاصطناعي الحالية تعتمد بشكل مفرط على الأوامر النصية الدقيقة، بينما يستطيع المؤشر الذكي الجديد فهم السياق البصري والدلالي لما يظهر على الشاشة.
وبذلك، يكفي أن يشير المستخدم إلى كلمة أو صورة أو فقرة أو جزء من الشيفرة البرمجية، ليعرف النظام تلقائياً ما يحتاج إليه المستخدم.
تشير غوغل إلى أن البشر في حياتهم اليومية لا يستخدمون دائماً أوصافاً مطولة، بل يعتمدون على الإشارات والسياق المشترك، مثل قول «أصلح هذا» أو «انقل ذلك هنا».
وتعتقد الشركة أن دمج الإشارة مع الكلام والسياق سيسمح للمستخدمين بتنفيذ طلبات معقدة بطريقة طبيعية ومختصرة، من دون الحاجة إلى كتابة أوامر تفصيلية.
تحويل العناصر على الشاشة إلى كيانات ذكيةوترى غوغل أن الذكاء الاصطناعي بات قادراً على تحويل ما يظهر على الشاشة من مجرد «بكسلات» إلى عناصر قابلة للفهم والتفاعل، مثل الأماكن والتواريخ والأشياء.
فعلى سبيل المثال، يمكن لصورة لملاحظة مكتوبة بخط اليد أن تتحول إلى قائمة مهام تفاعلية، بينما قد يتحول مشهد متوقف من فيديو سفر إلى رابط حجز مباشر للمكان الظاهر فيه.
دمج التقنية الجديدة في كروم وغوغل بوكوتقول غوغل إنها بدأت بالفعل دمج هذه المفاهيم داخل متصفح «كروم» وتجربة الحواسيب المحمولة الجديدة «غوغل بوك».
وبدلاً من كتابة أوامر طويلة، سيتمكن المستخدم من استخدام المؤشر لطرح أسئلة على «جيميناي» حول أجزاء محددة من صفحة الإنترنت، مثل مقارنة عدة منتجات أو تصور قطعة أثاث داخل غرفة المعيشة.
كما تخطط الشركة لإطلاق ميزة «المؤشر السحري» داخل «غوغل بوك»، بحيث يصبح «جيميناي» متاحاً مباشرة عبر المؤشر لتجربة أكثر سلاسة وبديهية.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك