وكالة الأناضول - سي إن إن: حريق حاملة الطائرات "فورد" استمر 30 ساعة وأحرق 600 سرير يني شفق العربية - وزير خارجية بنغلاديش يثمن الدور التركي في أزمة الروهينغا العربية نت - 5 قتلى أذربيجانيين في هجوم مسيرات على سفن ببحر آزوف فرانس 24 - غوستافو بيترو لفرانس برس: حلفاء ترامب في كولومبيا "مهرّبو مخدرات" الجزيرة نت - "نحن في مجاعة".. 1800 أسرة بلا طعام ولا وقود في مخيم للنازحين في غزة فرانس 24 - "عقارات الشارقة" تسجل 3,1 مليار درهم خلال أيار/مايو قناة الشرق للأخبار - التطورات الميدانية في السودان: الجيش يستعيد سيطرته على منطقة البركة فرانس 24 - "ألبانيا ليست للبيع"... مظاهرات حاشدة ضد مشروع سياحي مرتبط بجاريد كوشنر وإيفانكا ترامب CNN بالعربية - أول طائرة مقاتلة أمريكية تقلع بلا حاجة لمدرج تخرج من الخدمة بالبحرية الأمريكية قناة القاهرة الإخبارية - إينارا.. لغم تشريعي يقيد الوصول لاتفاق مع إيران | عرض تفصيلي مع ياسر رشدي
عامة

"OpenAI" تُمكّن المطورين من إنشاء تطبيقات قادرة على التحدث مع المستخدمين

العربية نت
العربية نت منذ 4 أسابيع
1

أعلنت شركة OpenAI، الخميس، إضافة مجموعة جديدة من ميزات الذكاء الصوتي إلى واجهاتها البرمجية (API)، في خطوة تهدف إلى تمكين المطورين من إنشاء تطبيقات قادرة على التحدث مع المستخدمين، ونسخ المحادثات صوتياً...

ملخص مرصد
أعلنت شركة OpenAI الخميس عن إطلاق ميزات جديدة للذكاء الصوتي في واجهاتها البرمجية، تهدف إلى تمكين المطورين من إنشاء تطبيقات قادرة على التحدث مع المستخدمين وترجمة المحادثات صوتياً. وكشفت عن نموذج GPT-Realtime-2 ونماذج أخرى مثل GPT-Realtime-Translate وGPT-Realtime-Whisper، مع دعم لأكثر من 70 لغة. وقالت الشركة إن هذه التقنيات ستفيد قطاعات متعددة مثل خدمات العملاء والتعليم، مع ضوابط لمنع إساءة الاستخدام.
  • OpenAI تطلق ميزات صوتية جديدة لتمكين تطبيقات التحدث والترجمة الفورية
  • نموذج GPT-Realtime-2 يدعم محادثات طبيعية مع تحسين فهم السياقات المعقدة
  • الخدمة تدعم 70 لغة للإدخال و13 لغة للترجمة الصوتية بحسب تك كرانش
من: OpenAI

أعلنت شركة OpenAI، الخميس، إضافة مجموعة جديدة من ميزات الذكاء الصوتي إلى واجهاتها البرمجية (API)، في خطوة تهدف إلى تمكين المطورين من إنشاء تطبيقات قادرة على التحدث مع المستخدمين، ونسخ المحادثات صوتياً، وترجمتها بشكل فوري.

وكشفت الشركة عن نموذجها الجديد GPT-Realtime-2، وهو نموذج صوتي متطور صُمم لتقديم محاكاة صوتية واقعية تتيح إجراء محادثات طبيعية مع المستخدمين.

ويأتي النموذج الجديد كخليفة للإصدار السابق GPT-Realtime-1.

5، لكنه يعتمد هذه المرة على قدرات استدلال من فئة GPT-5، ما يمنحه قدرة أفضل على التعامل مع الطلبات المعقدة وفهم السياقات المتقدمة أثناء المحادثة.

كما أطلقت الشركة خدمة GPT-Realtime-Translate، المخصصة للترجمة الفورية المباشرة أثناء المحادثات، بحيث تتمكن من مواكبة المتحدث بشكل طبيعي ودون تأخير ملحوظ.

وتدعم الخدمة أكثر من 70 لغة للإدخال، إلى جانب 13 لغة للإخراج والترجمة الصوتية، بحسب تقرير نشره موقع" تك كرانش" واطلعت عليه" العربية Business".

وفي السياق نفسه، أعلنت الشركة عن ميزة جديدة لتحويل الكلام إلى نص تحمل اسم GPT-Realtime-Whisper، والتي تتيح نسخ المحادثات صوتياً بشكل مباشر ولحظي أثناء حدوثها.

وقالت الشركة إن النماذج الجديدة تمثل نقلة في قدرات التفاعل الصوتي، موضحة أنها تنقل تقنيات الصوت الفوري من مجرد الاستجابة للأوامر إلى واجهات قادرة على الاستماع، والاستدلال، والترجمة، والنسخ، واتخاذ الإجراءات أثناء سير المحادثة.

وترى" OpenAI" أن هذه الأدوات ستكون مفيدة لقطاعات متعددة، أبرزها خدمات العملاء، إلى جانب مجالات التعليم والإعلام وتنظيم الفعاليات ومنصات صناعة المحتوى.

ورغم الفوائد الكبيرة لهذه التقنيات، أشارت الشركة إلى أنها وضعت ضوابط حماية لمنع إساءة استخدامها في عمليات الاحتيال أو الرسائل المزعجة أو أي أنشطة ضارة عبر الإنترنت.

وأضافت أن النظام يتضمن آليات لرصد المحتوى المخالف، مع إمكانية إيقاف المحادثات التي تنتهك سياسات المحتوى الضار.

وأكدت الشركة أن جميع النماذج الصوتية الجديدة أصبحت متاحة عبر Realtime API، حيث يتم احتساب تكلفة خدمتي الترجمة والنسخ بالدقيقة، بينما يعتمد تسعير GPT-Realtime-2 على عدد الرموز (Tokens) المستخدمة.

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك