روسيا اليوم - البحرية البريطانية: ثلث وقت أسطولنا استنزف في مطاردة "أشباح روسيا" تحت الماء إيلاف - بين التصعيد والتهدئة... ماذا يجري خلف الكواليس؟ روسيا اليوم - سكوت ريتر: زيلينسكي "لن يعيش طويلا" بعد انتهاء الأزمة العربية نت - أطعمة غنية بالماء تساعد على ترطيب الجسم العربي الجديد - البرازيل حُرمت من ركلة جزاء ليلة انتصارها على مصر الجزيرة نت - رويترز: واشنطن تعتزم استخدام أصول إيرانية لتعويض حلفائها في الخليج الجزيرة نت - النيابة العامة المصرية تكشف تفاصيل التحقيق مع صبري نخنوخ سكاي نيوز عربية - مصر تفرض شخصيتها.. والبرازيل تحسم بروفة المونديال روسيا اليوم - البرازيل قد تفرض تدابير ضد الاتحاد الأوروبي بسبب حظر استيراد اللحوم روسيا اليوم - ماروتشكو: القوات الروسية تطوق تجمعا لقوات كييف شمال سفياتوغورسك في دونيتسك
عامة

"أوبن إيه آي" تطلق نماذج صوتية جديدة للتحدث والترجمة الفورية

العربي الجديد
العربي الجديد منذ 3 أسابيع
2

أعلنت شركة تطبيقات الذكاء الاصطناعي الأميركية" أوبن إيه آي"، الخميس، أن واجهة برمجة التطبيقات (API) الخاصة بها ستتضمن مجموعة من خصائص الذكاء الصوتي الجديدة، المصممة لمساعدة المطورين على إنشاء تطبيقات ...

ملخص مرصد
أطلقت شركة أوبن إيه آي الأميركية الخميس ميزات صوتية جديدة لواجهة برمجة التطبيقات (API) تشمل نماذج محادثة وترجمة فورية، وفقاً لتقرير موقع تك كرانش. تستهدف هذه الأدوات المطورين لتمكين تطبيقات قادرة على التفاعل الصوتي، مع دعمها لأكثر من 70 لغة إدخال و13 لغة إخراج. قالت الشركة إن النماذج الجديدة ستفيد قطاعات مثل دعم العملاء والتعليم، لكنها حذرت من مخاطر إساءة الاستخدام مع وجود ضوابط حماية.
  • أطلقت أوبن إيه آي نماذج صوتية جديدة لواجهة API تشمل محادثة وترجمة فورية
  • تدعم الميزات أكثر من 70 لغة إدخال و13 لغة إخراج بحسب الشركة
  • قالت أوبن إيه آي إن النماذج ستفيد قطاعات مثل التعليم ودعم العملاء
من: أوبن إيه آي

أعلنت شركة تطبيقات الذكاء الاصطناعي الأميركية" أوبن إيه آي"، الخميس، أن واجهة برمجة التطبيقات (API) الخاصة بها ستتضمن مجموعة من خصائص الذكاء الصوتي الجديدة، المصممة لمساعدة المطورين على إنشاء تطبيقات قادرة على التحدث مع المستخدمين، ونسخ المحادثات، وترجمتها.

ووفقاً لتقرير نشره موقع تك كرانش للتكنولوجيا، تشير الشركة إلى نموذجها الجديد" جي بي تي-ريال تايم-2" (GPT-Realtime-2) باعتباره نموذجاً صوتياً متقدماً يهدف إلى إنشاء محاكاة صوتية واقعية قادرة على التفاعل مع المستخدمين.

وعلى عكس الإصدار السابق" جي بي تي-ريال تايم-1.

5" (GPT-Realtime-1.

5)، يعتمد هذا النموذج على قدرات استدلال من فئة" جي بي تي-5" (GPT-5)، ما يتيح له التعامل مع طلبات أكثر تعقيداً.

كما أطلقت الشركة خاصية" جي بي تي-ريال تايم-ترانسليت" (GPT-Realtime-Translate)، التي توفر ترجمة فورية للمحادثات بشكل متزامن مع المستخدم، إذ تدعم أكثر من 70 لغة إدخال (أي اللغات التي يفهمها النموذج) و13 لغة إخراج (اللغات التي ينقلها إلى المتحدث).

كذلك كشفت" أوبن إيه آي" عن ميزة جديدة لتحويل الصوت إلى نص باسم" جي بي تي-ريال تايم-ويسبر" (GPT-Realtime-Whisper)، تتيح للمستخدمين تحويل الكلام إلى نص مباشرةً أثناء التفاعل.

وأفادت الشركة في بيان بأن هذه النماذج" تنقل التفاعل الصوتي المباشر من مجرد استجابة بسيطة إلى واجهات صوتية قادرة فعلياً على الاستماع، والتفكير، والترجمة، ونسخ الكلام، واتخاذ إجراءات أثناء سير المحادثة".

وأضافت أن هذه التحديثات ستفيد بشكل خاص الشركات التي تسعى إلى تطوير خدمات دعم العملاء، إلى جانب مجالات أخرى مثل التعليم، والإعلام، والفعاليات، ومنصات صُنّاع المحتوى.

وفي المقابل، أقرت" أوبن إيه آي" بإمكانية إساءة استخدام هذه الأدوات، مشيرةً إلى أنها أدرجت ضوابط حماية للحد من استغلالها في الرسائل المزعجة أو الاحتيال أو أشكال أخرى من الانتهاكات، بما في ذلك آليات توقف المحادثات في حال رصد محتوى مخالف.

وبيّنت أن جميع هذه النماذج الصوتية متاحة ضمن واجهة" ريال تايم" (Realtime API)، حيث تُحتسب تكلفة خدمتي الترجمة و" ويسبر" بالدقيقة، فيما يجري احتساب تكلفة استخدام" جي بي تي-ريال تايم-2" بناءً على عدد الرموز (Tokens).

تطبيق مرصد

تابع آخر تطورات الخبر لحظة بلحظة عبر تطبيق مرصد

تعليقات وتحليلات قراء مرصد
تنبيهات عاجلة بآخر التطورات
مصادر موثوقة وشاملة

احصل على تغطية شاملة للأخبار السياسية والتحليلات العميقة من مصادر متنوعة وموثوقة. تفاعل مع الخبر عبر التعليقات والمشاركة، وكن أول من يعلم بآخر التطورات.

حمّل تطبيق مرصد الآن مجاناً على Google Play

التعليقات (0)

لا توجد تعليقات حتى الآن. كن أول من يعلق!

أضف تعليقك