أطلقت DeepSeek نموذجها الجديد DeepSeek-V4، في خطوة تعكس تحولاً ملحوظاً في سوق الذكاء الاصطناعي، إذ يجمع بين أداء متقدم يقترب من النماذج العالمية الرائدة، وكفاءة تشغيلية عالية، إلى جانب تكلفة منخفضة واعتماد نهج المصدر المفتوح الذي يتيح استخدامه وتعديله على نطاق واسع.
يعتمد النموذج على بنية “الخبراء المتعددين” (Mixture of Experts)، حيث يضم إصدار V4-Pro نحو 1.
6 تريليون متغير، مع تفعيل 49 ملياراً فقط أثناء التشغيل، فيما يأتي إصدار V4-Flash بـ284 مليار متغير مع تفعيل 13 ملياراً.
هذا التصميم يسمح بتشغيل الأجزاء المطلوبة فقط وفق طبيعة المهمة، ما يحقق كفاءة كبيرة في استهلاك الموارد دون التأثير على الأداء.
ويدعم النموذج طول سياق يصل إلى مليون رمز، ما يتيح التعامل مع كميات ضخمة من البيانات ضمن طلب واحد، مثل تحليل قواعد بيانات كاملة أو أرشيفات نصية ممتدة.
يرتكز DeepSeek-V4 على تحسينات هندسية تشمل آلية انتباه هجينة تعمل على تقليل المعلومات غير الضرورية والتركيز على العناصر الأكثر أهمية، إلى جانب تقنيات تعزز استقرار النموذج وتسهم في تسريع التدريب.
وقد انعكس ذلك على كفاءة التشغيل، إذ تراجع استهلاك الموارد إلى نحو 27% من القدرة الحسابية و10% من الذاكرة مقارنة بالإصدار السابق، بينما يحقق إصدار Flash مستويات أعلى من الكفاءة بانخفاض الاستهلاك إلى نحو 10% و7% على التوالي.
تم تدريب النموذج على أكثر من 32 تريليون رمز من البيانات عالية الجودة، عبر عملية متعددة المراحل تشمل تدريب خبراء متخصصين ثم دمجهم في نموذج موحد، مع توفير أوضاع استدلال مختلفة توازن بين السرعة والدقة.
من حيث الأداء، يحقق V4-Pro تحسناً واضحاً مقارنة بالإصدار السابق، ويقترب من مستوى النماذج المغلقة الرائدة، كما يتفوق على عدد من النماذج مفتوحة المصدر، خصوصاً في مجالات البرمجة والرياضيات.
ورغم أنه لا يزال أقل في بعض المؤشرات من نماذج مثل GPT-5.
5 وClaude Opus 4.
7، إلا أنه يقترب منها بشكل ملحوظ، خاصة في مهام الاستدلال المعقدة.
ويبرز عامل التكلفة كعنصر حاسم، إذ يبلغ سعر الاستخدام نحو 1.
74 دولار لكل مليون رمز إدخال و3.
48 دولار للإخراج، مقارنة بحوالي 35 دولاراً في نماذج منافسة، ما يشير إلى انخفاض كبير في التكلفة التشغيلية.
يمتد تأثير النموذج إلى مجالات متعددة، من تطوير البرمجيات عبر تحليل مشاريع كاملة واكتشاف الأخطاء، إلى قطاع الأعمال من خلال تحليل بيانات مالية طويلة واستخلاص توصيات استراتيجية.
كما يمكن استخدامه في خدمة العملاء لفهم سجل المستخدم وتقديم ردود دقيقة، وفي التعليم لشرح المفاهيم المعقدة وبناء خطط دراسية، إضافة إلى دعم البحث العلمي عبر تحليل عدد كبير من الدراسات واستخراج الأنماط العامة.
ويدعم كذلك تطوير “الوكلاء الأذكياء” القادرين على تنفيذ مهام متعددة الخطوات بشكل مستقل، مثل إدارة المشاريع أو إجراء بحوث موسعة.
يمثل DeepSeek-V4 خطوة نحو تقليل الاعتماد على معالجات Nvidia، من خلال دعم التشغيل على شرائح Huawei Ascend.
وتشير البيانات إلى تحقيق تسريع يتراوح بين 1.
5 و1.
73 مرة في بعض أعباء العمل.
ورغم ذلك، لا تزال Nvidia تحتفظ بتفوق واضح، خصوصاً في بيئة البرمجيات المتكاملة، ما يجعل الانتقال الكامل إلى البدائل عملية تدريجية ومعقدة.
تفاعل السوق وتغير التوقعاتجاءت استجابة الأسواق لإطلاق النموذج الجديد أقل حدة مقارنة بالإصدارات السابقة، ما يعكس تغيراً في سلوك السوق، حيث أصبحت النماذج منخفضة التكلفة وعالية الكفاءة أكثر شيوعاً.
كما ساهمت المنافسة المتزايدة، سواء من الشركات الأميركية أو داخل الصين، في تقليل عنصر المفاجأة، مع تقارب الأداء بين عدد من النماذج الرائدة.
نموذج مفتوح يعزز الانتشارأطلقت DeepSeek نموذجها تحت رخصة MIT المفتوحة، ما يسمح باستخدامه وتعديله وتوزيعه تجارياً دون قيود كبيرة، مع توفير أدوات تطوير متقدمة ودعم التكامل مع أنظمة الذكاء الاصطناعي المختلفة.

التعليقات (0)
لا توجد تعليقات حتى الآن. كن أول من يعلق!
أضف تعليقك