
DeepSeek.. النموذج الصيني الذي يعيد تشكيل مستقبل الذكاء الاصطناعي
مُنيت شركات التكنولوجيا الأمريكية الكبرى بخسائر فادحة وغير مسبوقة من توابع الزلزال الذي سببته شركة DeepSeek الصينية بالتقدم الهائل لنموذجها للدردشة الآلية المعتمدة على الذكاء الاصطناعي، وتكلفته الزهيدة.
أبرز الخاسرين شركة Nvidia، فقد تراجعت القيمة السوقية لأسهمها بمقدار 588.8 مليار دولار في يوم واحد فقط، وهو أكبر انخفاض تشهده شركة في تاريخ الأسواق المالية. هذا التراجع الحاد وضع Nvidia في موقف صعب للغاية، خصوصًا أنها كانت تعتمد بشكل كبير على الطلب المتزايد على رقائق الذكاء الاصطناعي، وهي واحدة من أكبر الشركات في هذا المجال.
لم تكن Nvidia الشركة الوحيدة التي ضربها زلزال DeepSeek، إذ امتدت موجة الخسائر إلى أسهم شركات أخرى مثل Microsoft وAlphabet وMeta مع ازدياد المخاوف من أن الشركة الصينية الناشئة قد تتمكن من التفوق على الشركات الأمريكية بفضل استراتيجياتها الأكثر كفاءة وتكلفتها المنخفضة.
ما هو DeepSeek؟
DeepSeek هي شركة ذكاء اصطناعي صينية برزت قوةً عالميةً رائدةً بعد إطلاق تطبيقها للدردشة الآلية المعتمد على الذكاء الاصطناعي في يناير/كانون الثاني الحالي في الولايات المتحدة. هذا التطبيق لم يكتفِ فقط بأن يصبح الأكثر تحميلًا على متاجر التطبيقات المجانية، بل أحدث تأثيرًا عميقًا على الأسواق المالية، ما لفت الانتباه إلى نهج الشركة المبتكر والمتميز.
تأسست الشركة في يوليو/حزيران 2023 في مدينة هانغتشو، جنوب شرق الصين، على يد رائد الأعمال ليانغ وينفنغ، خريج جامعة تشيجيانغ، الذي استغل صندوق التحوط الخاص به، لتمويل إطلاق شركة DeepSeek. وقد ساهمت رؤيته الاستراتيجية في وضع الشركة في صدارة المنافسة.
تكلفة إطلاق التطبيق زهيدة مقارنة بالمليارات التي تنفقها شركات مثل OpenAI وGoogle
إحدى الخطوات الحاسمة التي ميّزت DeepSeek كان اقتناءها المبكر لرقائق Nvidia A100 وهي أداة أساسية لتطوير أنظمة الذكاء الاصطناعي المتقدمة. ومع حظر الحكومة الأمريكية تصديرها إلى الصين منذ عام 2022 كجزء من سياسات تهدف إلى تقييد وصول الدولة المنافسة إلى التكنولوجيا المتقدمة ذات الاستخدامات العسكرية والمدنية، تمكّنت الشركة الصينية من الاستفادة القصوى من هذه الشرائح عبر توظيفها بفاعلية مع رقائق أقل تكلفة. وتشير بعض التقديرات إلى امتلاك الشركة ما يقرب من 50 ألف شريحة.
وعلى الرغم من أن تكلفة تطوير التطبيق بلغت 6 ملايين دولار فقط، وهو رقم زهيد مقارنة بالمليارات التي تنفقها شركات مثل OpenAI وGoogle، فإن أداءه وميزاته تجعلانه مكافئًا لمنافسيه.
رحلة التطوير والإطلاق
بدأت قصة DeepSeek مع إطلاق أول نموذج لغوي كبير لها، وهي خطوة جريئة نحو بناء أداة متقدمة قادرة على فهم النصوص واستنتاج المعاني. في المراحل الأولى، واجه الفريق تحديات جمّة لضمان قدرة النموذج على المنافسة مع أدوات الذكاء الاصطناعي الرائدة في السوق مثل ChatGPT وفي النهاية، تمكن الفريق من تصميم نموذج جذب اهتمام المطورين والمستخدمين بفضل سهولة تكامله واستخدامه.
منذ البداية، حرصت الشركة على توفير أدلة تعليمية واضحة ومفصلة على موقعها الرسمي، إضافة إلى إطلاق نسخة مفتوحة المصدر على منصة GitHub. هذا التوجه شجع المبرمجين على تبني النموذج وتخصيصه لتطبيقات متعددة، ما أسهم في انتشاره الواسع، وقد عززت الشركة هذا النجاح بتقديم نموذج تسعير مرن، جعله في متناول الأفراد والشركات الصغيرة والمؤسسات الكبرى على حد سواء.
بنجاح الإطلاق الأول، بدأ فريق DeepSeek في التطوير، ما أسفر عن ولادة الإصدار الثاني DeepSeek V2. لم يكن هذا الإصدار مجرد تطوير للنموذج السابق، بل مثّل نقلة نوعية حقيقية. استثمر الفريق جهوده في تحسين قدرة النموذج على فهم النصوص ومعالجة البيانات بكفاءة أعلى، إلى جانب تقديم وحدات متخصصة لتلبية احتياجات متنوعة.
تميز DeepSeek V2 بإضافة وحدات متخصصة مثل وحدة حل المسائل الرياضية المعقدة التي لاقت إعجاب المتخصصين، ووحدة أخرى تجمع بين تحليل الصور والنصوص، ما فتح المجال لتطبيقات مبتكرة في الإعلام والبحث. كما شملت التحسينات وحدة دعم البرمجة التي قدمت للمطورين أدوات فعالة لكتابة الأكواد وتصحيحها.
يتعلم النموذج الصيني من خلال التجربة والخطأ بدلًا من الاعتماد على بيانات مُعنونة مسبقًا
ومع إدراكها لأهمية السياق في المحادثات الطويلة، عملت الشركة على تطوير قدرات النموذج للحفاظ على السياق وتحسين استمرارية المحادثة. وبهذا، أصبح "DeepSeek V2" نموذجًا متعدد الاستخدامات يلبي احتياجات العديد من الصناعات.
وصلت DeepSeek إلى نقطة تحول رئيسية مع إطلاق DeepSeek V3. جمع هذا الإصدار بين الأداء المتميز والدقة العالية والمرونة، وأصبح النموذج الجديد قادرًا على معالجة النصوص بشكل مترابط والتعامل مع المعلومات المعقدة بكفاءة، مما جعله ينافس بقوة تقنيات مثل ChatGPT وGemini.
كيف يمكن مقارنته مع ChatGPT؟
لفهم الفروق بين DeepSeek وChatGPT، يمكننا النظر إلى الطرق التي يتم بها تدريب كل نموذج. يستخدم ChatGPT أسلوبًا تقليديًا يتضمن التعلم تحت الإشراف (Supervised Learning - SFT)، وهو أسلوب يعتمد على تدريب النموذج باستخدام بيانات مُعَلَّمة مسبقًا (مثل الأسئلة مع إجاباتها الصحيحة). هذا النهج يُشبه تعليم طالب عن طريق تقديم أمثلة واضحة مع الحلول، مما يُساعد النموذج على فهم الأنماط والعلاقات بين البيانات لتقديم إجابات دقيقة لاحقًا.
أيضًا يعتمد ChatGPT على التعلم المعزز المدعوم بالتفاعل البشري/RLHF، وهو أسلوب يجمع بين الذكاء الاصطناعي والتدخل البشري لتحسين أداء النموذج. في هذا النهج، يُدرب على تقديم إجابات أولية، ثم يقيّم البشر هذه الإجابات ويقدمون ملاحظات لتوجيه النموذج نحو تحسين استجاباته. يُشبه هذا الأسلوب وجود مُعلم يساعد الطالب على تصحيح أخطائه بعد أن يحاول حل الأسئلة بمفرده، مما يُكسب النموذج قدرةً أكبر على التفاعل مع المستخدمين بشكل أكثر دقة وملاءمة.
على الجانب الآخر، يعتمد DeepSeek على نهج في استخدام التعلم المعزز/Reinforcement Learning - RL كأساس رئيسي. بدلًا من الاعتماد على بيانات مُعنونة مسبقًا؛ يتعلم النموذج من خلال التجربة والخطأ، ويحصل على مكافأة عند تقديم إجابات صحيحة، ويتم توجيهه عند الخطأ. يمكن تشبيه هذه العملية بمكافأة طالب عندما يقدم إجابة صحيحة، مثل منحه درجات إضافية أو إشادة بجهوده، ويُوجَّه عند ارتكابه أخطاء لتحسين أدائه في المستقبل.
هذا النهج يساعد النموذج على التعلم بشكل أفضل من التجارب العملية وتحسين استجاباته بمرور الوقت. وبفضل هذه الطريقة، يستطيع DeepSeek التعامل مع مواقف جديدة وغير مألوفة، مما يمنحه مرونة عالية وقدرة على التكيف دون الحاجة إلى كميات كبيرة من البيانات المسبقة، كما يساعد على تحسين أدائه باستمرار وتطوير استنتاجات ذاتية بمرور الوقت.
تقنيات متقدمة في التصميم والتطوير
يعتمد DeepSeek على تصميم تقني متطور، إذ يحتوي النموذج على 600 مليار معلمة (Parameters)، وهي قيم داخلية يستخدمها لمعالجة البيانات وفهمها، تمامًا كما تعمل الروابط العصبية في الدماغ البشري على نقل المعلومات وتحليلها. ويُدرّب باستخدام 14.8 تريليون رمز تدريبي (tokens)، وهو ما يعني أنه جرى تدريبه باستخدام عدد هائل من الوحدات النصية الصغيرة مثل الكلمات أو أجزاء من الكلمات. هذا العدد الضخم يساعد النموذج على فهم اللغة بشكل أفضل، ويتعلم الروابط بين الكلمات والمعاني والسياقات لضمان دقة عالية في الأداء.
من أبرز التقنيات المستخدمة في تصميمه مزيج الخبراء/Mixture of Experts، وهي تقنية متقدمة تُستخدم في تصميم النموذج لتوزيع المهام بين أجزاء مختلفة منه. يمكن تشبيهها بفريق عمل، بحيث يختص كل خبير في جزء معين من المهمة، مما يساعد على التعامل مع المشكلات بكفاءة أكبر. هذه التقنية تضمن أن يركز النموذج طاقته على الأجزاء الأكثر أهميةً من المشكلة، ما يعزز من سرعته ودقته.
أيضًا يستخدم تقنية الاهتمام متعدد الرؤوس/Multi-Head Attention، وهي تقنية تُستخدم لتوزيع تركيز النموذج على عدة أجزاء من البيانات في الوقت نفسه، وهو ما يمكن تشبيهه بمُعلم ينظر إلى مجموعة من الطلاب في آنٍ واحد بدلًا من التركيز على طالب واحد فقط. هذا يسمح بفهم العلاقات بين الكلمات والعبارات في النص بشكل أعمق وأكثر دقة، خاصة عندما تكون المشكلات معقدة أو تحتوي على العديد من التفاصيل المتداخلة.
في المقابل، فإن ChatGPT مصمم لتقديم أداء متطور يجمع بين الدقة والمرونة في الاستخدام، ويعتمد الإصدار GPT-4 على 175 مليار معلمة، وهي بمثابة الروابط الداخلية التي تساعد النموذج على فهم النصوص واستيعاب السياقات المختلفة بشكل دقيق. هذا يجعل ChatGPT قادرًا على التعامل مع مجموعة واسعة من الاحتياجات، مثل إدارة المحادثات اليومية، والإجابة عن أسئلة معقدة بطريقة مبسطة، وتقديم دعم إبداعي في كتابة المحتوى.
بفضل تصميمه السهل والاستخدام المتعدد، يمكن الاعتماد على ChatGPT في تطبيقات متنوعة تشمل التعليم والأعمال والإبداع، مما يجعله مناسبًا لفئات واسعة من المستخدمين الباحثين عن ذكاء اصطناعي يدمج بين المرونة والكفاءة.
انفتاح DeepSeek مقابل ChatGPT
يُعدُّ DeepSeek نموذجًا مفتوح المصدر بشكل واضح، مما يعني أنه يتيح لأي مستخدم تنزيل نموذج R1 وتشغيله محليًا على أجهزتهم الشخصية. هذه الخاصية تعطي المستخدمين سيطرة كاملة على بياناتهم، وتبقى محفوظة لديهم دون الحاجة لمشاركتها مع الشركة المطورة. يعكس هذا النهج التزامًا بالخصوصية، خصوصًا في ظل المخاوف المتزايدة حول كيفية تعامل الشركات مع بيانات المستخدمين. ومع ذلك، فإن الانفتاح الذي يُقدمه DeepSeek يأتي مع تحديات، منها التقارير التي تشير إلى رقابة على بعض الإجابات بسبب القيود الحكومية الصينية.
وبينما يمكن للمستخدمين تجاوز هذه القيود باستخدام النماذج المفتوحة محليًا، فإن هذا يطرح تساؤلات حول مدى تأثير السياسات المحلية على حرية الذكاء الاصطناعي.
في الجهة الأخرى، تراجعت OpenAI عن العديد من وعود "الانفتاح" التي قدمتها في بداياتها. وعلى الرغم من أن ChatGPT يوفر واجهات استخدام شاملة ويُقدم أداءً قويًا، فإن طبيعته المغلقة تُثير انتقادات بشأن الشفافية، ولا يمكن الوصول إلى الكود الأساسي للنموذج أو تشغيله محليًا، مما يعني أن المستخدمين مضطرون لاستخدام خدمات OpenAI عبر الإنترنت؛ هذا التصميم يجعلهم أكثر عرضة لمخاطر الخصوصية ويضع OpenAI في موقع تحكم كامل ببيانات المستخدمين.
تطبيقات العالم الحقيقي
يركز DeepSeek على المجالات التقنية والعلمية بشكل خاص، فهو يُستخدم بشكل كبير في تحليل البيانات الضخمة وتطوير البرمجيات، مما يجعله أداة مفضلة للباحثين والمطورين الذين يحتاجون إلى ذكاء اصطناعي يتمتع بالدقة والكفاءة.
ويلعب النموذج دورًا حيويًا في تحسين التواصل متعدد اللغات، ما يُسهل التفاعل بين فِرق العمل العالمية، إضافة إلى تقديم أدوات لتحليل الأسواق بشكل دقيق ودعم اتخاذ القرارات الاستراتيجية. علاوة على ذلك، يقدم حلولًا تعليميةً متطورةً تُساعد المؤسسات التعليمية والمتعلمين على تخصيص أساليب التعلم بما يتناسب مع احتياجاتهم الفردية.
على الجانب الآخر، يُعتبر ChatGPT نموذجًا شاملًا يغطي طيفًا واسعًا من التطبيقات؛ في مجال دعم العملاء يُعد أداة فعالة لتشغيل روبوتات المحادثة، مما يوفر تفاعلًا سلسًا وسريعًا مع المستخدمين. كما يبرز دوره في مجال كتابة المحتوى، ويُساعد الكتّاب والمسوقين على إنتاج نصوص تسويقية وتعليمية عالية الجودة بسهولة وسرعة.
يُستخدم ChatGPT كذلك في قطاع الرعاية الصحية أيضًا لتقديم الدعم التشخيصي وتحسين تجربة المرضى من خلال الاستشارات الافتراضية. هذا التنوع يجعله خيارًا مثاليًا للمؤسسات التي تبحث عن حلول شاملة لتلبية احتياجات متعددة.
التكاليف
عند مقارنة تكاليف استخدام نماذج الذكاء الاصطناعي بين DeepSeek وChatGPT، نجد أن DeepSeek يقدم حلًا أقل تكلفة. وفقًا لموقع DeepSeek الرسمي، فإن تكلفة استخدام نموذج DeepSeek-R1 تبدأ من 0.14 دولار لكل مليون رمز، أي ما يعادل تقريبًا 750 ألف كلمة. في المقابل، يبلغ سعر نموذج o1 من OpenAI حوالي 7.50 دولار لكل مليون رمز، مما يشير إلى فرق كبير في التسعير بين النموذجين.
كما تقدم OpenAI خطط اشتراك مختلفة لمستخدمي ChatGPT. تتضمن هذه الخطط خطة ChatGPT Plus بسعر 20 دولارًا شهريًا، التي توفر وصولًا أسرع وأولوية في أوقات الذروة. كما أطلقت OpenAI خطة ChatGPT Pro بسعر 200 دولار شهريًا لاستهداف المستخدمين الذين يحتاجون إلى قدرات حوسبة مكثفة للمهام المعقدة.
من المقابل، يتميز DeepSeek بتقديم نموذج مفتوح المصدر، مما يسمح للمطورين بتنزيله وتشغيله محليًا دون تكلفة، مع ضمان عدم مشاركة بياناتهم مع الشركة. هذا النهج يجعله خيارًا جذابًا للمطورين والشركات الصغيرة التي تبحث عن حلول ذكاء اصطناعي فعّالة من حيث التكلفة.
خسائر اقتصادية فادحة
لم يقتصر تأثير DeepSeek على قطاع التكنولوجيا الأمريكي فحسب، بل امتد إلى قطاعات أخرى حيوية مثل الطاقة، إذ شهدت شركات كبرى مثل Constellation Energy وVistra انخفاضات حادة في القيمة السوقية لأسهمها، إذ تعتمد هذه الشركات على الطلب الضخم من مراكز البيانات التي تحتاج إلى كميات هائلة من الطاقة لتشغيل نماذج الذكاء الاصطناعي. ومع النسخ الجديدة من DeepSeek التي تُبدي كفاءةً أعلى واستهلاكًا أقل، باتت هناك شكوك حقيقية حول جدوى الاستثمار في البنية التحتية الضخمة للطاقة التي كانت ضروريةً لدعم هذه الصناعة.
كما بدأت الأسواق المالية الأمريكية في مراقبة التحركات الصينية عن كثب، ويُنظر إلى DeepSeek باعتباره رمزًا جديدًا للصناعة التكنولوجية في الصين، مما يعزز مكانتها لاعبًا رئيسيًا على المسرح العالمي. يُظهر هذا التطور كيف يمكن للشركات الناشئة أن تغير ديناميكيات السوق بالكامل عبر الجمع بين التكلفة المنخفضة والابتكار عالي الكفاءة.
يشير التحليل الاقتصادي إلى أن هذه الديناميكيات قد تُرغم الشركات الأمريكية على إعادة تقييم استراتيجياتها التوسعية. وفي الوقت نفسه، هناك دعوات متزايدة من صُناع القرار في الغرب لتحليل تأثير DeepSeek على المدى الطويل ومدى قدرة الدول الغربية على المنافسة في هذا السياق.
يمثل هذا الوضع تحولًا جذريًا في ديناميكيات السوق، ويبدو أن التقنيات الجديدة التي تطورها DeepSeek قادرة على العمل بكفاءة دون الحاجة إلى كميات كبيرة من الطاقة. هذا لا يُظهر فقط تفوق الصين في الابتكار، بل أيضًا دورها المتنامي في إعادة تشكيل العلاقات الاقتصادية العالمية، مما يغير المعادلات الاقتصادية والتكنولوجية للعديد من الشركات والمؤسسات الكبرى، ويضيف طبقة جديدة من التحديات على ساحة المنافسة الدولية.