شرکت فناوری چینی علیبابا (Alibaba) روز چهارشنبه از نسخه جدید مدل هوش مصنوعی خود با نام Qwen 2-5-Max رونمایی کرد که به گفته این شرکت، عملکردی فراتر از مدل تحسینشده DeepSeek-V3 دارد.
زمانبندی غیرمعمول انتشار Qwen 2-5-Max در نخستین روز سال نو قمری، هنگامی که بیشتر مردم چین در تعطیلات به سر میبرند، نشاندهنده فشار رقابتی است که رشد سریع استارتاپ هوش مصنوعی چینی DeepSeek در سه هفته گذشته، نه تنها بر رقبا در خارج از کشور، بلکه بر شرکتهای داخلی نیز وارد کرده است.
واحد ابری علیبابا در اطلاعیهای که در حساب رسمی ویچت خود منتشر کرد، اعلام نمود: “Qwen 2-5-Max تقریباً در تمام زمینهها از جمله GPT-4، DeepSeek-V3 و Llama-3.1-405B و گروک پیشی میگیرد.” این مدلها از پیشرفتهترین مدلهای هوش مصنوعی متنباز تولید شده توسط OpenAI و متا هستند.
انتشار مدلهای DeepSeek-V3 و R1 در تاریخهای ۱۰ و ۲۰ ژانویه به ترتیب، باعث شگفتی در سیلیکون ولی شد و سهام شرکتهای فناوری را به شدت کاهش داد. هزینههای توسعه و استفاده پایین این استارتاپ چینی، سرمایهگذاران را به بازنگری در طرحهای هزینهبر شرکتهای بزرگ هوش مصنوعی در ایالات متحده واداشته است.
موفقیت DeepSeek موجب شده تا رقبای داخلی برای بهروزرسانی مدلهای هوش مصنوعی خود به شدت رقابت کنند. دو روز پس از انتشار مدل R1 توسط DeepSeek، شرکت ByteDance، مالک تیکتاک، نسخه جدید مدل هوش مصنوعی خود را منتشر کرد و مدعی شد که در آزمون AIME، که نحوه درک و پاسخ به دستورات پیچیده را اندازهگیری میکند، از مدل o1 شرکت OpenAI پیشی گرفته است. این ادعا مشابه ادعای DeepSeek است که مدل R1 آن با مدل o1 OpenAI در چندین شاخص عملکرد رقابت میکند.
رقابت DeepSeek با رقبای داخلی
مدل پیشین DeepSeek-V3، یعنی DeepSeek-V2، پس از انتشار در ماه مه گذشته، باعث جنگ قیمت مدلهای هوش مصنوعی در چین شد. این مدل اپنسورس و بهطور بیسابقهای ارزان بود (فقط ۱ یوان یا معادل ۰.۱۴ دلار به ازای هر میلیون توکن)، که منجر به اعلام کاهش قیمت تا ۹۷ درصدی توسط واحد ابری علیبابا شد.
دیگر شرکتهای فناوری چینی نیز به این روند پیوستند، از جمله بایدو که اولین مدل مشابه ChatGPT چین را در مارس ۲۰۲۳ منتشر کرد، و شرکت اینترنتی Tencent، که از باارزشترین شرکتهای اینترنتی چین است.
لیانگ ونفنگ، بنیانگذار مرموز DeepSeek، در مصاحبهای نادر با رسانه چینی Waves در ژوئیه گذشته اظهار داشت که این استارتاپ “نگرانیای از جنگهای قیمت ندارد” و هدف اصلی آن دستیابی به هوش مصنوعی عمومی (AGI) است. OpenAI، AGI را بهعنوان سیستمهای خودمختاری تعریف میکند که در اکثر وظایف اقتصادی از انسانها پیشی میگیرند.
در حالی که شرکتهای بزرگ چینی مانند علیبابا صدها هزار کارمند دارند، DeepSeek بیشتر بهعنوان یک آزمایشگاه تحقیقاتی عمل میکند که عمدتاً توسط فارغالتحصیلان جوان و دانشجویان دکتری از دانشگاههای برتر چین اداره میشود.
لیانگ در مصاحبه ژوئیه خود بیان کرد که معتقد است بزرگترین شرکتهای فناوری چین ممکن است بهخوبی برای آینده صنعت هوش مصنوعی آماده نباشند و ساختار هزینهای بالا و مدیریت متمرکز آنها را با عملیات سبک و مدیریت آزاد DeepSeek مقایسه کرد. او گفت: “مدلهای بزرگ پایه نیاز به نوآوری مداوم دارند؛ توانمندیهای غولهای فناوری محدود است.”