هوش مصنوعی Qwen 2-5-Max علی‌بابا چیست؟

    0

    شرکت فناوری چینی علی‌بابا (Alibaba) روز چهارشنبه از نسخه جدید مدل هوش مصنوعی خود با نام Qwen 2-5-Max رونمایی کرد که به گفته این شرکت، عملکردی فراتر از مدل تحسین‌شده DeepSeek-V3 دارد.

    زمان‌بندی غیرمعمول انتشار Qwen 2-5-Max در نخستین روز سال نو قمری، هنگامی که بیشتر مردم چین در تعطیلات به سر می‌برند، نشان‌دهنده فشار رقابتی است که رشد سریع استارتاپ هوش مصنوعی چینی DeepSeek در سه هفته گذشته، نه تنها بر رقبا در خارج از کشور، بلکه بر شرکت‌های داخلی نیز وارد کرده است.

    واحد ابری علی‌بابا در اطلاعیه‌ای که در حساب رسمی وی‌چت خود منتشر کرد، اعلام نمود: “Qwen 2-5-Max تقریباً در تمام زمینه‌ها از جمله GPT-4، DeepSeek-V3 و Llama-3.1-405B و گروک پیشی می‌گیرد.” این مدل‌ها از پیشرفته‌ترین مدل‌های هوش مصنوعی متن‌باز تولید شده توسط OpenAI و متا هستند.

    انتشار مدل‌های DeepSeek-V3 و R1 در تاریخ‌های ۱۰ و ۲۰ ژانویه به ترتیب، باعث شگفتی در سیلیکون ولی شد و سهام شرکت‌های فناوری را به شدت کاهش داد. هزینه‌های توسعه و استفاده پایین این استارتاپ چینی، سرمایه‌گذاران را به بازنگری در طرح‌های هزینه‌بر شرکت‌های بزرگ هوش مصنوعی در ایالات متحده واداشته است.

    موفقیت DeepSeek موجب شده تا رقبای داخلی برای به‌روزرسانی مدل‌های هوش مصنوعی خود به شدت رقابت کنند. دو روز پس از انتشار مدل R1 توسط DeepSeek، شرکت ByteDance، مالک تیک‌تاک، نسخه جدید مدل هوش مصنوعی خود را منتشر کرد و مدعی شد که در آزمون AIME، که نحوه درک و پاسخ به دستورات پیچیده را اندازه‌گیری می‌کند، از مدل o1 شرکت OpenAI پیشی گرفته است. این ادعا مشابه ادعای DeepSeek است که مدل R1 آن با مدل o1 OpenAI در چندین شاخص عملکرد رقابت می‌کند.

    رقابت DeepSeek با رقبای داخلی

    مدل پیشین DeepSeek-V3، یعنی DeepSeek-V2، پس از انتشار در ماه مه گذشته، باعث جنگ قیمت مدل‌های هوش مصنوعی در چین شد. این مدل اپن‌سورس و به‌طور بی‌سابقه‌ای ارزان بود (فقط ۱ یوان یا معادل ۰.۱۴ دلار به ازای هر میلیون توکن)، که منجر به اعلام کاهش قیمت تا ۹۷ درصدی توسط واحد ابری علی‌بابا شد.

    دیگر شرکت‌های فناوری چینی نیز به این روند پیوستند، از جمله بایدو که اولین مدل مشابه ChatGPT چین را در مارس ۲۰۲۳ منتشر کرد، و شرکت اینترنتی Tencent، که از باارزش‌ترین شرکت‌های اینترنتی چین است.

    لیانگ ونفنگ، بنیان‌گذار مرموز DeepSeek، در مصاحبه‌ای نادر با رسانه چینی Waves در ژوئیه گذشته اظهار داشت که این استارتاپ “نگرانی‌ای از جنگ‌های قیمت ندارد” و هدف اصلی آن دستیابی به هوش مصنوعی عمومی (AGI) است. OpenAI، AGI را به‌عنوان سیستم‌های خودمختاری تعریف می‌کند که در اکثر وظایف اقتصادی از انسان‌ها پیشی می‌گیرند.

    در حالی که شرکت‌های بزرگ چینی مانند علی‌بابا صدها هزار کارمند دارند، DeepSeek بیشتر به‌عنوان یک آزمایشگاه تحقیقاتی عمل می‌کند که عمدتاً توسط فارغ‌التحصیلان جوان و دانشجویان دکتری از دانشگاه‌های برتر چین اداره می‌شود.

    لیانگ در مصاحبه ژوئیه خود بیان کرد که معتقد است بزرگ‌ترین شرکت‌های فناوری چین ممکن است به‌خوبی برای آینده صنعت هوش مصنوعی آماده نباشند و ساختار هزینه‌ای بالا و مدیریت متمرکز آن‌ها را با عملیات سبک و مدیریت آزاد DeepSeek مقایسه کرد. او گفت: “مدل‌های بزرگ پایه نیاز به نوآوری مداوم دارند؛ توانمندی‌های غول‌های فناوری محدود است.”

    Share.
    Leave A Reply

    رفتن به محتوا