Site icon رسانه تخصصی هوش مصنوعی سیمرغ

مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

مدل‌های Gemma 4 QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

مدل‌های Gemma 4 QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

سیمرغ — ۱۶ خرداد ۱۴۰۵ | گوگل دیپ‌مایند در ادامه‌ی توسعه‌ی سریع خانواده مدل‌های هوش مصنوعی Gemma 4، از نسخه‌های جدیدی رونمایی کرد که با استفاده از تکنیک «آموزش آگاه از کوانتیزاسیون» (Quantization-Aware Training یا QAT) بهینه‌سازی شده‌اند. این به‌روزرسانی انقلابی، نیاز به حافظه (VRAM) را به‌شدت کاهش داده و بازدهی محلی مدل‌ها را روی دستگاه‌های لبه (Edge)، لپ‌تاپ‌ها و پردازنده‌های گرافیکی معمولی به حداکثر می‌رساند.

این معرفی تنها دو ماه پس از رونمایی اولیه Gemma 4 و چند روز پس از عرضه مدل 12B و قابلیت پیش‌بینی چند توکنی (MTP) صورت می‌گیرد تا زنجیره ابزارهای کاربردی گوگل برای توسعه‌دهندگان کامل‌تر شود.

فناوری QAT چیست و چرا یک برگ برنده است؟

کوانتیزاسیون (Quantization) روشی کلیدی برای کاهش حجم مدل‌ها و افزایش سرعت پردازش است تا بتوان آن‌ها را روی سخت‌افزارهای تجاری و خانگی اجرا کرد. با این حال، روش‌های سنتیِ پس از آموزش (PTQ)، معمولاً باعث افت کیفیت و دقت خروجی مدل می‌شوند.

گوگل دیپ‌مایند با به‌کارگیری تکنیک QAT، فرآیند فشرده‌سازی را مستقیماً وارد مرحله‌ی آموزش کرده است؛ به این معنی که مدل در زمان یادگیری، فشرده‌شدن را شبیه‌سازی می‌کند. خروجی این روش، حفظ خیره‌کننده‌ی کیفیت و دقت مدل در مقایسه با روش‌های استاندارد قبلی است.

دیپ‌مایند این ساختار را روی فرمت محبوب Q4_0 پیاده‌سازی کرده و برای مدل‌های سبک‌تر (E2B و E4B)، یک معماری کوانتیزاسیون کاملاً اختصاصی برای موبایل طراحی کرده است.

بهینه‌سازی اختصاصی برای سخت‌افزارهای موبایل

فرمت‌های فشرده‌سازی معمولی اغلب برای پردازنده‌های موبایل سنگین هستند. گوگل برای حل این چالش، یک طرح کوانتیزاسیون سفارشی را مهندسی کرده که پایداری و سرعت فوق‌العاده‌ای به همراه دارد:

یک دستاورد بزرگ: توسعه‌دهندگان می‌توانند انکودرهای صوتی و تصویری را در صورت عدم نیاز حذف کنند. برای مثال، نسخه متنی خالص مدل Gemma 4 E2B اکنون برای اجرا تنها به کمتر از ۱ گیگابایت حافظه نیاز دارد!

دسترسی گسترده و پشتیبانی در اکوسیستم هوش مصنوعی

گوگل برای تسهیل کار توسعه‌دهندگان، از همین امروز پارتنرشیپ‌های گسترده‌ای را برای پشتیبانی از نسخه‌های Gemma 4 QAT آغاز کرده است:

منبع: https://blog.google/innovation-and-ai/technology/developers-tools/quantization-aware-training-gemma-4

Exit mobile version