Close Menu
رسانه تخصصی هوش مصنوعی سیمرغرسانه تخصصی هوش مصنوعی سیمرغ
  • منشور اخلاقی سیمرغ
  • درباره ما
  • ارتباط با ما
  • آموزش و منابع آموزشی
    • کاربردهای هوش مصنوعی در صنایع
    • کتاب های هوش مصنوعی
    • مقالات هوش مصنوعی
  • رویدادها
    • دوره های آموزشی
    • سمینار
    • کارگاه
    • کنفرانس
    • مصاحبه‌ها

برای دریافت جدیدترین اخبار عضو خبرنامه شوید

خبرنامه در حال حاضر غیرفعال است.

پست جذاب میخوای؟

مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

نرم افزار(اپلیکیشن) هوش مصنوعی ایرانی

پیش‌بینی مسابقات جام جهانی با هوش مصنوعی؛ کدام مدل هوش مصنوعی قهرمان جام را درست حدس می‌زند؟

X (Twitter) Instagram YouTube LinkedIn Telegram
رسانه تخصصی هوش مصنوعی سیمرغرسانه تخصصی هوش مصنوعی سیمرغ
  • خانه
  • اخبار و مقالات
    • پزشکی
    • بازاریابی و تبلیغات
    • حمل و نقل
    • کشاورزی
    • حقوق و قضا
    • مالی و بانکی
    • هنر و خلاقیت
    • تولید و صنعت
    • آموزش
    • محیط زیست
    • بخش انرژی
    • امنیتی و دفاعی
    • مصاحبه‌ها
    • View All On Demos
  • رویدادها
    • سمینار
    • کنفرانس
    • وبینار
    • دوره های آموزشی
  • آموزش‌ها

    هوش مصنوعی جما &#۸۲۱۱; Gemma ۴ گوگل

    فروردین 15, 1405

    (هوش مصنوعی) مدل Grok ۴.۲ در برابر Gemini ۳.۰

    دی 17, 1404

    آموزش ساخت اکانت یکساله پرو ChatGPT رایگان در یک دقیقه

    دی 8, 1404

    مدل هوش مصنوعی GPT-۵.۲-Codex چیست؟

    آذر 29, 1404

    Google Illuminate: راز جدید گوگل برای یادگیری سریع

    آذر 14, 1404
  • ابزارها
    1. چت‌بات‌ها و مدل‌های زبانی (LLMs & Chatbots)
    2. ابزارهای آموزش و یادگیری (Education & Learning AI)
    3. ابزارهای بهره‌وری و مدیریت (Productivity)
    4. ابزارهای تخصصی هوش مصنوعی (Advanced AI Tools)
    5. ابزارهای علم داده و دیتاساینس( Data Science & Analytics tools)
    6. ابزارهای امنیت، حریم خصوصی و سایبر (AI Security Tools)
    7. ابزارهای تحقیق، پژوهش و مقاله‌نویسی (AI Research Tools)
    8. ابزارهای بازاریابی و سئو (AI Marketing & SEO Tools)
    9. ابزارهای تولید صدا و موسیقی (AI Audio & Music Tools)
    10. ابزارهای کدنویسی و توسعه نرم‌افزار (AI Coding Tools)
    11. View All

    نرم افزار(اپلیکیشن) هوش مصنوعی ایرانی

    خرداد 16, 1405

    هوش مصنوعی GPT-۵.۵ چیست؟ معرفی جامع به همراه آموزش دقیق

    اردیبهشت 8, 1405

    بروزرسانی Google Workspace

    اردیبهشت 3, 1405

    هوش مصنوعی GPT-۵.۴؛ مدل جدید OpenAI

    فروردین 17, 1405

    معرفی «Prism»: فضای کار ابری مبتنی بر هوش مصنوعی برای نوشتن مقالات علمی

    بهمن 19, 1404

    Google Illuminate: راز جدید گوگل برای یادگیری سریع

    آذر 14, 1404

    هوش مصنوعی NotebookLM

    آذر 13, 1404

    Google Scholar Labs | گوگل اسکولار لبز چیست؟

    آبان 29, 1404

    بروزرسانی Google Workspace

    اردیبهشت 3, 1405

    معرفی «Prism»: فضای کار ابری مبتنی بر هوش مصنوعی برای نوشتن مقالات علمی

    بهمن 19, 1404

    مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

    خرداد 16, 1405

    هوش مصنوعی GPT-۵.۴؛ مدل جدید OpenAI

    فروردین 17, 1405

    هوش مصنوعی جما &#۸۲۱۱; Gemma ۴ گوگل

    فروردین 15, 1405

    دسترسی کامل‌تر به گوگل و امکانات پیشرفته‌تر با Google AI Pro

    بهمن 12, 1404

    نسل جدید بینایی هوشمند با Gemini ۳ Pro

    آذر 16, 1404

    هوش مصنوعی جما &#۸۲۱۱; Gemma ۴ گوگل

    فروردین 15, 1405

    معرفی «Prism»: فضای کار ابری مبتنی بر هوش مصنوعی برای نوشتن مقالات علمی

    بهمن 19, 1404

    دسترسی کامل‌تر به گوگل و امکانات پیشرفته‌تر با Google AI Pro

    بهمن 12, 1404

    نسل جدید بینایی هوشمند با Gemini ۳ Pro

    آذر 16, 1404

    Tokenmaxxing | توکن‌مکسینگ یا «بیشینه‌سازی توکن»

    فروردین 29, 1405

    هوش مصنوعی GPT-۵.۴؛ مدل جدید OpenAI

    فروردین 17, 1405

    مدل هوش مصنوعی GPT-۵.۲-Codex چیست؟

    آذر 29, 1404

    کدام هوش مصنوعی بهترین برنامه‌نویس است؟

    آذر 13, 1404

    کاربرد هوش مصنوعی در ردیابی گوشی گم‌شده: انقلابی در امنیت دیجیتال

    مهر 30, 1401

    تولید آیفون ۱۴، ۲۰ درصد گران‌تر از آیفون ۱۳ است

    مهر 30, 1401

    مایکروسافت قصد دارد نمای دسکتاپ یا موبایل را در نوار کناری Edge معرفی کند

    مهر 30, 1401

    VPN غیرمتمرکز چیست و آیا باید از آن استفاده کنم؟

    مهر 30, 1401
  • خرید اشتراک سالانه
  • ارتباط با ما
    • منشور اخلاقی سیمرغ
    • ارتباط با ما
    • درباره ما
Instagram YouTube LinkedIn Telegram
رسانه تخصصی هوش مصنوعی سیمرغرسانه تخصصی هوش مصنوعی سیمرغ
خانه - ابزارها - مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ
مدل‌های Gemma 4 QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ
مدل‌های Gemma 4 QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

0
By تحریریه هوش مصنوعی سیمرغ on خرداد 16, 1405 ابزارها, ابزارهای تخصصی هوش مصنوعی (Advanced AI Tools), شاخص‌ها, فناوری, هوش مصنوعی
اشتراک‌ با دوستان
Facebook Twitter LinkedIn Pinterest Telegram Email WhatsApp Copy Link

سیمرغ — ۱۶ خرداد ۱۴۰۵ | گوگل دیپ‌مایند در ادامه‌ی توسعه‌ی سریع خانواده مدل‌های هوش مصنوعی Gemma 4، از نسخه‌های جدیدی رونمایی کرد که با استفاده از تکنیک «آموزش آگاه از کوانتیزاسیون» (Quantization-Aware Training یا QAT) بهینه‌سازی شده‌اند. این به‌روزرسانی انقلابی، نیاز به حافظه (VRAM) را به‌شدت کاهش داده و بازدهی محلی مدل‌ها را روی دستگاه‌های لبه (Edge)، لپ‌تاپ‌ها و پردازنده‌های گرافیکی معمولی به حداکثر می‌رساند.

این معرفی تنها دو ماه پس از رونمایی اولیه Gemma 4 و چند روز پس از عرضه مدل 12B و قابلیت پیش‌بینی چند توکنی (MTP) صورت می‌گیرد تا زنجیره ابزارهای کاربردی گوگل برای توسعه‌دهندگان کامل‌تر شود.

فناوری QAT چیست و چرا یک برگ برنده است؟

کوانتیزاسیون (Quantization) روشی کلیدی برای کاهش حجم مدل‌ها و افزایش سرعت پردازش است تا بتوان آن‌ها را روی سخت‌افزارهای تجاری و خانگی اجرا کرد. با این حال، روش‌های سنتیِ پس از آموزش (PTQ)، معمولاً باعث افت کیفیت و دقت خروجی مدل می‌شوند.

گوگل دیپ‌مایند با به‌کارگیری تکنیک QAT، فرآیند فشرده‌سازی را مستقیماً وارد مرحله‌ی آموزش کرده است؛ به این معنی که مدل در زمان یادگیری، فشرده‌شدن را شبیه‌سازی می‌کند. خروجی این روش، حفظ خیره‌کننده‌ی کیفیت و دقت مدل در مقایسه با روش‌های استاندارد قبلی است.

دیپ‌مایند این ساختار را روی فرمت محبوب Q4_0 پیاده‌سازی کرده و برای مدل‌های سبک‌تر (E2B و E4B)، یک معماری کوانتیزاسیون کاملاً اختصاصی برای موبایل طراحی کرده است.

بهینه‌سازی اختصاصی برای سخت‌افزارهای موبایل

فرمت‌های فشرده‌سازی معمولی اغلب برای پردازنده‌های موبایل سنگین هستند. گوگل برای حل این چالش، یک طرح کوانتیزاسیون سفارشی را مهندسی کرده که پایداری و سرعت فوق‌العاده‌ای به همراه دارد:

  • اکتیویشن‌های استاتیک (Static Activations): به جای محاسبه آنی و بلادرنگ مقیاس داده‌ها در زمان پاسخ‌گویی، این تنظیمات در طول آموزش پیش‌محاسبه می‌شوند. این کار بار پردازشی چیپست موبایل را به شدت کاهش می‌دهد.
  • کوانتیزاسیون کانال‌محور (Channel-wise Quantization): ساختار داده‌های فشرده‌شده به گونه‌ای چیده شده است که با شتاب‌دهنده‌های سخت‌افزاری موبایل همخوانی کامل داشته باشد و نیاز به میان‌برهای نرم‌افزاری کند را از بین ببرد.
  • کوانتیزاسیون ۲ بیتی هدفمند (Targeted 2-bit Quantization): بخش‌هایی از مدل که مسئول تولید توکن‌ها هستند تا حد فوق‌العاده‌ی ۲ بیت فشرده شده‌اند، در حالی که لایه‌های اصلی استدلال برای حفظ هوشمندی مدل، در دقت بالاتری باقی مانده‌اند.
  • بهینه‌سازی لایه‌های Embedding و KV Cache: تمرکز فشرده‌سازی بر روی لیست واژگان و حافظه کوتاه‌مدت مدل، فضای اشغال‌شده در رم را کاهش داده و امکان چت‌های طولانی را بدون پر شدن حافظه فراهم می‌کند.

یک دستاورد بزرگ: توسعه‌دهندگان می‌توانند انکودرهای صوتی و تصویری را در صورت عدم نیاز حذف کنند. برای مثال، نسخه متنی خالص مدل Gemma 4 E2B اکنون برای اجرا تنها به کمتر از ۱ گیگابایت حافظه نیاز دارد!

دسترسی گسترده و پشتیبانی در اکوسیستم هوش مصنوعی

گوگل برای تسهیل کار توسعه‌دهندگان، از همین امروز پارتنرشیپ‌های گسترده‌ای را برای پشتیبانی از نسخه‌های Gemma 4 QAT آغاز کرده است:

  • دریافت مستقیم وزن‌ها: وزن‌های مدل Q4_0 و نسخه‌های موبایل هم‌اکنون در پلتفرم Hugging Face در دسترس است. فرمت‌های GGUF برای استفاده در llama.cpp و تنسورهای فشرده برای vLLM آماده شده‌اند.
  • اجرای آسان روی دسکتاپ: کاربران می‌توانند این مدل‌ها را به صورت محلی و با رابط‌های کاربری ساده‌ای مانند Ollama، LM Studio و llama.cpp اجرا کنند.
  • استقرار روی موبایل و وب: استفاده از ران‌تایم سبک LiteRT-LM گوگل برای دستگاه‌های همراه و ابزار Transformers.js برای اجرای مستقیم مدل در مرورگر وب فراهم شده است.
  • پشتیبانی از ابزارهای حرفه‌ای: سازگاری کامل با SGLang، ابزار MLX (بهینه‌شده برای اپل سیلیکون) و پلتفرم Unsloth جهت فاینتون (Fine-tune) سریع مدل‌ها.

منبع: https://blog.google/innovation-and-ai/technology/developers-tools/quantization-aware-training-gemma-4

Gemma 4 E2B اکتیویشن‌های استاتیک
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Previous Articleنرم افزار(اپلیکیشن) هوش مصنوعی ایرانی

پست‌های مشابه

پایان معمای ۸۰ ساله ریاضیات به دست هوش مصنوعی

مهندسی پرامپت: شغلی با درآمد ۳۰۰ هزار دلار که فقط به «زبان مادری» شما نیاز دارد!

بزرگترین تغییر سخت‌افزاری ۲۰۲۶: حذف موس با هوش مصنوعی!

شبکه هوش مصنوعی OpenAI آینده آموزش AI را تغییر داد

جام جهانی ۲۰۲۶ و هوش مصنوعی؛ داوران سایبورگ شدند!

پروتکل MRC؛ سلاح جدید OpenAI برای آموزش AI

Add A Comment
Leave A Reply Cancel Reply

برای نوشتن دیدگاه باید وارد بشوید.

تبلیغات
معرفی محصولات
آموزش پرامپت نویسیهوش مصنوعی سیمرغ
درباره رسانه هوش مصنوعی سیمرغ

در رسانه تخصصی هوش مصنوعی سیمرغ، ما فراتر از یک پایگاه خبری عمل می‌کنیم. ما آینده‌ای نوین را با قدرت دانش و فناوری می‌سازیم. از تحلیل عمیق جدیدترین پیشرفت‌های هوش مصنوعی تا معرفی ابزارهای نوآورانه، رسالت ما این است که جامعه‌ای آگاه و پیشرو در این حوزه ایجاد کنیم.

🌍 بزرگترین جامعه هوش مصنوعی خاورمیانه
📡 آخرین اخبار، تحلیل‌ها و آموزش‌های تخصصی
🚀 همراهی با متخصصان، استارتاپ‌ها و علاقه‌مندان هوش مصنوعی

🔗 همین حالا به سیمرغ بپیوندید و آینده را با ما رقم بزنید!
📩 تماس با ما: [email protected]
🌐 وب‌سایت: simorghai.ir

X (Twitter) Instagram YouTube LinkedIn Discord Telegram
درباره ما ارتباط با ما منشور اخلاقی سیمرغ راهنمای خبرنگاران افتخاری
      📩 عضویت در خبرنامه لینکدین
لوگو خبری رسانه هوش مصنوعی سیمرغلوگو خبری رسانه هوش مصنوعی سیمرغ
جدیدترین مطالب

مدل‌های Gemma ۴ QAT : فشرده‌سازی مدل‌ها برای موبایل و لپ‌تاپ

نرم افزار(اپلیکیشن) هوش مصنوعی ایرانی

پیش‌بینی مسابقات جام جهانی با هوش مصنوعی؛ کدام مدل هوش مصنوعی قهرمان جام را درست حدس می‌زند؟

پایان معمای ۸۰ ساله ریاضیات به دست هوش مصنوعی

رسانه تخصصی هوش مصنوعی سیمرغ
X (Twitter) Instagram YouTube LinkedIn Telegram WhatsApp
بازنشر مطالب هوش مصنوعی سیمرغ تحت هر عنوانی غیر مجاز و پیگرد قانونی دارد.
طراحی شده توسط سیمرغ ای آی © 1405.

Type above and press Enter to search. Press Esc to cancel.

افزونه مسدود کننده تبلیغات شما فعال است!
افزونه مسدود کننده تبلیغات شما فعال است!
وب‌سایت ما با نمایش تبلیغات آنلاین به بازدیدکنندگان‌ ادامه حیات میدهد! لطفاً با غیرفعال کردن افزونه مسدودکننده تبلیغات‌ مرورگرتان از تیم سیمرغ حمایت کنید.