۳۰ مفهوم کلیدی LLM

تحریریه هوش مصنوعی سیمرغ

4 ساعت ago

راهنمای جامع مفاهیم پایه و پیشرفته مدل‌های زبانی بزرگ

اگر تنها پنج مفهوم از این فهرست را بدانید، احتمالاً می‌توانید نیازهای روزمره خود را با ابزارهایی مانند ChatGPT برطرف کنید؛ اما اگر قصد دارید یک عامل هوشمند (AI Agent)، سامانه RAG، دستیار سازمانی یا هر محصول پیشرفته مبتنی بر هوش مصنوعی بسازید، این ۳۰ مفهوم الفبای کار شما و زبان مشترک تیم توسعه خواهند بود.

مدل‌های زبانی بزرگ (Large Language Models) در چند سال اخیر قواعد بازی را در تمام صنایع تغییر داده‌اند. با این حال، بسیاری از فعالان این حوزه تنها با لایه ظاهری این فناوری آشنا هستند. ندانستن مفاهیم عمیق‌تری مانند فضای نهفته (Latent Space)، RLHF یا پنجره متن (Context Window) صرفاً یک ضعف تئوریک نیست؛ بلکه مستقیماً روی کیفیت معماری سیستم، مهندسی پرامپت، تحلیل خطاها و انتخاب مدل مناسب اثر منفی می‌گذارد.

مشکل اینجاست که ندانستن این مفاهیم، فقط یک ضعف تئوری نیست؛ بلکه مستقیماً روی کیفیت طراحی سامانه‌های هوش مصنوعی، مهندسی پرامپت، تحلیل خطاها و حتی انتخاب مدل مناسب اثر می‌گذارد.

در این مقاله از رسانه تخصصی هوش مصنوعی سیمرغ، این مفاهیم کلیدی را به زبانی ساده اما دقیق و مهندسی بررسی می‌کنیم تا تصویر کاملی از مکانیزم درونی مدل‌های زبانی به دست آورید.

نقشه راه و دسته‌بندی مفاهیم

برای جلوگیری از حفظ کردن طوطی‌وار اصطلاحات و درک بهتر ارتباط میان آن‌ها، این ۳۰ مفهوم را در پنج ایستگاه اصلی دسته‌بندی کرده‌ایم:

استنتاج و کنترل خروجی (Inference & Control)
مدل و معماری (Model Architecture)
آموزش و هم‌ترازی (Training & Alignment)
مهندسی پرامپت (Prompt Engineering)
پردازش داده و بازیابی اطلاعات (Data Processing & Retrieval)

بخش اول: مدل و معماری (Model Architecture)

۱. مدل زبانی بزرگ (LLM)

یک شبکه عصبی با ابعاد بسیار عظیم است که روی حجم فوق‌العاده‌ای از داده‌های متنی آموزش دیده تا بتواند «توکن بعدی» را در یک توالی متنی پیش‌بینی کند. مدل‌هایی مانند GPT ،Claude ،Gemini و Llama در این دسته قرار می‌گیرند. مدل‌ها پایگاه‌داده نیستند و اطلاعات را ذخیره نمی‌کنند؛ بلکه الگوهای زبانی را می‌آموزند.

نمونه‌ها:

GPT
Claude
Gemini
Llama
Qwen

این مدل‌ها در واقع دانش را «ذخیره» نمی‌کنند، بلکه الگوهای زبان را یاد می‌گیرند.

۲. پارامترها (Parameters)

پارامترها معادل سیناپس‌ها در مغز انسان و در واقع همان وزن‌های داخلی شبکه عصبی هستند. افزایش تعداد پارامترها (که امروزه از چند میلیارد تا تریلیون‌ها متغیر است) ظرفیت یادگیری و پیچیدگی مدل را بالا می‌برد، اما همزمان هزینه پردازش و نیاز سخت‌افزاری را نیز به شدت افزایش می‌دهد.

هرچه تعداد پارامترها بیشتر باشد:

ظرفیت یادگیری افزایش می‌یابد.
مدل پیچیده‌تر می‌شود.
هزینه آموزش و اجرا بیشتر خواهد بود.

مدل‌های امروزی از چند میلیارد تا صدها میلیارد پارامتر دارند.

۳. مدل پایه (Base Model)

مدل پایه تنها برای پیش‌بینی توکن بعدی آموزش دیده است.

مثلاً اگر بنویسید:

امروز هوا…

مدل ادامه متن را حدس می‌زند.

اما هنوز یاد نگرفته مانند یک دستیار به سؤال پاسخ دهد.

۴. مدل دستورپذیر (Instruct Model)

مدل پایه پس از آموزش‌های تکمیلی به مدل دستورپذیر تبدیل می‌شود.

این مدل:

سؤال را بهتر درک می‌کند.
ساختار پاسخ مناسب ارائه می‌دهد.
از دستورهای کاربر پیروی می‌کند.

تقریباً تمام چت‌بات‌های امروزی از این نوع هستند.

۵. پنجره متن (Context Window)

حداکثر ظرفیت حافظه کوتاه‌مدت مدل در یک نشست (Session) است. این عدد نشان می‌دهد مدل چه تعداد توکن را می‌تواند به صورت همزمان در یک درخواست پردازش کند. هرچه این پنجره بزرگ‌تر باشد، مدل قادر است اسناد، کتاب‌ها و کدهای طولانی‌تری را بدون فراموش کردن متن‌های ابتدایی تحلیل کند.

مثلاً اگر پنجره متن ۲۰۰ هزار توکن باشد، مدل می‌تواند کتاب‌های نسبتاً بزرگی را در یک درخواست تحلیل کند.

هرچه Context بزرگ‌تر باشد:

حافظه کوتاه‌مدت مدل بیشتر می‌شود.
اسناد طولانی‌تر قابل تحلیل هستند.

۶. فضای نهفته (Latent Space)

یکی از انتزاعی‌ترین و مهم‌ترین مفاهیم هوش مصنوعی است. مدل‌ها کلمات و مفاهیم را در یک فضای هندسی چندبعدی بازنمایی می‌کنند. در این فضا، مفاهیم مشابه به هم نزدیک‌ترند؛ برای مثال فاصله ریاضی واژه «پزشک» به «پرستار» بسیار کمتر از فاصله آن تا واژه «برنامه‌نویس» است.

در این فضا:

«گربه» به «ببر» نزدیک‌تر از «هواپیما» است.
«پزشک» به «پرستار» نزدیک‌تر از «برنامه‌نویس» قرار می‌گیرد.

شباهت مفهومی در این فضا به صورت فاصله ریاضی نمایش داده می‌شود.

مقایسه مدل پایه و مدل دستورپذیر

مفهوم	عملکرد	کاربرد و مثال
۵. مدل پایه (Base Model)	تنها برای تکمیل متن و پیش‌بینی کلمه بعدی آموزش دیده است.	اگر بنویسید «آسمان آبی»، ادامه می‌دهد «است و ابرها…». برای ساخت چت‌بات خام است.
۶. مدل دستورپذیر (Instruct Model)	با آموزش‌های ثانویه یاد گرفته از دستورات پیروی کند و ساختار پاسخ‌دهی داشته باشد.	درک می‌کند که باید به سؤال «آسمان چرا آبی است؟» یک پاسخ علمی و ساختاریافته بدهد.

بخش دوم: آموزش و هم‌ترازی (Training & Alignment)

۷. پیش‌آموزش (Pre-training)

فاز اول و پرهزینه‌ترین بخش ساخت یک LLM است. مدل میلیاردها صفحه وب، کتاب و مقاله را می‌خواند تا صرفاً ساختار زبان، گرامر، حقایق جهان و الگوهای آماری کلمات را بیاموزد، نه اینکه به سؤالات پاسخ دهد.

هدف:

یادگیری زبان.

نه پاسخ دادن.

در این مرحله مدل فقط الگوهای آماری زبان را می‌آموزد.

۸. تنظیم دستوری (Instruction Tuning)

مرحله‌ای است که مدل پایه را به یک دستیار تبدیل می‌کند. در این مرحله، مجموعه‌ای از جفت‌های «دستور/پاسخ» به مدل داده می‌شود تا یاد بگیرد چگونه باید درخواست‌های انسان را فرمت‌بندی و اجرا کند.

مدل یاد می‌گیرد:

دستورها را بفهمد.
ساختار مناسب خروجی تولید کند.

۹. تنظیم دقیق (Fine-tuning)

فرآیند آموزش مجدد یا تکمیلی مدل روی یک مجموعه داده تخصصی (مانند متون حقوقی، پرونده‌های پزشکی یا کدهای برنامه‌نویسی اختصاصی یک شرکت) است تا مدل در یک دامنه (Domain) خاص، عملکرد بهتری نشان دهد.

مثلاً:

پزشکی
حقوق
بانکداری
برنامه‌نویسی

در این حالت مدل روی داده‌های تخصصی آموزش می‌بیند.

۱۰. یادگیری تقویتی از بازخورد انسانی (RLHF)

مخفف Reinforcement Learning from Human Feedback است. در این تکنیک، انسان‌ها به پاسخ‌های مختلف مدل امتیاز می‌دهند. مدل از این امتیازات الگو می‌گیرد تا خروجی‌های خود را با ترجیحات انسانی تطبیق دهد.

مخفف:

Reinforcement Learning from Human Feedback

در این روش انسان پاسخ‌های مختلف مدل را رتبه‌بندی می‌کند.

مدل یاد می‌گیرد:

کدام پاسخ بهتر است.

۱۱. هم‌ترازی (Alignment)

تلاش برای همسو کردن رفتار مدل با ارزش‌ها، اخلاقیات و نیازهای انسانی. هدف Alignment این است که خروجی‌های مدل علاوه بر دقیق بودن، مفید (Helpful)، صادق (Honest) و ایمن (Harmless) باشند.

هدف Alignment این است که مدل:

مفید باشد.
صادق باشد.
تا حد امکان ایمن عمل کند.

در واقع پاسخ مدل باید علاوه بر «درست بودن»، «رفتار مناسب» نیز داشته باشد.

۱۲. مدل پاداش (Reward Model)

یک سیستم هوش مصنوعی جانبی است که معمولاً در فرآیند RLHF استفاده می‌شود. وظیفه آن جایگزین شدن با انسان در ارزیابی و امتیازدهی به خروجی‌های مدل اصلی است تا فرآیند آموزش سرعت بگیرد.

بخش سوم: مهندسی پرامپت (Prompt Engineering)

۱۳. پرامپت (Prompt)

هرگونه ورودی (شامل متن، سؤال، تصویر، فایل یا دستور) که از سوی کاربر برای مدل ارسال می‌شود تا خروجی تولید کند.

شامل:

سؤال
دستور
متن
مثال
فایل
تصویر

۱۴. System Prompt

دستور سطح بالا که نقش مدل را مشخص می‌کند.

مثلاً:

«در نقش پزشک پاسخ بده.»

یا

«همیشه پاسخ‌ها کوتاه باشند.»

۱۵. User Prompt

درخواست واقعی کاربر.

مثلاً:

«بهترین روش آموزش پایتون چیست؟»

۱۶. Zero-shot

بدون هیچ نمونه‌ای از خروجی.

فقط سؤال مطرح می‌شود.

۱۷. Few-shot

قبل از سؤال، چند نمونه مطلوب نمایش داده می‌شود.

این کار کیفیت خروجی را به شکل محسوسی افزایش می‌دهد.

۱۸. Chain of Thought

در این روش از مدل خواسته می‌شود فرآیند استدلال خود را مرحله‌به‌مرحله طی کند. این رویکرد می‌تواند برای برخی مسائل پیچیده به بهبود کیفیت پاسخ کمک کند، هرچند مدل‌های جدید اغلب بدون نیاز به درخواست صریح نیز استدلال داخلی خود را انجام می‌دهند.

مقایسه انواع پرامپت و تکنیک‌ها

تکنیک / مفهوم	تعریف تخصصی	مثال کاربردی
۱۴. System Prompt	دستورات سطح بالا و پنهان که شخصیت، لحن و قوانین کلی مدل را تعیین می‌کند.	«شما یک برنامه‌نویس ارشد پایتون هستید. کدهای بهینه بنویسید.»
۱۵. User Prompt	سؤال یا درخواست مستقیم و فعلی کاربر که در لحظه تایپ می‌شود.	«چگونه یک حلقه For در پایتون بنویسم؟»
۱۶. Zero-shot	درخواست از مدل بدون ارائه هیچ‌گونه مثال یا الگوی قبلی.	«متن زیر را به فرانسوی ترجمه کن.»
۱۷. Few-shot	ارائه چند نمونه مطلوب از ورودی و خروجی پیش از طرح سؤال اصلی برای راهنمایی مدل.	«انگلیسی: Apple -> فرانسوی: Pomme. حالا ترجمه کن: Book»
۱۸. Chain of Thought (CoT)	ترغیب مدل به تفکر مرحله‌به‌مرحله با عباراتی نظیر “قدم‌به‌قدم فکر کن” جهت حل مسائل پیچیده.	«ابتدا متغیرها را استخراج کن، سپس فرمول را بنویس و بعد حل کن.»

بخش چهارم: پردازش داده و بازیابی اطلاعات (Data Processing & Retrieval)

۱۹. توکن (Token)

کوچک‌ترین واحد پردازش متن در هوش مصنوعی. یک توکن لزوماً یک کلمه نیست؛ می‌تواند یک حرف، بخشی از یک کلمه، یک عدد یا علامت نگارشی باشد. محاسبات مالی (API) و محدودیت‌های پردازشی تماماً بر اساس تعداد توکن‌ها سنجیده می‌شوند.

ممکن است:

یک کلمه
بخشی از یک کلمه
عدد
علامت نگارشی

باشد.

تمام هزینه، سرعت و حافظه مدل بر اساس تعداد Token محاسبه می‌شود.

۲۰. توکن‌سازی (Tokenization)

الگوریتم و فرآیند خرد کردن متن خام ورودی کاربر به توکن‌های قابل فهم برای ماشین پیش از ارسال آن‌ها به شبکه‌های عصبی.

قبل از ورود متن به مدل، ابتدا Tokenization انجام می‌شود.

۲۱. بردارهای معنایی (Embeddings)

ترجمه توکن‌ها و متون به آرایه‌هایی از اعداد واقعی (Vectors). این بردارها ویژگی‌های معنایی کلمات را در خود جای داده‌اند و به ماشین اجازه می‌دهند روی مفاهیم انتزاعی زبان، محاسبات ریاضی انجام دهد.

جمله‌هایی با مفهوم مشابه، بردارهای نزدیک‌تری خواهند داشت.

۲۲. جستجوی برداری (Vector Search)

تکنیک جستجویی که به جای تطابق کلمه به کلمه (Keyword Match)، به دنبال نزدیک‌ترین بردارهای عددی در فضای نهفته می‌گردد. این روش باعث می‌شود جستجو بر اساس «معنی و مفهوم» انجام شود.

این روش پایه بسیاری از موتورهای جستجوی مدرن است.

۲۳. RAG

مخفف Retrieval-Augmented Generation است. این معماری ضعف حافظه دانشی مدل را پوشش می‌دهد. در RAG، پیش از پاسخگویی مدل، ابتدا اطلاعات مرتبط از یک پایگاه‌داده خارجی جستجو (Retrieval) شده و به عنوان بستر اطلاعاتی به پرامپت اضافه (Augmented) می‌شود تا مدل بر اساس آن محتوای دقیق تولید (Generation) کند.

مراحل کار:

جستجو در منابع
بازیابی اطلاعات
افزودن اطلاعات به Prompt
تولید پاسخ

این روش یکی از مؤثرترین راهکارها برای کاهش خطاهای دانشی مدل است.

بخش پنجم: استنتاج و کنترل خروجی

۲۴. استنتاج (Inference)

فاز اجرای مدل در محیط عملیاتی. زمانی که مدل آموزش‌دیده، پرامپت شما را می‌گیرد و بر اساس وزن‌های شبکه‌اش کلمه به کلمه پاسخ را تولید می‌کند، در حال انجام عملیات Inference است. (زمانی که مدل از دانش آموزش‌دیده خود برای تولید پاسخ استفاده می‌کند، فرآیند Inference در حال انجام است.)

تمام مکالمات روزمره با ChatGPT در این مرحله اتفاق می‌افتد.

۲۵. دمای نمونه‌برداری (Temperature)

پارامتری ریاضی (معمولاً بین ۰ تا ۱ یا ۲) که میزان خلاقیت و تصادفی بودن خروجی را کنترل می‌کند. دمای نزدیک به صفر پاسخ‌هایی قطعی، خطی و رباتیک تولید می‌کند، در حالی که دمای بالاتر تنوع واژگان و خلاقیت را افزایش می‌دهد (اما ریسک خطا را نیز بالا می‌برد). (Temperature میزان تصادفی بودن انتخاب توکن‌ها را کنترل می‌کند.)

دمای پایین:

پاسخ‌های پایدارتر
قابل پیش‌بینی‌تر

دمای بالا:

خلاقیت بیشتر
تنوع بیشتر
احتمال افزایش خطا نیز بیشتر می‌شود.

۲۶. توهم (Hallucination)

پاشنه آشیل مدل‌های زبانی؛ زمانی که مدل با لحنی کاملاً مطمئن و قانع‌کننده، اطلاعاتی کاملاً غلط، ساختگی یا بی‌ربط را تولید می‌کند. (زمانی که مدل اطلاعات نادرست را با اطمینان بیان می‌کند.)

توهم یکی از مهم‌ترین چالش‌های LLMها است.

۲۷. اتصال به حقیقت (Grounding)

در این روش خروجی مدل به اطلاعات معتبر و قابل استناد محدود می‌شود. (مکانیزم محدود کردن خروجی مدل به منابع اطلاعاتی موثق و قابل استناد (مانند RAG). Grounding باعث می‌شود مدل از تولید محتوای خارج از چارچوب مستندات داده شده خودداری کند و توهم کاهش یابد.)

Grounding احتمال Hallucination را کاهش می‌دهد.

۲۸. محدودکننده‌ها (Guardrails)

قوانین و کنترل‌هایی که از تولید پاسخ‌های خطرناک، غیراخلاقی یا نامناسب جلوگیری می‌کنند. (لایه‌های امنیتی و قوانینی که روی ورودی و خروجی مدل اعمال می‌شوند تا از تولید محتوای توهین‌آمیز، خطرناک، افشای اطلاعات حساس یا نقض قوانین جلوگیری کنند.)

۲۹. تأخیر (Latency)

مدت زمانی که از ارسال درخواست تا دریافت پاسخ طول می‌کشد. (مدت زمان مکث از لحظه فشردن دکمه ارسال پرامپت تا ظاهر شدن اولین توکن‌های پاسخ (یا کل پاسخ). این شاخص به ترافیک شبکه، اندازه مدل و قدرت پردازنده (GPU) بستگی دارد.)

Latency به عوامل مختلفی وابسته است، از جمله:

اندازه مدل
تعداد توکن‌ها
سخت‌افزار
شبکه

۳۰. عامل هوشمند (Agent)

تکامل‌یافته‌ترین سطح استفاده از LLMها. عامل هوشمند فقط متن تولید نمی‌کند؛ بلکه می‌تواند برنامه‌ریزی کند، از ابزارهای خارجی (مانند ماشین‌حساب، جستجوگر وب یا APIها) استفاده کند، اطلاعات به دست آورد و یک فرآیند چندمرحله‌ای را به طور خودکار تا رسیدن به هدف پیش ببرد.

عامل هوشمند فقط پاسخ تولید نمی‌کند.

بلکه می‌تواند:

برنامه‌ریزی کند.
ابزارها را فراخوانی کند.
اطلاعات جمع‌آوری کند.
تصمیم بگیرد.
چند مرحله را به صورت خودکار اجرا کند.

به همین دلیل، Agentها نسل بعدی کاربردهای هوش مصنوعی محسوب می‌شوند.

ارتباط این مفاهیم با یکدیگر

نگاهی به جریان کار یک سیستم هوش مصنوعی

درک این ۳۰ مفهوم زمانی ارزش پیدا می‌کند که متوجه شویم این‌ها جزایر جداگانه نیستند. فرآیند زیر، چرخه حیات یک درخواست در سامانه‌های مدرن مبتنی بر LLM (مانند یک دستیار سازمانی) را نشان می‌دهد:

User Prompt: کاربر سؤالی را ارسال می‌کند.
System Prompt: دستورات امنیتی و شخصیتی سیستم به درخواست الحاق می‌شود.
Tokenization & Embeddings: متن به اعداد و بردارهای معنایی تبدیل می‌شود.
Vector Search & RAG (اختیاری): اطلاعات کمکی از پایگاه داده بازیابی و به پرامپت افزوده می‌شود.
Inference: مدل با استفاده از دانش و پارامترهای خود، پردازش را آغاز می‌کند.
Grounding & Guardrails: خروجیِ در حال تولید از فیلترهای صحت‌سنجی و ایمنی عبور می‌کند.
Final Response: پاسخ نهایی در اختیار کاربر قرار می‌گیرد.

اگر بخواهیم کل فرآیند را به زبان ساده خلاصه کنیم، مسیر زیر را خواهیم داشت:

کاربر
        ↓
User Prompt
        ↓
System Prompt
        ↓
Tokenization
        ↓
Embeddings
        ↓
Inference
        ↓
در صورت نیاز:
Vector Search
        ↓
RAG
        ↓
Grounding
        ↓
Guardrails
        ↓
پاسخ نهایی

این زنجیره نشان می‌دهد که مفاهیم معرفی‌شده، اجزای جداگانه نیستند؛ بلکه هر کدام حلقه‌ای از فرآیند تولید پاسخ توسط یک مدل زبانی بزرگ را تشکیل می‌دهند.

مفاهیم مهمی که فراتر از این ۳۰ اصطلاح هستند

اگر قصد دارید به یک مهندس یا معمار ارشد هوش مصنوعی تبدیل شوید، نقشه راه یادگیری شما به اینجا ختم نمی‌شود. پس از تسلط روی واژگان بالا، توصیه می‌کنیم در سایت هوش مصنوعی سیمرغ مفاهیم زیر را دنبال کنید:

مهندسی زمینه (Context Engineering)
فراخوانی ابزارها (Tool Calling)
پروتکل زمینه مدل (MCP – Model Context Protocol)
مدیریت حافظه بلندمدت عامل‌ها (Long-term Memory)
مدل‌های استدلالی (Reasoning Models)
معماری ترکیب خبرگان (MoE – Mixture of Experts)
مفهوم KV Cache برای بهینه‌سازی سرعت
تکنیک‌های ارزیابی مدل‌ها (LLM Evaluation)
سیستم‌های چندعاملی (Multi-Agent Systems)

این مفاهیم نسل جدید کاربردهای هوش مصنوعی را شکل می‌دهند و در بسیاری از محصولات پیشرفته، نقشی اساسی دارند.

جمع‌بندی

مدل‌های زبانی بزرگ صرفاً ابزار تولید متن نیستند، بلکه سامانه‌هایی پیچیده با لایه‌های متعدد از آموزش، استنتاج، بازیابی دانش و کنترل خروجی هستند. درک مفاهیمی مانند Tokenization، Embeddings، RLHF، RAG، Context Window و Guardrails به شما کمک می‌کند از یک کاربر عادی به فردی تبدیل شوید که می‌تواند رفتار مدل را تحلیل، بهینه‌سازی و در پروژه‌های واقعی از آن استفاده کند.

اگر در مسیر یادگیری یا توسعه راهکارهای مبتنی بر هوش مصنوعی هستید، این ۳۰ مفهوم را نه به‌عنوان فهرستی از اصطلاحات، بلکه به‌عنوان واژگان پایه یک زبان جدید در نظر بگیرید؛ زبانی که امروز بخش مهمی از آینده مهندسی نرم‌افزار، اتوماسیون و تعامل انسان با ماشین را شکل می‌دهد.