شروعی ساده اما عمیق بر یادگیری ماشین: مقدمهای جامع به یادگیری ماشین
اصطلاح «یادگیری ماشین» نخستین بار در سال ۱۹۵۹ توسط آرتور ساموئل، یکی از پیشگامان آمریکایی در حوزه بازیهای رایانهای و هوش مصنوعی در شرکت IBM، مطرح شد. او یادگیری ماشین را چنین تعریف کرد:
«زمینهای از مطالعه که به کامپیوترها توانایی یادگیری بدون برنامهنویسی صریح را میدهد.»
با این حال، تعریف یکتایی که بهطور جهانی مورد توافق باشد برای این اصطلاح وجود ندارد. در منابع مختلف، تعریفهای متفاوتی ارائه شدهاند. دو تعریف دیگر به شرح زیر است:
در تمام این تعاریف، مفهوم «مدل» نقش کلیدی ایفا میکند. این واژه بهطور کلی میتواند به ساختارهای ریاضی مانند معادلات، نمودارها، درختها، یا حتی قواعد منطقی نظیر «اگر… آنگاه…» اشاره داشته باشد.
فرآیند یادگیری در یک برنامه رایانهای، زمانی محقق میشود که برنامه از تجربه (E) در ارتباط با مجموعهای از وظایف (T) و معیار عملکردی (P) بهره گیرد، و عملکردش در انجام وظایف T، طبق معیار P، با افزایش تجربه E بهبود یابد.
بهبیان دیگر، یک برنامه یادگیرنده یا برنامه یادگیری ماشین، برنامهای است که از طریق داده یا تجربه قبلی میآموزد و عملکرد خود را در وظایف معین بهبود میبخشد.
مثالهایی از مسائل یادگیری
برای درک بهتر مفهوم یادگیری در عمل، چند مثال از مسائل یادگیری در حوزههای مختلف ارائه میشود:
فرآیند یادگیری – چه برای انسان و چه برای ماشین – را میتوان به چهار مؤلفهی اصلی تقسیم کرد:
این مؤلفهها بهصورت یک جریان پیوسته در یادگیری ماشین عمل میکنند که در آن دادههای خام به دانش قابل استفاده برای تصمیمگیریهای آینده تبدیل میشوند.
اولین گام در فرآیند یادگیری، ذخیرهسازی و بازیابی دادههاست. در انسانها، داده در مغز ذخیره میشود و از طریق سیگنالهای الکتروشیمیایی بازیابی میگردد. در رایانهها، دستگاههایی نظیر حافظههای فلش، دیسکهای سخت، و حافظههای دسترسی تصادفی (RAM) برای این منظور به کار میروند.
انتزاع فرایندی است که طی آن، دانش از دادههای ذخیرهشده استخراج میشود. این شامل ساخت مفاهیم کلی از مجموعهای از دادههاست. بهعبارت دیگر، مدلهایی (از قبل شناختهشده یا جدید) بر روی دادهها اعمال شده و دانش انتزاعی حاصل میشود.
در این مرحله، فرایند آموزش (Training) مدل انجام میشود؛ بهگونهای که دادهها به شکلی خلاصهشده و نمایشی انتزاعی تبدیل میگردند که اطلاعات اصلی را در قالبی فشردهتر حفظ میکند.
در مرحلهی تعمیم، دانش انتزاعشده به نحوی تبدیل میشود که در موقعیتهای جدید و مشابه قابل استفاده باشد. هدف این است که ویژگیهایی از دادهها استخراج شوند که بیشترین اهمیت را برای وظایف آینده داشته باشند. این مرحله همان چیزی است که به یادگیرنده اجازه میدهد نهتنها آنچه دیده است، بلکه نمونههای جدید را نیز تحلیل کند.
ارزیابی آخرین مؤلفه از فرایند یادگیری است. در این مرحله، عملکرد دانش کسبشده بررسی شده و بازخورد ارائه میشود. این بازخورد در راستای بهبود کیفیت فرآیند یادگیری در دفعات بعد به کار میرود. در واقع، ارزیابی به ما میگوید آیا آنچه آموختهایم در عمل مفید است یا خیر.
یکی از مهمترین دلایل توسعه گسترده یادگیری ماشین، کاربردهای گسترده و متنوع آن در حوزههای مختلف علوم و صنایع است. یادگیری ماشین، با تکیه بر پردازش حجم عظیمی از دادهها و یافتن الگوهای پنهان در آنها، به ابزاری قدرتمند برای حل مسائل پیچیده تبدیل شده است. در ادامه، برخی از کاربردهای برجسته این حوزه بیان میشود:
در حوزه خردهفروشی، یادگیری ماشین برای تحلیل رفتار مصرفکنندگان مورد استفاده قرار میگیرد. از طریق بررسی دادههای خرید، علاقهمندیها، و الگوهای مصرف مشتریان، سیستمهای هوشمند قادر به ارائه پیشنهادهای شخصیسازیشده، مدیریت موجودی انبار، و پیشبینی تقاضا هستند.
بانکها و مؤسسات مالی با استفاده از دادههای گذشته، مدلهایی میسازند که در زمینههایی چون بررسی اعتبار مشتریان (credit scoring)، شناسایی تقلب (fraud detection) و تحلیل بازار سهام به کار میروند. یادگیری ماشین به آنها کمک میکند تا تصمیمگیریهای مالی را هوشمندتر و دقیقتر انجام دهند.
در صنایع تولیدی، مدلهای یادگیری ماشین برای بهینهسازی فرآیندها، کنترل کیفیت، عیبیابی خودکار و پیشبینی نیازهای تعمیر و نگهداری به کار میروند. این موضوع منجر به کاهش هزینهها و افزایش بهرهوری میشود.
در حوزه سلامت و پزشکی، برنامههای یادگیری ماشین در زمینه تشخیص بیماریها، تحلیل تصاویر پزشکی، پیشبینی خطرات پزشکی و پشتیبانی در تصمیمگیری بالینی مورد استفاده قرار میگیرند. این مدلها با تحلیل سوابق پزشکی و نتایج آزمایشات، میتوانند تشخیص دقیقتری ارائه دهند.
در صنعت مخابرات، یادگیری ماشین برای تحلیل الگوهای تماس کاربران، بهینهسازی شبکههای ارتباطی، و افزایش کیفیت خدمات به کار میرود. این روشها به شرکتها کمک میکند تا ظرفیت شبکه را بهینه کنند و تجربه مشتری را بهبود دهند.
در حوزههایی مانند فیزیک، نجوم و زیستشناسی، حجم دادههای تولیدی بسیار بالا و پیچیده است. تنها با استفاده از الگوریتمهای یادگیری ماشین میتوان این دادهها را بهسرعت تحلیل و پردازش کرد. همچنین، جستجو و استخراج اطلاعات از وب نیز بهتنهایی و بهصورت دستی غیرممکن است و نیاز به ابزارهای هوشمند دارد.
یادگیری ماشین بهعنوان یکی از شاخههای اصلی هوش مصنوعی، برای آموزش سیستمها بهمنظور یادگیری و سازگاری با تغییرات استفاده میشود. در این روش، نیاز نیست طراح سیستم تمام موقعیتهای ممکن را پیشبینی و برای آنها راهحل ارائه کند؛ بلکه سیستم بهمرور با محیط تعامل میکند و رفتار خود را بهینه میسازد.
مسائلی مانند بینایی ماشین (computer vision)، تشخیص گفتار (speech recognition) و کنترل رباتها بهطور گسترده از روشهای یادگیری ماشین بهره میبرند. مدلهای یادگیرنده میتوانند الگوهای پیچیده موجود در تصاویر یا صداها را تشخیص دهند و بر اساس آن عمل کنند.
در طراحی خودروهای بدون راننده، الگوریتمهای یادگیری ماشین نقش محوری ایفا میکنند. این الگوریتمها با تحلیل دادههای حسگرها و تصاویر محیط، تصمیمات رانندگی مانند فرمان دادن، توقف، و تغییر مسیر را بهصورت خودکار انجام میدهند.
الگوریتمهای یادگیری ماشین در توسعه برنامههایی بهکار رفتهاند که قادر به انجام بازیهایی چون شطرنج، تختهنرد، و گو (Go) با عملکردی در سطح یا حتی بالاتر از انسان هستند. این مدلها از طریق تجربه مداوم و تحلیل حرکات، مهارت خود را افزایش میدهند.
در فرآیند یادگیری ماشین، دادهها نقش اساسی دارند. در این فصل به مفاهیم پایهای مرتبط با داده، ساختار آنها، و انواع مختلف داده که در یادگیری ماشین مورد استفاده قرار میگیرند، پرداخته میشود.
«واحد مشاهده» کوچکترین موجودیت دارای ویژگیهای اندازهگیریشده در یک مطالعه است. این واحد میتواند شامل موارد زیر باشد:
در برخی موارد، واحدهای مشاهده ترکیب شده و مفاهیمی مانند «نفر-سال» ایجاد میشوند.
دادهها در یادگیری ماشین معمولاً بهصورت مجموعهای از مثالها (examples) و ویژگیها (features) نمایش داده میشوند:
دادههای یادگیری ماشین معمولاً در قالب ماتریس نمایش داده میشوند. در این ساختار، سطرها بیانگر مثالها و ستونها بیانگر ویژگیها هستند. این نمایش باعث میشود پردازش و تحلیل دادهها بهصورت ساختاریافته و الگوریتمی آسانتر انجام شود.
ویژگیهای داده ممکن است در انواع مختلفی طبقهبندی شوند که شامل موارد زیر است:
در مجموعهدادهای مربوط به خودروها، ویژگیهای زیر میتوانند مشاهده شوند:
یادگیری ماشین با مسائل گوناگونی مواجه است که بر اساس نوع داده، نوع خروجی مورد انتظار، و ساختار مسأله میتوان آنها را به دستههای مختلفی تقسیم کرد. در این فصل، سه دستهی اصلی از مسائل یادگیری ماشین بررسی میشوند: یادگیری روابط (قوانین انجمنی)، طبقهبندی، و رگرسیون. هرکدام از این دستهها، کاربردها، الگوریتمها و مفاهیم خاص خود را دارند.
یادگیری قوانین انجمنی، یکی از روشهای یادگیری ماشین برای کشف روابط جالب و معنادار میان متغیرها در پایگاههای داده بزرگ است. این روش با استفاده از معیارهایی برای سنجش «جذابیت» یا «همبستگی»، قوانینی از نوع:
اگر X، آنگاه احتمالاً Y
را استخراج میکند.
در یک فروشگاه زنجیرهای، مدیریت ممکن است علاقهمند باشد بداند آیا در رفتار خرید مشتریان الگوهایی تکرارشونده وجود دارد. بهعنوان مثال:
«اگر مشتری پیاز و سیبزمینی بخرد، احتمال زیادی وجود دارد که همبرگر نیز بخرد.»
این الگو بهصورت قاعدهی زیر نمایش داده میشود:
{پیاز، سیبزمینی} ⟹ {همبرگر}
احتمال شرطی مرتبط با این قاعده بهصورت:
P(همبرگر | پیاز، سیبزمینی)
محاسبه میشود. اگر این احتمال مثلاً برابر ۰٫۸ باشد، میتوان گفت:
«۸۰٪ مشتریانی که پیاز و سیبزمینی میخرند، همبرگر نیز خریداری میکنند.»
چنین قواعدی در بازاریابی هدفمند، قیمتگذاری تبلیغاتی، و چیدمان محصولات در فروشگاهها استفاده میشوند. مشتریانی که X را خریدهاند اما Y را نه، مشتریان بالقوه برای Y محسوب میشوند.
طبقهبندی در یادگیری ماشین به مسألهای گفته میشود که هدف آن تعیین دسته یا برچسب مناسب برای یک مشاهده جدید است، بر اساس دادههای آموزشی که شامل نمونههایی با برچسبهای مشخص هستند.
جدول زیر مجموعهای از دادههای آموزشی است:
نمره ۱ | نمره ۲ | نتیجه |
۲۹ | ۴۳ | قبول |
۲۲ | ۲۹ | مردود |
۱۰ | ۴۷ | مردود |
۳۱ | ۵۵ | قبول |
هدف: اگر نمرهی جدیدی با مقادیر «نمره ۱ = ۲۵» و «نمره ۲ = ۳۶» دریافت شود، مشخص شود که این نمونه در دستهی «قبول» قرار میگیرد یا «مردود».
این مسأله با استفاده از مدلهایی که از دادهی آموزشی آموختهاند، حل میشود. در شکل زیر (از فایل)، نمونههای «قبول» با دایره توپر و «مردود» با دایره توخالی نمایش داده شدهاند و نقطه علامت سؤال نشاندهنده نمونه جدید است.
تمایزبخش، تابع یا قاعدهای است که وظیفه دارد برای یک مشاهده جدید، برچسب مناسب را اختصاص دهد. بهعنوان مثال:
در مسائل رگرسیون، هدف پیشبینی مقدار عددی یک متغیر خروجی بر اساس متغیرهای ورودی است. این خروجی میتواند عدد صحیح یا اعشاری باشد و اغلب بیانگر یک کمیت مانند قیمت، اندازه، وزن و… است.
جدول زیر دادههایی درباره قیمت خودروهای دستدوم را نشان میدهد:
قیمت (دلار) | سن (سال) | مسافت طیشده (کیلومتر) | وزن (پوند) |
۱۳۵۰۰ | ۲۳ | ۴۶۹۸۶ | ۱۱۶۵ |
۱۳۷۵۰ | ۲۳ | ۷۲۹۳۷ | ۱۱۶۵ |
… | … | … | … |
فرض: تخمین قیمت خودرویی با سن ۲۵ سال، مسافت ۵۳۲۴۰ و وزن ۱۲۰۰ پوند
این یک مسأله رگرسیون است چرا که خروجی (قیمت) عددی و قابل پیشبینی است.
رگرسیون اغلب بهصورت رابطهای ریاضی میان متغیرهای ورودی x و خروجی y نمایش داده میشود:
y = f(x, θ)
که در آن:
مثال:
Price = a₀ + a₁×Age + a₂×Distance + a₃×Weight
الگوریتمهای یادگیری ماشین را میتوان بهطور کلی به سه دستهی اصلی تقسیم کرد:
هر یک از این انواع، روشها، ساختارها و کاربردهای خاص خود را دارند. در این فصل به توضیح کامل هر کدام میپردازیم.
یادگیری نظارتشده به وظیفهای در یادگیری ماشین گفته میشود که در آن هدف، یادگیری یک تابع است که ورودی را به خروجی نگاشت میکند. در این روش، دادههای آموزشی شامل زوجهای ورودی-خروجی هستند، یعنی برای هر نمونه، مقدار خروجی (برچسب) نیز مشخص شده است.
الگوریتم یادگیرنده با تحلیل این زوجهای ورودی-خروجی، تابعی را میسازد که بتواند برای دادههای جدید نیز خروجی مناسب را پیشبینی کند. این تابع باید تا حد امکان دقیق و قابل تعمیم باشد.
هر دو مسأله طبقهبندی (Classification) و رگرسیون (Regression) از جمله مسائل یادگیری نظارتشده محسوب میشوند.
بهعنوان نمونه، جدول زیر اطلاعات مربوط به بیمارانی را نمایش میدهد که وارد یک کلینیک شدهاند:
جنسیت | سن | برچسب (label) |
M | ۴۸ | بیمار |
M | ۶۷ | بیمار |
F | ۵۳ | سالم |
M | ۴۹ | سالم |
F | ۳۴ | بیمار |
M | ۲۱ | سالم |
در این مثال، جنسیت و سن ویژگیهای ورودی، و وضعیت سلامت (بیمار یا سالم) برچسب خروجی است. هدف یادگیری، ایجاد مدلی است که بتواند برای فردی جدید با مشخصات مشابه، پیشبینی کند که او سالم است یا بیمار.
یادگیری نظارتشده از آن جهت این نام را گرفته است که روند یادگیری در آن شبیه به یادگیری با نظارت یک معلم است. در این حالت، ما پاسخ درست را برای نمونهها میدانیم و الگوریتم با آزمون و خطا و با بازخورد گرفتن از دادههای دارای پاسخ صحیح، بهتدریج عملکرد خود را بهبود میدهد.
فرایند یادگیری تا زمانی ادامه مییابد که الگوریتم به سطح عملکرد قابلقبولی برسد.
یادگیری بدون نظارت به الگوریتمهایی اطلاق میشود که فقط با دادههای ورودی بدون برچسب خروجی کار میکنند. در این نوع یادگیری، هیچ اطلاعاتی دربارهی دسته یا مقدار مورد انتظار وجود ندارد. هدف، یافتن ساختارهای پنهان، الگوها، یا گروهبندیهای معنادار در دادههاست.
در این روش، چون خروجی مشخصی نداریم، امکان سنجش مستقیم دقت ساختار خروجی نیز وجود ندارد.
خوشهبندی (Clustering) یکی از رایجترین روشهای یادگیری بدون نظارت است. در این روش، دادهها بر اساس شباهت به گروههایی (خوشههایی) تقسیم میشوند، بدون اینکه از قبل بدانیم این گروهها چه هستند.
خوشهبندی اغلب برای تحلیل اکتشافی دادهها و کشف الگوهای پنهان در مجموعههای دادهی بزرگ استفاده میشود.
جدول زیر اطلاعات مربوط به تعدادی بیمار را بدون برچسب ارائه میدهد:
جنسیت | سن |
M | ۴۸ |
M | ۶۷ |
F | ۵۳ |
M | ۴۹ |
F | ۳۴ |
M | ۲۱ |
در این مثال، هیچ اطلاعاتی دربارهی «سلامت» یا «بیماری» بیماران وجود ندارد. هدف یادگیری بدون نظارت این است که مثلاً بتواند الگو یا گروهبندی خاصی میان بیماران بر اساس جنسیت و سن کشف کند، بدون دانستن نتیجه نهایی (مثلاً سالم یا بیمار بودن).
یادگیری تقویتی به نوعی از یادگیری ماشین اطلاق میشود که در آن هدف، آموزش یک عامل (agent) برای انجام اقداماتی در محیط است، بهگونهای که میزان پاداش دریافتی در طول زمان بیشینه شود.
در این روش، عامل نه پاسخ درست را میداند، نه مستقیم بازخورد مثبت یا منفی برای هر اقدام دارد. بلکه با آزمون و خطا و با تجربه اثرات تصمیمات خود، یاد میگیرد که کدام اقدامات منجر به دریافت پاداش بیشتر در بلندمدت میشود.
در بسیاری از موارد، یک اقدام نهتنها پاداش آنی دارد بلکه وضعیت آینده را نیز تحت تأثیر قرار میدهد و بنابراین کل زنجیره پاداشها در آینده را تغییر میدهد. این ویژگی، یادگیری تقویتی را از سایر انواع یادگیری متمایز میکند.
یک نمونهی ملموس، آموزش یک سگ برای انجام یک حرکت جدید است:
به همین شکل، یادگیری تقویتی برای آموزش کامپیوترها نیز استفاده میشود، مانند:
یادگیری نظارتشده شامل دادههای برچسبدار است؛ یعنی پاسخ صحیح برای هر ورودی از قبل مشخص شده و الگوریتم میکوشد آن پاسخ را یاد بگیرد. اما در یادگیری تقویتی:
۱۰۰ فرد تأثیرگذار حوزه هوش مصنوعی از دید رسانه هوش مصنوعی سیمرغ هوش مصنوعی در…
ChatGPT Pulse آغازگر نسلی تازه از دستیارهای هوش مصنوعی است؛ این مدل از پاسخ به…
نقشه راه فریلنسرها برای تامین امنیت آینده شغلی در عصر هوش مصنوعی فهرست دسترسی سریعنقشه…
راهنمای راهاندازی مدل Grok 4 در Cursor با استفاده از xAI API مدلهای هوش مصنوعی…
مرورگرها مدتهاست فقط وسیلهای برای باز کردن وبسایتها بودهاند، اما حالا با معرفی مرورگر Genspark…
بهینهسازی پرامپتها در GPT-5 با استفاده از «Prompt Optimizer» با معرفی خانواده مدلهای GPT-5، اوپناِیآی…