شروعی ساده اما عمیق بر یادگیری ماشین

0

شروعی ساده اما عمیق بر یادگیری ماشین: مقدمه‌ای جامع به یادگیری ماشین

فهرست دسترسی سریع

فصل اول: مقدمه‌ای بر یادگیری ماشین

۱. تعریف یادگیری ماشین

اصطلاح «یادگیری ماشین» نخستین بار در سال ۱۹۵۹ توسط آرتور ساموئل، یکی از پیشگامان آمریکایی در حوزه بازی‌های رایانه‌ای و هوش مصنوعی در شرکت IBM، مطرح شد. او یادگیری ماشین را چنین تعریف کرد:

«زمینه‌ای از مطالعه که به کامپیوترها توانایی یادگیری بدون برنامه‌نویسی صریح را می‌دهد.»

با این حال، تعریف یکتایی که به‌طور جهانی مورد توافق باشد برای این اصطلاح وجود ندارد. در منابع مختلف، تعریف‌های متفاوتی ارائه شده‌اند. دو تعریف دیگر به شرح زیر است:

  1. یادگیری ماشین، برنامه‌نویسی رایانه‌ها به‌منظور بهینه‌سازی یک معیار عملکرد با استفاده از داده‌های نمونه یا تجربه‌های گذشته است. در این زمینه، یک مدل تعریف‌شده (تا حدی با پارامترهایی مشخص) وجود دارد و یادگیری، اجرای یک برنامه رایانه‌ای برای بهینه‌سازی این پارامترها بر اساس داده‌های آموزشی یا تجربیات پیشین است. این مدل می‌تواند برای پیش‌بینی در آینده (مدل پیش‌بین) یا کسب دانش از داده‌ها (مدل توصیفی) یا هر دو به کار رود.
  2. یادگیری ماشین، حوزه‌ای از مطالعه است که به چگونگی ساخت برنامه‌هایی می‌پردازد که به‌صورت خودکار با تجربه بهبود می‌یابند.

در تمام این تعاریف، مفهوم «مدل» نقش کلیدی ایفا می‌کند. این واژه به‌طور کلی می‌تواند به ساختارهای ریاضی مانند معادلات، نمودارها، درخت‌ها، یا حتی قواعد منطقی نظیر «اگر… آنگاه…» اشاره داشته باشد.


تعریف مفهوم «یادگیری» در یادگیری ماشین

فرآیند یادگیری در یک برنامه رایانه‌ای، زمانی محقق می‌شود که برنامه از تجربه (E) در ارتباط با مجموعه‌ای از وظایف (T) و معیار عملکردی (P) بهره گیرد، و عملکردش در انجام وظایف T، طبق معیار P، با افزایش تجربه E بهبود یابد.

به‌بیان دیگر، یک برنامه یادگیرنده یا برنامه یادگیری ماشین، برنامه‌ای است که از طریق داده یا تجربه قبلی می‌آموزد و عملکرد خود را در وظایف معین بهبود می‌بخشد.


مثال‌هایی از مسائل یادگیری

برای درک بهتر مفهوم یادگیری در عمل، چند مثال از مسائل یادگیری در حوزه‌های مختلف ارائه می‌شود:

  1. شناسایی دست‌خط:
    • وظیفه (T): شناسایی و طبقه‌بندی کلمات دست‌نویس درون تصاویر
    • معیار عملکرد (P): درصد کلمات به‌درستی طبقه‌بندی‌شده
    • تجربه آموزشی (E): مجموعه‌ای از کلمات دست‌نویس با برچسب‌های طبقه‌بندی‌شده
  2. رانندگی با ربات:
    • وظیفه (T): رانندگی در بزرگراه‌ها با استفاده از حسگرهای تصویری
    • معیار عملکرد (P): میانگین مسافت طی‌شده بدون خطا
    • تجربه آموزشی (E): دنباله‌ای از تصاویر و فرمان‌های فرمان‌پذیری هنگام مشاهده راننده انسانی
  3. بازی شطرنج:
    • وظیفه (T): انجام بازی شطرنج
    • معیار عملکرد (P): درصد بازی‌های برنده در برابر رقبا
    • تجربه آموزشی (E): انجام بازی‌های تمرینی با خودش

فصل دوم: فرایند یادگیری در ماشین‌ها

اجزای اصلی فرایند یادگیری

فرآیند یادگیری – چه برای انسان و چه برای ماشین – را می‌توان به چهار مؤلفه‌ی اصلی تقسیم کرد:

  1. ذخیره‌سازی داده‌ها (Data Storage)
  2. انتزاع (Abstraction)
  3. تعمیم (Generalization)
  4. ارزیابی (Evaluation)

این مؤلفه‌ها به‌صورت یک جریان پیوسته در یادگیری ماشین عمل می‌کنند که در آن داده‌های خام به دانش قابل استفاده برای تصمیم‌گیری‌های آینده تبدیل می‌شوند.


۲.۱. ذخیره‌سازی داده

اولین گام در فرآیند یادگیری، ذخیره‌سازی و بازیابی داده‌هاست. در انسان‌ها، داده در مغز ذخیره می‌شود و از طریق سیگنال‌های الکتروشیمیایی بازیابی می‌گردد. در رایانه‌ها، دستگاه‌هایی نظیر حافظه‌های فلش، دیسک‌های سخت، و حافظه‌های دسترسی تصادفی (RAM) برای این منظور به کار می‌روند.


۲.۲. انتزاع

انتزاع فرایندی است که طی آن، دانش از داده‌های ذخیره‌شده استخراج می‌شود. این شامل ساخت مفاهیم کلی از مجموعه‌ای از داده‌هاست. به‌عبارت دیگر، مدل‌هایی (از قبل شناخته‌شده یا جدید) بر روی داده‌ها اعمال شده و دانش انتزاعی حاصل می‌شود.

در این مرحله، فرایند آموزش (Training) مدل انجام می‌شود؛ به‌گونه‌ای که داده‌ها به شکلی خلاصه‌شده و نمایشی انتزاعی تبدیل می‌گردند که اطلاعات اصلی را در قالبی فشرده‌تر حفظ می‌کند.


۲.۳. تعمیم

در مرحله‌ی تعمیم، دانش انتزاع‌شده به نحوی تبدیل می‌شود که در موقعیت‌های جدید و مشابه قابل استفاده باشد. هدف این است که ویژگی‌هایی از داده‌ها استخراج شوند که بیشترین اهمیت را برای وظایف آینده داشته باشند. این مرحله همان چیزی است که به یادگیرنده اجازه می‌دهد نه‌تنها آنچه دیده است، بلکه نمونه‌های جدید را نیز تحلیل کند.


۲.۴. ارزیابی

ارزیابی آخرین مؤلفه از فرایند یادگیری است. در این مرحله، عملکرد دانش کسب‌شده بررسی شده و بازخورد ارائه می‌شود. این بازخورد در راستای بهبود کیفیت فرآیند یادگیری در دفعات بعد به کار می‌رود. در واقع، ارزیابی به ما می‌گوید آیا آنچه آموخته‌ایم در عمل مفید است یا خیر.

فصل سوم: کاربردهای یادگیری ماشین

یکی از مهم‌ترین دلایل توسعه گسترده یادگیری ماشین، کاربردهای گسترده و متنوع آن در حوزه‌های مختلف علوم و صنایع است. یادگیری ماشین، با تکیه بر پردازش حجم عظیمی از داده‌ها و یافتن الگوهای پنهان در آن‌ها، به ابزاری قدرتمند برای حل مسائل پیچیده تبدیل شده است. در ادامه، برخی از کاربردهای برجسته این حوزه بیان می‌شود:

۳.۱. در تجارت خُرد (Retail)

در حوزه خرده‌فروشی، یادگیری ماشین برای تحلیل رفتار مصرف‌کنندگان مورد استفاده قرار می‌گیرد. از طریق بررسی داده‌های خرید، علاقه‌مندی‌ها، و الگوهای مصرف مشتریان، سیستم‌های هوشمند قادر به ارائه پیشنهادهای شخصی‌سازی‌شده، مدیریت موجودی انبار، و پیش‌بینی تقاضا هستند.

۳.۲. در امور مالی و بانکداری

بانک‌ها و مؤسسات مالی با استفاده از داده‌های گذشته، مدل‌هایی می‌سازند که در زمینه‌هایی چون بررسی اعتبار مشتریان (credit scoring)، شناسایی تقلب (fraud detection) و تحلیل بازار سهام به کار می‌روند. یادگیری ماشین به آن‌ها کمک می‌کند تا تصمیم‌گیری‌های مالی را هوشمندتر و دقیق‌تر انجام دهند.

۳.۳. در صنعت و تولید

در صنایع تولیدی، مدل‌های یادگیری ماشین برای بهینه‌سازی فرآیندها، کنترل کیفیت، عیب‌یابی خودکار و پیش‌بینی نیازهای تعمیر و نگهداری به کار می‌روند. این موضوع منجر به کاهش هزینه‌ها و افزایش بهره‌وری می‌شود.

۳.۴. در پزشکی

در حوزه سلامت و پزشکی، برنامه‌های یادگیری ماشین در زمینه تشخیص بیماری‌ها، تحلیل تصاویر پزشکی، پیش‌بینی خطرات پزشکی و پشتیبانی در تصمیم‌گیری بالینی مورد استفاده قرار می‌گیرند. این مدل‌ها با تحلیل سوابق پزشکی و نتایج آزمایشات، می‌توانند تشخیص دقیق‌تری ارائه دهند.

۳.۵. در مخابرات

در صنعت مخابرات، یادگیری ماشین برای تحلیل الگوهای تماس کاربران، بهینه‌سازی شبکه‌های ارتباطی، و افزایش کیفیت خدمات به کار می‌رود. این روش‌ها به شرکت‌ها کمک می‌کند تا ظرفیت شبکه را بهینه کنند و تجربه مشتری را بهبود دهند.

۳.۶. در علوم پایه

در حوزه‌هایی مانند فیزیک، نجوم و زیست‌شناسی، حجم داده‌های تولیدی بسیار بالا و پیچیده است. تنها با استفاده از الگوریتم‌های یادگیری ماشین می‌توان این داده‌ها را به‌سرعت تحلیل و پردازش کرد. همچنین، جستجو و استخراج اطلاعات از وب نیز به‌تنهایی و به‌صورت دستی غیرممکن است و نیاز به ابزارهای هوشمند دارد.

۳.۷. در هوش مصنوعی

یادگیری ماشین به‌عنوان یکی از شاخه‌های اصلی هوش مصنوعی، برای آموزش سیستم‌ها به‌منظور یادگیری و سازگاری با تغییرات استفاده می‌شود. در این روش، نیاز نیست طراح سیستم تمام موقعیت‌های ممکن را پیش‌بینی و برای آن‌ها راه‌حل ارائه کند؛ بلکه سیستم به‌مرور با محیط تعامل می‌کند و رفتار خود را بهینه می‌سازد.

۳.۸. در بینایی ماشین، گفتار و رباتیک

مسائلی مانند بینایی ماشین (computer vision)، تشخیص گفتار (speech recognition) و کنترل ربات‌ها به‌طور گسترده از روش‌های یادگیری ماشین بهره می‌برند. مدل‌های یادگیرنده می‌توانند الگوهای پیچیده موجود در تصاویر یا صداها را تشخیص دهند و بر اساس آن عمل کنند.

۳.۹. در خودروهای خودران

در طراحی خودروهای بدون راننده، الگوریتم‌های یادگیری ماشین نقش محوری ایفا می‌کنند. این الگوریتم‌ها با تحلیل داده‌های حسگرها و تصاویر محیط، تصمیمات رانندگی مانند فرمان دادن، توقف، و تغییر مسیر را به‌صورت خودکار انجام می‌دهند.

۳.۱۰. در طراحی برنامه‌های بازی

الگوریتم‌های یادگیری ماشین در توسعه برنامه‌هایی به‌کار رفته‌اند که قادر به انجام بازی‌هایی چون شطرنج، تخته‌نرد، و گو (Go) با عملکردی در سطح یا حتی بالاتر از انسان هستند. این مدل‌ها از طریق تجربه مداوم و تحلیل حرکات، مهارت خود را افزایش می‌دهند.


فصل چهارم: درک داده‌ها در یادگیری ماشین

در فرآیند یادگیری ماشین، داده‌ها نقش اساسی دارند. در این فصل به مفاهیم پایه‌ای مرتبط با داده، ساختار آن‌ها، و انواع مختلف داده که در یادگیری ماشین مورد استفاده قرار می‌گیرند، پرداخته می‌شود.


واحد مشاهده (Unit of Observation)

«واحد مشاهده» کوچک‌ترین موجودیت دارای ویژگی‌های اندازه‌گیری‌شده در یک مطالعه است. این واحد می‌تواند شامل موارد زیر باشد:

  • یک فرد، شیء یا موجود
  • یک نقطه زمانی
  • یک منطقه جغرافیایی
  • یک مقدار اندازه‌گیری‌شده

در برخی موارد، واحدهای مشاهده ترکیب شده و مفاهیمی مانند «نفر-سال» ایجاد می‌شوند.


مثال‌ها (Examples) و ویژگی‌ها (Features)

داده‌ها در یادگیری ماشین معمولاً به‌صورت مجموعه‌ای از مثال‌ها (examples) و ویژگی‌ها (features) نمایش داده می‌شوند:

  • مثال (example): یک نمونه از واحد مشاهده است که مقادیر ویژگی‌های مختلف برای آن ثبت شده‌اند. این واژه در متون دیگر به‌صورت «مورد»، «رکورد» یا «نمونه» نیز بیان می‌شود.
  • ویژگی (feature): خاصیتی اندازه‌گیری‌شده از هر مثال است. این واژه معادل با «متغیر»، «ویژگی» یا «صفت» نیز استفاده می‌شود.

مثال‌هایی از کاربرد این مفاهیم:

  1. تشخیص سرطان:
    • واحد مشاهده: بیمار
    • مثال‌ها: نمونه‌ای از بیماران
    • ویژگی‌ها: جنسیت، سن، فشار خون، نتایج گزارش آسیب‌شناسی (biopsy)
  2. انتخاب حیوان خانگی:
    • واحد مشاهده: فرد
    • مثال‌ها: افرادی که حیوان خانگی دارند
    • ویژگی‌ها: سن، منطقه سکونت، درآمد خانوار
  3. شناسایی ایمیل‌های اسپم:
    • واحد مشاهده: یک ایمیل
    • مثال‌ها: پیام‌های مشخص
    • ویژگی‌ها: کلمات موجود در متن ایمیل

نمایش ماتریسی داده‌ها

داده‌های یادگیری ماشین معمولاً در قالب ماتریس نمایش داده می‌شوند. در این ساختار، سطرها بیانگر مثال‌ها و ستون‌ها بیانگر ویژگی‌ها هستند. این نمایش باعث می‌شود پردازش و تحلیل داده‌ها به‌صورت ساختاریافته و الگوریتمی آسان‌تر انجام شود.


انواع داده‌ها

ویژگی‌های داده ممکن است در انواع مختلفی طبقه‌بندی شوند که شامل موارد زیر است:

  1. عددی (Numeric):
    ویژگی‌هایی که به‌صورت عددی و قابل اندازه‌گیری هستند. مانند: سال تولید، قیمت، مسافت طی‌شده.
  2. اسمی (Categorical یا Nominal):
    ویژگی‌هایی که شامل مجموعه‌ای محدود از مقادیر گسسته هستند و هیچ‌گونه ترتیب خاصی ندارند. مانند: رنگ خودرو، مدل، نوع گیربکس.
  3. ترتیبی (Ordinal):
    ویژگی‌هایی که دارای سطوح کیفی مرتب‌شده هستند. مانند: اندازه لباس (کوچک، متوسط، بزرگ)، یا سطح رضایت مشتری از «اصلاً راضی نیستم» تا «کاملاً راضی‌ام».

مثال کاربردی:

در مجموعه‌داده‌ای مربوط به خودروها، ویژگی‌های زیر می‌توانند مشاهده شوند:

  • «سال»، «قیمت»، «کارکرد» → ویژگی‌های عددی
  • «مدل»، «رنگ»، «گیربکس» → ویژگی‌های اسمی

فصل پنجم: انواع مسائل یادگیری ماشین

یادگیری ماشین با مسائل گوناگونی مواجه است که بر اساس نوع داده، نوع خروجی مورد انتظار، و ساختار مسأله می‌توان آن‌ها را به دسته‌های مختلفی تقسیم کرد. در این فصل، سه دسته‌ی اصلی از مسائل یادگیری ماشین بررسی می‌شوند: یادگیری روابط (قوانین انجمنی)، طبقه‌بندی، و رگرسیون. هرکدام از این دسته‌ها، کاربردها، الگوریتم‌ها و مفاهیم خاص خود را دارند.


۵.۱ یادگیری روابط (Association Rule Learning)

تعریف قوانین انجمنی

یادگیری قوانین انجمنی، یکی از روش‌های یادگیری ماشین برای کشف روابط جالب و معنادار میان متغیرها در پایگاه‌های داده بزرگ است. این روش با استفاده از معیارهایی برای سنجش «جذابیت» یا «همبستگی»، قوانینی از نوع:

اگر X، آنگاه احتمالاً Y

را استخراج می‌کند.

نمونه کاربردهای واقعی

در یک فروشگاه زنجیره‌ای، مدیریت ممکن است علاقه‌مند باشد بداند آیا در رفتار خرید مشتریان الگوهایی تکرارشونده وجود دارد. به‌عنوان مثال:

«اگر مشتری پیاز و سیب‌زمینی بخرد، احتمال زیادی وجود دارد که همبرگر نیز بخرد.»

این الگو به‌صورت قاعده‌ی زیر نمایش داده می‌شود:

{پیاز، سیب‌زمینی} ⟹ {همبرگر}

احتمال شرطی مرتبط با این قاعده به‌صورت:

P(همبرگر | پیاز، سیب‌زمینی)

محاسبه می‌شود. اگر این احتمال مثلاً برابر ۰٫۸ باشد، می‌توان گفت:

«۸۰٪ مشتریانی که پیاز و سیب‌زمینی می‌خرند، همبرگر نیز خریداری می‌کنند.»

کاربرد عملی

چنین قواعدی در بازاریابی هدفمند، قیمت‌گذاری تبلیغاتی، و چیدمان محصولات در فروشگاه‌ها استفاده می‌شوند. مشتریانی که X را خریده‌اند اما Y را نه، مشتریان بالقوه برای Y محسوب می‌شوند.

الگوریتم‌های معروف استخراج قوانین انجمنی

  1. الگوریتم Apriori
    یکی از معروف‌ترین الگوریتم‌ها برای کشف قوانین انجمنی با استفاده از فراوانی مجموعه‌اقلام.
  2. الگوریتم Eclat
    الگوریتمی مبتنی بر درخت مجموعه‌اقلام و ساختارهای فشرده‌سازی داده برای استخراج سریع‌تر قوانین.
  3. الگوریتم FP-Growth (الگوی پرتکرار)
    الگوریتمی بسیار کارآمد برای کشف مجموعه‌اقلام پرتکرار بدون نیاز به تولید مجموعه‌های کاندید متعدد.

۵.۲ طبقه‌بندی (Classification)

تعریف

طبقه‌بندی در یادگیری ماشین به مسأله‌ای گفته می‌شود که هدف آن تعیین دسته یا برچسب مناسب برای یک مشاهده جدید است، بر اساس داده‌های آموزشی که شامل نمونه‌هایی با برچسب‌های مشخص هستند.

مثال عددی و نموداری

جدول زیر مجموعه‌ای از داده‌های آموزشی است:

نمره ۱نمره ۲نتیجه
۲۹۴۳قبول
۲۲۲۹مردود
۱۰۴۷مردود
۳۱۵۵قبول

هدف: اگر نمره‌ی جدیدی با مقادیر «نمره ۱ = ۲۵» و «نمره ۲ = ۳۶» دریافت شود، مشخص شود که این نمونه در دسته‌ی «قبول» قرار می‌گیرد یا «مردود».

این مسأله با استفاده از مدل‌هایی که از داده‌ی آموزشی آموخته‌اند، حل می‌شود. در شکل زیر (از فایل)، نمونه‌های «قبول» با دایره توپر و «مردود» با دایره توخالی نمایش داده شده‌اند و نقطه علامت سؤال نشان‌دهنده نمونه جدید است.


کاربردهای واقعی در مسائل طبقه‌بندی

  1. تشخیص نویسه (OCR):
    شناسایی کاراکترها از روی تصویر؛ چالش‌برانگیز در حالت دست‌نویس.
  2. شناسایی چهره:
    ورودی تصویر چهره و هدف تعیین هویت فرد از میان افراد مختلف.
  3. شناسایی گفتار:
    ورودی صوتی و هدف، تبدیل گفتار به کلمات مشخص.
  4. تشخیص بیماری:
    اطلاعات ورودی شامل سن، سابقه پزشکی، علائم و هدف تعیین بیماری.
  5. استخراج دانش:
    قواعد طبقه‌بندی به‌عنوان مدل‌های ساده‌ای برای توضیح داده‌ها.
  6. فشرده‌سازی داده:
    مدل طبقه‌بندی به‌عنوان خلاصه‌ای از داده‌های بزرگ با نیاز حافظه کمتر.
  7. سایر مثال‌ها:
    • اولویت‌بندی بیماران برای ICU (طبقه‌بندی کم‌ریسک و پرریسک)
    • ارزیابی اعتبار مشتریان کارت اعتباری
    • دسته‌بندی اجرام نجومی مانند ستاره، کهکشان، سحابی

مفهوم تمایزبخش (Discriminant)

تمایزبخش، تابع یا قاعده‌ای است که وظیفه دارد برای یک مشاهده جدید، برچسب مناسب را اختصاص دهد. به‌عنوان مثال:

  • قاعده‌ای ساده:
    اگر نمره ۱ + نمره ۲ ≥ ۶۰ آنگاه «قبول» وگرنه «مردود»
  • قاعده مالی:
    اگر درآمد سالانه > θ₁ و پس‌انداز > θ₂ آنگاه «کم‌ریسک» وگرنه «پرریسک»
  • یا حتی قاعده‌ی خطی:
    f(x₁, x₂) = x₂ – ۰٫۲x₁
    اگر f > ۰ آنگاه «کم‌ریسک»، وگرنه «پرریسک»

الگوریتم‌های طبقه‌بندی

  1. رگرسیون لجستیک (Logistic Regression)
  2. بیز ساده (Naive Bayes)
  3. نزدیک‌ترین همسایه (k-NN)
  4. درخت تصمیم (Decision Tree)
  5. ماشین بردار پشتیبان (SVM)
  6. جنگل تصادفی (Random Forest)

نکات تکمیلی در طبقه‌بندی

  • طبقه‌بندی دودویی: فقط دو دسته (مثلاً سالم / بیمار)
  • طبقه‌بندی چندکلاسه: بیش از دو دسته (مثلاً ستاره / کهکشان / سحابی)
  • طبقه‌بندی چندبرچسبی: یک نمونه ممکن است به چند دسته تعلق داشته باشد.

۵.۳ رگرسیون (Regression)

تعریف و مفهوم کلی

در مسائل رگرسیون، هدف پیش‌بینی مقدار عددی یک متغیر خروجی بر اساس متغیرهای ورودی است. این خروجی می‌تواند عدد صحیح یا اعشاری باشد و اغلب بیانگر یک کمیت مانند قیمت، اندازه، وزن و… است.

مثال عددی برای پیش‌بینی قیمت خودرو

جدول زیر داده‌هایی درباره قیمت خودروهای دست‌دوم را نشان می‌دهد:

قیمت (دلار)سن (سال)مسافت طی‌شده (کیلومتر)وزن (پوند)
۱۳۵۰۰۲۳۴۶۹۸۶۱۱۶۵
۱۳۷۵۰۲۳۷۲۹۳۷۱۱۶۵

فرض: تخمین قیمت خودرویی با سن ۲۵ سال، مسافت ۵۳۲۴۰ و وزن ۱۲۰۰ پوند

این یک مسأله رگرسیون است چرا که خروجی (قیمت) عددی و قابل پیش‌بینی است.


مدل ریاضی عمومی

رگرسیون اغلب به‌صورت رابطه‌ای ریاضی میان متغیرهای ورودی x و خروجی y نمایش داده می‌شود:

y = f(x, θ)

که در آن:

  • x: مجموعه متغیرهای ورودی
  • θ: پارامترهای مدل
  • y: خروجی پیش‌بینی‌شده

مثال:

Price = a₀ + a₁×Age + a₂×Distance + a₃×Weight


انواع روش‌های رگرسیون

  1. رگرسیون خطی ساده:
    فقط یک متغیر مستقل، رابطه به‌صورت y = a + bx
  2. رگرسیون خطی چندمتغیره:
    چندین متغیر مستقل، y = a₀ + a₁x₁ + a₂x₂ + … + aₙxₙ
  3. رگرسیون چندجمله‌ای (Polynomial Regression):
    مدل با توان‌های بالاتر از متغیر، مانند y = a₀ + a₁x + a₂x² + …
  4. رگرسیون لجستیک:
    اگرچه در ظاهر مشابه رگرسیون است، اما در مسائل طبقه‌بندی به‌کار می‌رود و خروجی آن احتمال تعلق به یک دسته (۰ یا ۱) است.

فصل ششم: انواع یادگیری در یادگیری ماشین

الگوریتم‌های یادگیری ماشین را می‌توان به‌طور کلی به سه دسته‌ی اصلی تقسیم کرد:

  1. یادگیری نظارت‌شده (Supervised Learning)
  2. یادگیری بدون نظارت (Unsupervised Learning)
  3. یادگیری تقویتی (Reinforcement Learning)

هر یک از این انواع، روش‌ها، ساختارها و کاربردهای خاص خود را دارند. در این فصل به توضیح کامل هر کدام می‌پردازیم.


۶.۱ یادگیری نظارت‌شده (Supervised Learning)

تعریف

یادگیری نظارت‌شده به وظیفه‌ای در یادگیری ماشین گفته می‌شود که در آن هدف، یادگیری یک تابع است که ورودی را به خروجی نگاشت می‌کند. در این روش، داده‌های آموزشی شامل زوج‌های ورودی-خروجی هستند، یعنی برای هر نمونه، مقدار خروجی (برچسب) نیز مشخص شده است.

الگوریتم یادگیرنده با تحلیل این زوج‌های ورودی-خروجی، تابعی را می‌سازد که بتواند برای داده‌های جدید نیز خروجی مناسب را پیش‌بینی کند. این تابع باید تا حد امکان دقیق و قابل تعمیم باشد.

هر دو مسأله طبقه‌بندی (Classification) و رگرسیون (Regression) از جمله مسائل یادگیری نظارت‌شده محسوب می‌شوند.

نمونه و نمودار

به‌عنوان نمونه، جدول زیر اطلاعات مربوط به بیمارانی را نمایش می‌دهد که وارد یک کلینیک شده‌اند:

جنسیتسنبرچسب (label)
M۴۸بیمار
M۶۷بیمار
F۵۳سالم
M۴۹سالم
F۳۴بیمار
M۲۱سالم

در این مثال، جنسیت و سن ویژگی‌های ورودی، و وضعیت سلامت (بیمار یا سالم) برچسب خروجی است. هدف یادگیری، ایجاد مدلی است که بتواند برای فردی جدید با مشخصات مشابه، پیش‌بینی کند که او سالم است یا بیمار.

شباهت به یادگیری با معلم

یادگیری نظارت‌شده از آن جهت این نام را گرفته است که روند یادگیری در آن شبیه به یادگیری با نظارت یک معلم است. در این حالت، ما پاسخ درست را برای نمونه‌ها می‌دانیم و الگوریتم با آزمون و خطا و با بازخورد گرفتن از داده‌های دارای پاسخ صحیح، به‌تدریج عملکرد خود را بهبود می‌دهد.

فرایند یادگیری تا زمانی ادامه می‌یابد که الگوریتم به سطح عملکرد قابل‌قبولی برسد.


۶.۲ یادگیری بدون نظارت (Unsupervised Learning)

تعریف

یادگیری بدون نظارت به الگوریتم‌هایی اطلاق می‌شود که فقط با داده‌های ورودی بدون برچسب خروجی کار می‌کنند. در این نوع یادگیری، هیچ اطلاعاتی درباره‌ی دسته یا مقدار مورد انتظار وجود ندارد. هدف، یافتن ساختارهای پنهان، الگوها، یا گروه‌بندی‌های معنادار در داده‌هاست.

در این روش، چون خروجی مشخصی نداریم، امکان سنجش مستقیم دقت ساختار خروجی نیز وجود ندارد.

کاربرد در خوشه‌بندی داده‌ها

خوشه‌بندی (Clustering) یکی از رایج‌ترین روش‌های یادگیری بدون نظارت است. در این روش، داده‌ها بر اساس شباهت به گروه‌هایی (خوشه‌هایی) تقسیم می‌شوند، بدون اینکه از قبل بدانیم این گروه‌ها چه هستند.

خوشه‌بندی اغلب برای تحلیل اکتشافی داده‌ها و کشف الگوهای پنهان در مجموعه‌های داده‌ی بزرگ استفاده می‌شود.

مثال بالینی

جدول زیر اطلاعات مربوط به تعدادی بیمار را بدون برچسب ارائه می‌دهد:

جنسیتسن
M۴۸
M۶۷
F۵۳
M۴۹
F۳۴
M۲۱

در این مثال، هیچ اطلاعاتی درباره‌ی «سلامت» یا «بیماری» بیماران وجود ندارد. هدف یادگیری بدون نظارت این است که مثلاً بتواند الگو یا گروه‌بندی خاصی میان بیماران بر اساس جنسیت و سن کشف کند، بدون دانستن نتیجه نهایی (مثلاً سالم یا بیمار بودن).


۶.۳ یادگیری تقویتی (Reinforcement Learning)

تعریف

یادگیری تقویتی به نوعی از یادگیری ماشین اطلاق می‌شود که در آن هدف، آموزش یک عامل (agent) برای انجام اقداماتی در محیط است، به‌گونه‌ای که میزان پاداش دریافتی در طول زمان بیشینه شود.

در این روش، عامل نه پاسخ درست را می‌داند، نه مستقیم بازخورد مثبت یا منفی برای هر اقدام دارد. بلکه با آزمون و خطا و با تجربه اثرات تصمیمات خود، یاد می‌گیرد که کدام اقدامات منجر به دریافت پاداش بیشتر در بلندمدت می‌شود.

در بسیاری از موارد، یک اقدام نه‌تنها پاداش آنی دارد بلکه وضعیت آینده را نیز تحت تأثیر قرار می‌دهد و بنابراین کل زنجیره پاداش‌ها در آینده را تغییر می‌دهد. این ویژگی، یادگیری تقویتی را از سایر انواع یادگیری متمایز می‌کند.

مثال واقعی

یک نمونه‌ی ملموس، آموزش یک سگ برای انجام یک حرکت جدید است:

  • ما نمی‌توانیم به سگ بگوییم دقیقاً چه کند، اما اگر رفتار درستی انجام دهد، به او پاداش می‌دهیم و اگر اشتباه کند، تنبیه.
  • سگ به‌مرور یاد می‌گیرد که چه رفتاری موجب دریافت پاداش می‌شود، بدون اینکه مستقیماً به او گفته شود.

به همین شکل، یادگیری تقویتی برای آموزش کامپیوترها نیز استفاده می‌شود، مانند:

  • بازی شطرنج یا تخته‌نرد
  • زمان‌بندی وظایف
  • کنترل حرکات اندام‌های رباتیک

تفاوت با یادگیری نظارت‌شده

یادگیری نظارت‌شده شامل داده‌های برچسب‌دار است؛ یعنی پاسخ صحیح برای هر ورودی از قبل مشخص شده و الگوریتم می‌کوشد آن پاسخ را یاد بگیرد. اما در یادگیری تقویتی:

  • پاسخ صحیح وجود ندارد.
  • الگوریتم باید با تجربه و با ارزیابی پیامد اقدامات خود یاد بگیرد که چه تصمیمی بهتر است.
  • پاداش‌ها ممکن است آنی یا با تأخیر باشند.
پایان مطلب “شروعی ساده اما عمیق بر یادگیری ماشین”.
Share.
Leave A Reply Cancel Reply
Exit mobile version