شروعی ساده اما عمیق بر یادگیری ماشین: مقدمهای جامع به یادگیری ماشین
فهرست دسترسی سریع
فصل اول: مقدمهای بر یادگیری ماشین
۱. تعریف یادگیری ماشین
اصطلاح «یادگیری ماشین» نخستین بار در سال ۱۹۵۹ توسط آرتور ساموئل، یکی از پیشگامان آمریکایی در حوزه بازیهای رایانهای و هوش مصنوعی در شرکت IBM، مطرح شد. او یادگیری ماشین را چنین تعریف کرد:
«زمینهای از مطالعه که به کامپیوترها توانایی یادگیری بدون برنامهنویسی صریح را میدهد.»
با این حال، تعریف یکتایی که بهطور جهانی مورد توافق باشد برای این اصطلاح وجود ندارد. در منابع مختلف، تعریفهای متفاوتی ارائه شدهاند. دو تعریف دیگر به شرح زیر است:
- یادگیری ماشین، برنامهنویسی رایانهها بهمنظور بهینهسازی یک معیار عملکرد با استفاده از دادههای نمونه یا تجربههای گذشته است. در این زمینه، یک مدل تعریفشده (تا حدی با پارامترهایی مشخص) وجود دارد و یادگیری، اجرای یک برنامه رایانهای برای بهینهسازی این پارامترها بر اساس دادههای آموزشی یا تجربیات پیشین است. این مدل میتواند برای پیشبینی در آینده (مدل پیشبین) یا کسب دانش از دادهها (مدل توصیفی) یا هر دو به کار رود.
- یادگیری ماشین، حوزهای از مطالعه است که به چگونگی ساخت برنامههایی میپردازد که بهصورت خودکار با تجربه بهبود مییابند.
در تمام این تعاریف، مفهوم «مدل» نقش کلیدی ایفا میکند. این واژه بهطور کلی میتواند به ساختارهای ریاضی مانند معادلات، نمودارها، درختها، یا حتی قواعد منطقی نظیر «اگر… آنگاه…» اشاره داشته باشد.
تعریف مفهوم «یادگیری» در یادگیری ماشین
فرآیند یادگیری در یک برنامه رایانهای، زمانی محقق میشود که برنامه از تجربه (E) در ارتباط با مجموعهای از وظایف (T) و معیار عملکردی (P) بهره گیرد، و عملکردش در انجام وظایف T، طبق معیار P، با افزایش تجربه E بهبود یابد.
بهبیان دیگر، یک برنامه یادگیرنده یا برنامه یادگیری ماشین، برنامهای است که از طریق داده یا تجربه قبلی میآموزد و عملکرد خود را در وظایف معین بهبود میبخشد.
مثالهایی از مسائل یادگیری
برای درک بهتر مفهوم یادگیری در عمل، چند مثال از مسائل یادگیری در حوزههای مختلف ارائه میشود:
- شناسایی دستخط:
- وظیفه (T): شناسایی و طبقهبندی کلمات دستنویس درون تصاویر
- معیار عملکرد (P): درصد کلمات بهدرستی طبقهبندیشده
- تجربه آموزشی (E): مجموعهای از کلمات دستنویس با برچسبهای طبقهبندیشده
- رانندگی با ربات:
- وظیفه (T): رانندگی در بزرگراهها با استفاده از حسگرهای تصویری
- معیار عملکرد (P): میانگین مسافت طیشده بدون خطا
- تجربه آموزشی (E): دنبالهای از تصاویر و فرمانهای فرمانپذیری هنگام مشاهده راننده انسانی
- بازی شطرنج:
- وظیفه (T): انجام بازی شطرنج
- معیار عملکرد (P): درصد بازیهای برنده در برابر رقبا
- تجربه آموزشی (E): انجام بازیهای تمرینی با خودش
فصل دوم: فرایند یادگیری در ماشینها
اجزای اصلی فرایند یادگیری
فرآیند یادگیری – چه برای انسان و چه برای ماشین – را میتوان به چهار مؤلفهی اصلی تقسیم کرد:
- ذخیرهسازی دادهها (Data Storage)
- انتزاع (Abstraction)
- تعمیم (Generalization)
- ارزیابی (Evaluation)
این مؤلفهها بهصورت یک جریان پیوسته در یادگیری ماشین عمل میکنند که در آن دادههای خام به دانش قابل استفاده برای تصمیمگیریهای آینده تبدیل میشوند.
۲.۱. ذخیرهسازی داده
اولین گام در فرآیند یادگیری، ذخیرهسازی و بازیابی دادههاست. در انسانها، داده در مغز ذخیره میشود و از طریق سیگنالهای الکتروشیمیایی بازیابی میگردد. در رایانهها، دستگاههایی نظیر حافظههای فلش، دیسکهای سخت، و حافظههای دسترسی تصادفی (RAM) برای این منظور به کار میروند.
۲.۲. انتزاع
انتزاع فرایندی است که طی آن، دانش از دادههای ذخیرهشده استخراج میشود. این شامل ساخت مفاهیم کلی از مجموعهای از دادههاست. بهعبارت دیگر، مدلهایی (از قبل شناختهشده یا جدید) بر روی دادهها اعمال شده و دانش انتزاعی حاصل میشود.
در این مرحله، فرایند آموزش (Training) مدل انجام میشود؛ بهگونهای که دادهها به شکلی خلاصهشده و نمایشی انتزاعی تبدیل میگردند که اطلاعات اصلی را در قالبی فشردهتر حفظ میکند.
۲.۳. تعمیم
در مرحلهی تعمیم، دانش انتزاعشده به نحوی تبدیل میشود که در موقعیتهای جدید و مشابه قابل استفاده باشد. هدف این است که ویژگیهایی از دادهها استخراج شوند که بیشترین اهمیت را برای وظایف آینده داشته باشند. این مرحله همان چیزی است که به یادگیرنده اجازه میدهد نهتنها آنچه دیده است، بلکه نمونههای جدید را نیز تحلیل کند.
۲.۴. ارزیابی
ارزیابی آخرین مؤلفه از فرایند یادگیری است. در این مرحله، عملکرد دانش کسبشده بررسی شده و بازخورد ارائه میشود. این بازخورد در راستای بهبود کیفیت فرآیند یادگیری در دفعات بعد به کار میرود. در واقع، ارزیابی به ما میگوید آیا آنچه آموختهایم در عمل مفید است یا خیر.
فصل سوم: کاربردهای یادگیری ماشین
یکی از مهمترین دلایل توسعه گسترده یادگیری ماشین، کاربردهای گسترده و متنوع آن در حوزههای مختلف علوم و صنایع است. یادگیری ماشین، با تکیه بر پردازش حجم عظیمی از دادهها و یافتن الگوهای پنهان در آنها، به ابزاری قدرتمند برای حل مسائل پیچیده تبدیل شده است. در ادامه، برخی از کاربردهای برجسته این حوزه بیان میشود:
۳.۱. در تجارت خُرد (Retail)
در حوزه خردهفروشی، یادگیری ماشین برای تحلیل رفتار مصرفکنندگان مورد استفاده قرار میگیرد. از طریق بررسی دادههای خرید، علاقهمندیها، و الگوهای مصرف مشتریان، سیستمهای هوشمند قادر به ارائه پیشنهادهای شخصیسازیشده، مدیریت موجودی انبار، و پیشبینی تقاضا هستند.
۳.۲. در امور مالی و بانکداری
بانکها و مؤسسات مالی با استفاده از دادههای گذشته، مدلهایی میسازند که در زمینههایی چون بررسی اعتبار مشتریان (credit scoring)، شناسایی تقلب (fraud detection) و تحلیل بازار سهام به کار میروند. یادگیری ماشین به آنها کمک میکند تا تصمیمگیریهای مالی را هوشمندتر و دقیقتر انجام دهند.
۳.۳. در صنعت و تولید
در صنایع تولیدی، مدلهای یادگیری ماشین برای بهینهسازی فرآیندها، کنترل کیفیت، عیبیابی خودکار و پیشبینی نیازهای تعمیر و نگهداری به کار میروند. این موضوع منجر به کاهش هزینهها و افزایش بهرهوری میشود.
۳.۴. در پزشکی
در حوزه سلامت و پزشکی، برنامههای یادگیری ماشین در زمینه تشخیص بیماریها، تحلیل تصاویر پزشکی، پیشبینی خطرات پزشکی و پشتیبانی در تصمیمگیری بالینی مورد استفاده قرار میگیرند. این مدلها با تحلیل سوابق پزشکی و نتایج آزمایشات، میتوانند تشخیص دقیقتری ارائه دهند.
۳.۵. در مخابرات
در صنعت مخابرات، یادگیری ماشین برای تحلیل الگوهای تماس کاربران، بهینهسازی شبکههای ارتباطی، و افزایش کیفیت خدمات به کار میرود. این روشها به شرکتها کمک میکند تا ظرفیت شبکه را بهینه کنند و تجربه مشتری را بهبود دهند.
۳.۶. در علوم پایه
در حوزههایی مانند فیزیک، نجوم و زیستشناسی، حجم دادههای تولیدی بسیار بالا و پیچیده است. تنها با استفاده از الگوریتمهای یادگیری ماشین میتوان این دادهها را بهسرعت تحلیل و پردازش کرد. همچنین، جستجو و استخراج اطلاعات از وب نیز بهتنهایی و بهصورت دستی غیرممکن است و نیاز به ابزارهای هوشمند دارد.
۳.۷. در هوش مصنوعی
یادگیری ماشین بهعنوان یکی از شاخههای اصلی هوش مصنوعی، برای آموزش سیستمها بهمنظور یادگیری و سازگاری با تغییرات استفاده میشود. در این روش، نیاز نیست طراح سیستم تمام موقعیتهای ممکن را پیشبینی و برای آنها راهحل ارائه کند؛ بلکه سیستم بهمرور با محیط تعامل میکند و رفتار خود را بهینه میسازد.
۳.۸. در بینایی ماشین، گفتار و رباتیک
مسائلی مانند بینایی ماشین (computer vision)، تشخیص گفتار (speech recognition) و کنترل رباتها بهطور گسترده از روشهای یادگیری ماشین بهره میبرند. مدلهای یادگیرنده میتوانند الگوهای پیچیده موجود در تصاویر یا صداها را تشخیص دهند و بر اساس آن عمل کنند.
۳.۹. در خودروهای خودران
در طراحی خودروهای بدون راننده، الگوریتمهای یادگیری ماشین نقش محوری ایفا میکنند. این الگوریتمها با تحلیل دادههای حسگرها و تصاویر محیط، تصمیمات رانندگی مانند فرمان دادن، توقف، و تغییر مسیر را بهصورت خودکار انجام میدهند.
۳.۱۰. در طراحی برنامههای بازی
الگوریتمهای یادگیری ماشین در توسعه برنامههایی بهکار رفتهاند که قادر به انجام بازیهایی چون شطرنج، تختهنرد، و گو (Go) با عملکردی در سطح یا حتی بالاتر از انسان هستند. این مدلها از طریق تجربه مداوم و تحلیل حرکات، مهارت خود را افزایش میدهند.
فصل چهارم: درک دادهها در یادگیری ماشین
در فرآیند یادگیری ماشین، دادهها نقش اساسی دارند. در این فصل به مفاهیم پایهای مرتبط با داده، ساختار آنها، و انواع مختلف داده که در یادگیری ماشین مورد استفاده قرار میگیرند، پرداخته میشود.
واحد مشاهده (Unit of Observation)
«واحد مشاهده» کوچکترین موجودیت دارای ویژگیهای اندازهگیریشده در یک مطالعه است. این واحد میتواند شامل موارد زیر باشد:
- یک فرد، شیء یا موجود
- یک نقطه زمانی
- یک منطقه جغرافیایی
- یک مقدار اندازهگیریشده
در برخی موارد، واحدهای مشاهده ترکیب شده و مفاهیمی مانند «نفر-سال» ایجاد میشوند.
مثالها (Examples) و ویژگیها (Features)
دادهها در یادگیری ماشین معمولاً بهصورت مجموعهای از مثالها (examples) و ویژگیها (features) نمایش داده میشوند:
- مثال (example): یک نمونه از واحد مشاهده است که مقادیر ویژگیهای مختلف برای آن ثبت شدهاند. این واژه در متون دیگر بهصورت «مورد»، «رکورد» یا «نمونه» نیز بیان میشود.
- ویژگی (feature): خاصیتی اندازهگیریشده از هر مثال است. این واژه معادل با «متغیر»، «ویژگی» یا «صفت» نیز استفاده میشود.
مثالهایی از کاربرد این مفاهیم:
- تشخیص سرطان:
- واحد مشاهده: بیمار
- مثالها: نمونهای از بیماران
- ویژگیها: جنسیت، سن، فشار خون، نتایج گزارش آسیبشناسی (biopsy)
- انتخاب حیوان خانگی:
- واحد مشاهده: فرد
- مثالها: افرادی که حیوان خانگی دارند
- ویژگیها: سن، منطقه سکونت، درآمد خانوار
- شناسایی ایمیلهای اسپم:
- واحد مشاهده: یک ایمیل
- مثالها: پیامهای مشخص
- ویژگیها: کلمات موجود در متن ایمیل
نمایش ماتریسی دادهها
دادههای یادگیری ماشین معمولاً در قالب ماتریس نمایش داده میشوند. در این ساختار، سطرها بیانگر مثالها و ستونها بیانگر ویژگیها هستند. این نمایش باعث میشود پردازش و تحلیل دادهها بهصورت ساختاریافته و الگوریتمی آسانتر انجام شود.
انواع دادهها
ویژگیهای داده ممکن است در انواع مختلفی طبقهبندی شوند که شامل موارد زیر است:
- عددی (Numeric):
ویژگیهایی که بهصورت عددی و قابل اندازهگیری هستند. مانند: سال تولید، قیمت، مسافت طیشده. - اسمی (Categorical یا Nominal):
ویژگیهایی که شامل مجموعهای محدود از مقادیر گسسته هستند و هیچگونه ترتیب خاصی ندارند. مانند: رنگ خودرو، مدل، نوع گیربکس. - ترتیبی (Ordinal):
ویژگیهایی که دارای سطوح کیفی مرتبشده هستند. مانند: اندازه لباس (کوچک، متوسط، بزرگ)، یا سطح رضایت مشتری از «اصلاً راضی نیستم» تا «کاملاً راضیام».
مثال کاربردی:
در مجموعهدادهای مربوط به خودروها، ویژگیهای زیر میتوانند مشاهده شوند:
- «سال»، «قیمت»، «کارکرد» → ویژگیهای عددی
- «مدل»، «رنگ»، «گیربکس» → ویژگیهای اسمی
فصل پنجم: انواع مسائل یادگیری ماشین
یادگیری ماشین با مسائل گوناگونی مواجه است که بر اساس نوع داده، نوع خروجی مورد انتظار، و ساختار مسأله میتوان آنها را به دستههای مختلفی تقسیم کرد. در این فصل، سه دستهی اصلی از مسائل یادگیری ماشین بررسی میشوند: یادگیری روابط (قوانین انجمنی)، طبقهبندی، و رگرسیون. هرکدام از این دستهها، کاربردها، الگوریتمها و مفاهیم خاص خود را دارند.
۵.۱ یادگیری روابط (Association Rule Learning)
تعریف قوانین انجمنی
یادگیری قوانین انجمنی، یکی از روشهای یادگیری ماشین برای کشف روابط جالب و معنادار میان متغیرها در پایگاههای داده بزرگ است. این روش با استفاده از معیارهایی برای سنجش «جذابیت» یا «همبستگی»، قوانینی از نوع:
اگر X، آنگاه احتمالاً Y
را استخراج میکند.
نمونه کاربردهای واقعی
در یک فروشگاه زنجیرهای، مدیریت ممکن است علاقهمند باشد بداند آیا در رفتار خرید مشتریان الگوهایی تکرارشونده وجود دارد. بهعنوان مثال:
«اگر مشتری پیاز و سیبزمینی بخرد، احتمال زیادی وجود دارد که همبرگر نیز بخرد.»
این الگو بهصورت قاعدهی زیر نمایش داده میشود:
{پیاز، سیبزمینی} ⟹ {همبرگر}
احتمال شرطی مرتبط با این قاعده بهصورت:
P(همبرگر | پیاز، سیبزمینی)
محاسبه میشود. اگر این احتمال مثلاً برابر ۰٫۸ باشد، میتوان گفت:
«۸۰٪ مشتریانی که پیاز و سیبزمینی میخرند، همبرگر نیز خریداری میکنند.»
کاربرد عملی
چنین قواعدی در بازاریابی هدفمند، قیمتگذاری تبلیغاتی، و چیدمان محصولات در فروشگاهها استفاده میشوند. مشتریانی که X را خریدهاند اما Y را نه، مشتریان بالقوه برای Y محسوب میشوند.
الگوریتمهای معروف استخراج قوانین انجمنی
- الگوریتم Apriori
یکی از معروفترین الگوریتمها برای کشف قوانین انجمنی با استفاده از فراوانی مجموعهاقلام. - الگوریتم Eclat
الگوریتمی مبتنی بر درخت مجموعهاقلام و ساختارهای فشردهسازی داده برای استخراج سریعتر قوانین. - الگوریتم FP-Growth (الگوی پرتکرار)
الگوریتمی بسیار کارآمد برای کشف مجموعهاقلام پرتکرار بدون نیاز به تولید مجموعههای کاندید متعدد.
۵.۲ طبقهبندی (Classification)
تعریف
طبقهبندی در یادگیری ماشین به مسألهای گفته میشود که هدف آن تعیین دسته یا برچسب مناسب برای یک مشاهده جدید است، بر اساس دادههای آموزشی که شامل نمونههایی با برچسبهای مشخص هستند.
مثال عددی و نموداری
جدول زیر مجموعهای از دادههای آموزشی است:
نمره ۱ | نمره ۲ | نتیجه |
۲۹ | ۴۳ | قبول |
۲۲ | ۲۹ | مردود |
۱۰ | ۴۷ | مردود |
۳۱ | ۵۵ | قبول |
هدف: اگر نمرهی جدیدی با مقادیر «نمره ۱ = ۲۵» و «نمره ۲ = ۳۶» دریافت شود، مشخص شود که این نمونه در دستهی «قبول» قرار میگیرد یا «مردود».
این مسأله با استفاده از مدلهایی که از دادهی آموزشی آموختهاند، حل میشود. در شکل زیر (از فایل)، نمونههای «قبول» با دایره توپر و «مردود» با دایره توخالی نمایش داده شدهاند و نقطه علامت سؤال نشاندهنده نمونه جدید است.
کاربردهای واقعی در مسائل طبقهبندی
- تشخیص نویسه (OCR):
شناسایی کاراکترها از روی تصویر؛ چالشبرانگیز در حالت دستنویس. - شناسایی چهره:
ورودی تصویر چهره و هدف تعیین هویت فرد از میان افراد مختلف. - شناسایی گفتار:
ورودی صوتی و هدف، تبدیل گفتار به کلمات مشخص. - تشخیص بیماری:
اطلاعات ورودی شامل سن، سابقه پزشکی، علائم و هدف تعیین بیماری. - استخراج دانش:
قواعد طبقهبندی بهعنوان مدلهای سادهای برای توضیح دادهها. - فشردهسازی داده:
مدل طبقهبندی بهعنوان خلاصهای از دادههای بزرگ با نیاز حافظه کمتر. - سایر مثالها:
- اولویتبندی بیماران برای ICU (طبقهبندی کمریسک و پرریسک)
- ارزیابی اعتبار مشتریان کارت اعتباری
- دستهبندی اجرام نجومی مانند ستاره، کهکشان، سحابی
مفهوم تمایزبخش (Discriminant)
تمایزبخش، تابع یا قاعدهای است که وظیفه دارد برای یک مشاهده جدید، برچسب مناسب را اختصاص دهد. بهعنوان مثال:
- قاعدهای ساده:
اگر نمره ۱ + نمره ۲ ≥ ۶۰ آنگاه «قبول» وگرنه «مردود» - قاعده مالی:
اگر درآمد سالانه > θ₁ و پسانداز > θ₂ آنگاه «کمریسک» وگرنه «پرریسک» - یا حتی قاعدهی خطی:
f(x₁, x₂) = x₂ – ۰٫۲x₁
اگر f > ۰ آنگاه «کمریسک»، وگرنه «پرریسک»
الگوریتمهای طبقهبندی
- رگرسیون لجستیک (Logistic Regression)
- بیز ساده (Naive Bayes)
- نزدیکترین همسایه (k-NN)
- درخت تصمیم (Decision Tree)
- ماشین بردار پشتیبان (SVM)
- جنگل تصادفی (Random Forest)
نکات تکمیلی در طبقهبندی
- طبقهبندی دودویی: فقط دو دسته (مثلاً سالم / بیمار)
- طبقهبندی چندکلاسه: بیش از دو دسته (مثلاً ستاره / کهکشان / سحابی)
- طبقهبندی چندبرچسبی: یک نمونه ممکن است به چند دسته تعلق داشته باشد.
۵.۳ رگرسیون (Regression)
تعریف و مفهوم کلی
در مسائل رگرسیون، هدف پیشبینی مقدار عددی یک متغیر خروجی بر اساس متغیرهای ورودی است. این خروجی میتواند عدد صحیح یا اعشاری باشد و اغلب بیانگر یک کمیت مانند قیمت، اندازه، وزن و… است.
مثال عددی برای پیشبینی قیمت خودرو
جدول زیر دادههایی درباره قیمت خودروهای دستدوم را نشان میدهد:
قیمت (دلار) | سن (سال) | مسافت طیشده (کیلومتر) | وزن (پوند) |
۱۳۵۰۰ | ۲۳ | ۴۶۹۸۶ | ۱۱۶۵ |
۱۳۷۵۰ | ۲۳ | ۷۲۹۳۷ | ۱۱۶۵ |
… | … | … | … |
فرض: تخمین قیمت خودرویی با سن ۲۵ سال، مسافت ۵۳۲۴۰ و وزن ۱۲۰۰ پوند
این یک مسأله رگرسیون است چرا که خروجی (قیمت) عددی و قابل پیشبینی است.
مدل ریاضی عمومی
رگرسیون اغلب بهصورت رابطهای ریاضی میان متغیرهای ورودی x و خروجی y نمایش داده میشود:
y = f(x, θ)
که در آن:
- x: مجموعه متغیرهای ورودی
- θ: پارامترهای مدل
- y: خروجی پیشبینیشده
مثال:
Price = a₀ + a₁×Age + a₂×Distance + a₃×Weight
انواع روشهای رگرسیون
- رگرسیون خطی ساده:
فقط یک متغیر مستقل، رابطه بهصورت y = a + bx - رگرسیون خطی چندمتغیره:
چندین متغیر مستقل، y = a₀ + a₁x₁ + a₂x₂ + … + aₙxₙ - رگرسیون چندجملهای (Polynomial Regression):
مدل با توانهای بالاتر از متغیر، مانند y = a₀ + a₁x + a₂x² + … - رگرسیون لجستیک:
اگرچه در ظاهر مشابه رگرسیون است، اما در مسائل طبقهبندی بهکار میرود و خروجی آن احتمال تعلق به یک دسته (۰ یا ۱) است.
فصل ششم: انواع یادگیری در یادگیری ماشین
الگوریتمهای یادگیری ماشین را میتوان بهطور کلی به سه دستهی اصلی تقسیم کرد:
- یادگیری نظارتشده (Supervised Learning)
- یادگیری بدون نظارت (Unsupervised Learning)
- یادگیری تقویتی (Reinforcement Learning)
هر یک از این انواع، روشها، ساختارها و کاربردهای خاص خود را دارند. در این فصل به توضیح کامل هر کدام میپردازیم.
۶.۱ یادگیری نظارتشده (Supervised Learning)
تعریف
یادگیری نظارتشده به وظیفهای در یادگیری ماشین گفته میشود که در آن هدف، یادگیری یک تابع است که ورودی را به خروجی نگاشت میکند. در این روش، دادههای آموزشی شامل زوجهای ورودی-خروجی هستند، یعنی برای هر نمونه، مقدار خروجی (برچسب) نیز مشخص شده است.
الگوریتم یادگیرنده با تحلیل این زوجهای ورودی-خروجی، تابعی را میسازد که بتواند برای دادههای جدید نیز خروجی مناسب را پیشبینی کند. این تابع باید تا حد امکان دقیق و قابل تعمیم باشد.
هر دو مسأله طبقهبندی (Classification) و رگرسیون (Regression) از جمله مسائل یادگیری نظارتشده محسوب میشوند.
نمونه و نمودار
بهعنوان نمونه، جدول زیر اطلاعات مربوط به بیمارانی را نمایش میدهد که وارد یک کلینیک شدهاند:
جنسیت | سن | برچسب (label) |
M | ۴۸ | بیمار |
M | ۶۷ | بیمار |
F | ۵۳ | سالم |
M | ۴۹ | سالم |
F | ۳۴ | بیمار |
M | ۲۱ | سالم |
در این مثال، جنسیت و سن ویژگیهای ورودی، و وضعیت سلامت (بیمار یا سالم) برچسب خروجی است. هدف یادگیری، ایجاد مدلی است که بتواند برای فردی جدید با مشخصات مشابه، پیشبینی کند که او سالم است یا بیمار.
شباهت به یادگیری با معلم
یادگیری نظارتشده از آن جهت این نام را گرفته است که روند یادگیری در آن شبیه به یادگیری با نظارت یک معلم است. در این حالت، ما پاسخ درست را برای نمونهها میدانیم و الگوریتم با آزمون و خطا و با بازخورد گرفتن از دادههای دارای پاسخ صحیح، بهتدریج عملکرد خود را بهبود میدهد.
فرایند یادگیری تا زمانی ادامه مییابد که الگوریتم به سطح عملکرد قابلقبولی برسد.
۶.۲ یادگیری بدون نظارت (Unsupervised Learning)
تعریف
یادگیری بدون نظارت به الگوریتمهایی اطلاق میشود که فقط با دادههای ورودی بدون برچسب خروجی کار میکنند. در این نوع یادگیری، هیچ اطلاعاتی دربارهی دسته یا مقدار مورد انتظار وجود ندارد. هدف، یافتن ساختارهای پنهان، الگوها، یا گروهبندیهای معنادار در دادههاست.
در این روش، چون خروجی مشخصی نداریم، امکان سنجش مستقیم دقت ساختار خروجی نیز وجود ندارد.
کاربرد در خوشهبندی دادهها
خوشهبندی (Clustering) یکی از رایجترین روشهای یادگیری بدون نظارت است. در این روش، دادهها بر اساس شباهت به گروههایی (خوشههایی) تقسیم میشوند، بدون اینکه از قبل بدانیم این گروهها چه هستند.
خوشهبندی اغلب برای تحلیل اکتشافی دادهها و کشف الگوهای پنهان در مجموعههای دادهی بزرگ استفاده میشود.
مثال بالینی
جدول زیر اطلاعات مربوط به تعدادی بیمار را بدون برچسب ارائه میدهد:
جنسیت | سن |
M | ۴۸ |
M | ۶۷ |
F | ۵۳ |
M | ۴۹ |
F | ۳۴ |
M | ۲۱ |
در این مثال، هیچ اطلاعاتی دربارهی «سلامت» یا «بیماری» بیماران وجود ندارد. هدف یادگیری بدون نظارت این است که مثلاً بتواند الگو یا گروهبندی خاصی میان بیماران بر اساس جنسیت و سن کشف کند، بدون دانستن نتیجه نهایی (مثلاً سالم یا بیمار بودن).
۶.۳ یادگیری تقویتی (Reinforcement Learning)
تعریف
یادگیری تقویتی به نوعی از یادگیری ماشین اطلاق میشود که در آن هدف، آموزش یک عامل (agent) برای انجام اقداماتی در محیط است، بهگونهای که میزان پاداش دریافتی در طول زمان بیشینه شود.
در این روش، عامل نه پاسخ درست را میداند، نه مستقیم بازخورد مثبت یا منفی برای هر اقدام دارد. بلکه با آزمون و خطا و با تجربه اثرات تصمیمات خود، یاد میگیرد که کدام اقدامات منجر به دریافت پاداش بیشتر در بلندمدت میشود.
در بسیاری از موارد، یک اقدام نهتنها پاداش آنی دارد بلکه وضعیت آینده را نیز تحت تأثیر قرار میدهد و بنابراین کل زنجیره پاداشها در آینده را تغییر میدهد. این ویژگی، یادگیری تقویتی را از سایر انواع یادگیری متمایز میکند.
مثال واقعی
یک نمونهی ملموس، آموزش یک سگ برای انجام یک حرکت جدید است:
- ما نمیتوانیم به سگ بگوییم دقیقاً چه کند، اما اگر رفتار درستی انجام دهد، به او پاداش میدهیم و اگر اشتباه کند، تنبیه.
- سگ بهمرور یاد میگیرد که چه رفتاری موجب دریافت پاداش میشود، بدون اینکه مستقیماً به او گفته شود.
به همین شکل، یادگیری تقویتی برای آموزش کامپیوترها نیز استفاده میشود، مانند:
- بازی شطرنج یا تختهنرد
- زمانبندی وظایف
- کنترل حرکات اندامهای رباتیک
تفاوت با یادگیری نظارتشده
یادگیری نظارتشده شامل دادههای برچسبدار است؛ یعنی پاسخ صحیح برای هر ورودی از قبل مشخص شده و الگوریتم میکوشد آن پاسخ را یاد بگیرد. اما در یادگیری تقویتی:
- پاسخ صحیح وجود ندارد.
- الگوریتم باید با تجربه و با ارزیابی پیامد اقدامات خود یاد بگیرد که چه تصمیمی بهتر است.
- پاداشها ممکن است آنی یا با تأخیر باشند.