تعریف هوش مصنوعی: از تخیل تا واقعیت

0

فصل ۴: یادگیری ماشین(قلب تپنده هوش مصنوعی مدرن)

یادگیری ماشین (Machine Learning) یکی از ستون‌های اصلی هوش مصنوعی است که به سیستم‌ها امکان می‌دهد از داده‌ها یاد بگیرند و بدون برنامه‌ریزی صریح، عملکرد خود را بهبود ببخشند. همان‌طور که انسان‌ها با تجربه عاقل‌تر می‌شوند، ماشین‌ها نیز با یادگیری از داده‌ها هوشمندتر می‌شوند. این مقاله، که برای مجله «هوش مصنوعی سیمرغ» نوشته شده است، به بررسی انواع یادگیری ماشین، طبقه‌بندی‌کننده نزدیک‌ترین همسایه، و رگرسیون می‌پردازد. با ما همراه شوید تا ببینیم چگونه یادگیری ماشین، هوش مصنوعی را به دنیای واقعی متصل می‌کند.

این فصل بخش‌های زیر را در بر میگیرد:

۱. انواع یادگیری ماشین

۲. طبقه‌بندی‌کننده نزدیک‌ترین همسایه

۳. رگرسیون: پیش‌بینی مقادیر پیوسته

انواع یادگیری ماشین: سفری به دنیای هوش مصنوعی داده‌محور

یادگیری ماشین (Machine Learning) به سیستم‌ها امکان داده تا از داده‌ها الگوهایی استخراج کنند و بدون نیاز به قوانین دستی، تصمیم‌گیری کنند. یکی از مثال‌های کلاسیک در این حوزه، شناسایی ارقام دست‌نویس است که از مجموعه داده معروف MNIST استفاده می‌کند. این مقاله، که برای مجله «هوش مصنوعی سیمرغ» نوشته شده است، به بررسی انواع یادگیری ماشین و کاربردهای آن‌ها با تمرکز بر مجموعه داده MNIST می‌پردازد. با ما همراه شوید تا ببینیم چگونه یادگیری ماشین، مسائل پیچیده دنیای واقعی را حل می‌کند.


مجموعه داده MNIST: دروازه‌ای به یادگیری ماشین

MNIST چیست؟
مجموعه داده MNIST (Modified National Institute of Standards and Technology) شامل تصاویر سیاه‌وسفید ارقام دست‌نویس (۰ تا ۹) است که به‌عنوان یکی از معروف‌ترین مجموعه‌های داده در یادگیری ماشین شناخته می‌شود. هر تصویر با برچسب صحیح خود (رقمی که نویسنده قصد نوشتن آن را داشته) همراه است، اگرچه گاهی تشخیص برچسب صحیح دشوار است (مثلاً آیا یک تصویر واقعاً عدد ۷ است یا ۴؟).

چرا MNIST مهم است؟
این مجموعه داده به دلیل سادگی و در عین حال چالش‌برانگیز بودن، به‌عنوان یک معیار استاندارد برای آزمایش الگوریتم‌های یادگیری ماشین استفاده می‌شود. هدف این است که الگوریتمی طراحی شود که بتواند به‌صورت خودکار، برچسب صحیح (۰ تا ۹) را برای هر تصویر پیش‌بینی کند.

چالش‌های روش‌های سنتی
در گذشته، سیستم‌های مبتنی بر قوانین دستی (مانند سیستم‌های خبره دهه ۱۹۸۰) برای شناسایی ارقام استفاده می‌شدند. برای مثال، قوانینی مانند «اگر پیکسل‌های سیاه یک حلقه تشکیل دهند، عدد ۰ است» یا «اگر پیکسل‌ها یک خط عمودی باشند، عدد ۱ است» تعریف می‌شدند. اما این روش‌ها به دلیل پیچیدگی تعریف قوانین دقیق و تنوع زیاد در دست‌خط‌ها، ناکارآمد بودند.

جدول مشکلات روش‌های سنتی

روشمشکلمثال
قوانین دستینیاز به تعریف دقیق و پیچیده«حلقه» یا «خط» دقیقاً چیست؟
استثناهانیاز به قوانین متعدد برای استثناهادست‌خط‌های نامنظم
مقیاس‌پذیریدشواری در تعمیم به داده‌های جدیدتنوع در سبک‌های نوشتاری

انواع یادگیری ماشین: سه رویکرد اصلی

یادگیری ماشین به سه دسته اصلی تقسیم می‌شود که هر یک برای حل نوع خاصی از مسائل طراحی شده‌اند:

۱. یادگیری نظارت‌شده (Supervised Learning)
در این روش، داده‌های آموزشی شامل ورودی‌ها و برچسب‌های صحیح (خروجی‌ها) هستند. هدف، یادگیری مدلی است که بتواند برچسب‌های صحیح را برای داده‌های جدید پیش‌بینی کند.

  • مثال: شناسایی نوع تابلوی راهنمایی (مثلاً تابلوی سرعت یا توقف) از تصویر یا تشخیص رقم دست‌نویس در MNIST.
  • کاربردها: تشخیص هرزنامه، پیش‌بینی قیمت خانه، شناسایی حساب‌های جعلی در شبکه‌های اجتماعی.

۲. یادگیری بدون نظارت (Unsupervised Learning)
در این روش، داده‌ها فاقد برچسب هستند و هدف، کشف ساختار یا الگوهای پنهان در داده‌هاست.

  • مثال: خوشه‌بندی مشتریان یک فروشگاه بر اساس رفتار خرید یا کاهش ابعاد داده‌ها برای تجسم.
  • کاربردها: گروه‌بندی مشتریان، تجسم داده‌ها، مدل‌سازی مولد (مانند تولید تصاویر مصنوعی با شبکه‌های مولد تخاصمی یا GANs).

۳. یادگیری تقویتی (Reinforcement Learning)
در این روش، یک عامل (Agent) از طریق آزمون و خطا و دریافت پاداش یا جریمه یاد می‌گیرد.

  • مثال: آموزش یک ربات برای راه رفتن یا یک سیستم برای بازی شطرنج.
  • کاربردها: رباتیک، بازی‌های استراتژیک، بهینه‌سازی سیستم‌های خودکار.

جدول مقایسه انواع یادگیری ماشین

نوع یادگیریداده‌های مورد نیازهدفمثال
نظارت‌شدهداده‌های برچسب‌دارپیش‌بینی برچسبتشخیص رقم دست‌نویس
بدون نظارتداده‌های بدون برچسبکشف ساختارخوشه‌بندی مشتریان
تقویتیپاداش/جریمهبهینه‌سازی رفتارآموزش ربات

یادگیری نظارت‌شده: انسان‌ها به ماشین‌ها آموزش می‌دهند

چگونه کار می‌کند؟
در یادگیری نظارت‌شده، یک مجموعه داده آموزشی شامل ورودی‌ها (مانند تصاویر ارقام) و برچسب‌های صحیح (مانند ۰ تا ۹) به الگوریتم داده می‌شود. الگوریتم از این داده‌ها برای یادگیری مدلی استفاده می‌کند که بتواند برچسب‌های صحیح را برای داده‌های جدید پیش‌بینی کند.

طبقه‌بندی و رگرسیون

  • طبقه‌بندی: پیش‌بینی یک کلاس گسسته (مانند تشخیص رقم در MNIST یا شناسایی تابلوی راهنمایی).
  • رگرسیون: پیش‌بینی یک مقدار پیوسته (مانند قیمت خانه بر اساس متراژ و موقعیت).

مثال رگرسیون
فرض کنید داده‌هایی از فروش آپارتمان‌ها داریم:

متراژ (مترمربع)تعداد اتاققیمت (میلیون تومان)
۱۰۰۲۵۰۰
۱۵۰۳۷۰۰
۲۰۰۴۹۰۰

یک مدل رگرسیون خطی می‌تواند رابطه‌ای بین متراژ و قیمت پیدا کند (مثلاً قیمت = 4 × متراژ + ۱۰۰).


چالش‌های یادگیری ماشین: بیش‌برازش

بیش‌برازش (Overfitting) چیست؟
بیش‌برازش زمانی رخ می‌دهد که مدل بیش از حد به داده‌های آموزشی وابسته می‌شود و نمی‌تواند روی داده‌های جدید (تست) عملکرد خوبی داشته باشد. این مشکل مانند یادگیری بیش از حد جزئیات یک درس بدون درک مفهوم کلی است.

چگونه از بیش‌برازش جلوگیری کنیم؟

  • تقسیم داده‌ها: داده‌ها به دو بخش آموزشی و آزمایشی تقسیم می‌شوند. مدل روی داده‌های آموزشی ساخته می‌شود و روی داده‌های آزمایشی ارزیابی می‌شود.
  • انتخاب مدل مناسب: مدل‌های بیش از حد انعطاف‌پذیر (مانند شبکه‌های عصبی عمیق) ممکن است بیش‌برازش شوند، مگر اینکه داده‌های بسیار زیادی در دسترس باشد.

مثال بیش‌برازش
فرض کنید مدلی برای پیش‌بینی موفقیت آهنگ‌های یک خواننده ساخته‌اید. اگر مدل شما قوانینی مانند «آهنگ‌های عاشقانه با کورس جذاب موفق‌اند، مگر اینکه به سوئد یا یوگا اشاره کنند» ایجاد کند، ممکن است به داده‌های آموزشی بیش از حد وابسته شده و روی آهنگ‌های جدید عملکرد ضعیفی داشته باشد.


یادگیری بدون نظارت: کشف الگوهای پنهان

چگونه کار می‌کند؟
در یادگیری بدون نظارت، هیچ برچسب درستی وجود ندارد. الگوریتم سعی می‌کند ساختارهای پنهان در داده‌ها را کشف کند، مانند خوشه‌بندی یا تجسم.

مثال: خوشه‌بندی مشتریان
یک فروشگاه زنجیره‌ای می‌تواند داده‌های خرید مشتریان را تحلیل کند و آن‌ها را به گروه‌هایی مانند «علاقه‌مندان به غذای سالم» یا «عاشقان پیتزا و نوشابه» تقسیم کند. الگوریتم خوشه‌بندی گروه‌ها را شناسایی می‌کند، اما نام‌گذاری آن‌ها به عهده کاربر است.

مدل‌سازی مولد
یادگیری بدون نظارت در مدل‌های مولد، مانند شبکه‌های مولد تخاصمی (GANs)، نیز کاربرد دارد. این مدل‌ها می‌توانند داده‌های جدیدی مانند تصاویر مصنوعی چهره‌های انسانی تولید کنند.


جمع‌بندی

یادگیری ماشین با سه رویکرد نظارت‌شده، بدون نظارت، و تقویتی، ابزارهای قدرتمندی برای حل مسائل دنیای واقعی ارائه می‌دهد. از شناسایی ارقام دست‌نویس در MNIST تا خوشه‌بندی مشتریان یا آموزش ربات‌ها، این روش‌ها به هوش مصنوعی امکان می‌دهند تا از داده‌ها یاد بگیرد و تصمیم‌گیری کند. درک انواع یادگیری ماشین، گامی اساسی برای فهم کاربردهای گسترده هوش مصنوعی در زندگی روزمره است.


پرسش‌های متداول

  1. چرا یادگیری ماشین برای هوش مصنوعی مهم است؟
    یادگیری ماشین به سیستم‌ها امکان می‌دهد از داده‌ها الگو استخراج کنند و بدون قوانین دستی، تصمیم‌گیری کنند.
  2. تفاوت یادگیری نظارت‌شده و بدون نظارت چیست؟
    یادگیری نظارت‌شده از داده‌های برچسب‌دار برای پیش‌بینی استفاده می‌کند، در حالی که یادگیری بدون نظارت ساختارهای پنهان داده‌ها را کشف می‌کند.
  3. چرا روش‌های دستی برای شناسایی ارقام دست‌نویس ناکارآمد هستند؟
    به دلیل تنوع زیاد در دست‌خط‌ها و پیچیدگی تعریف قوانین دقیق، این روش‌ها مقیاس‌پذیر نیستند.
  4. بیش‌برازش چیست و چگونه می‌توان از آن جلوگیری کرد؟
    بیش‌برازش زمانی رخ می‌دهد که مدل بیش از حد به داده‌های آموزشی وابسته می‌شود. تقسیم داده‌ها به آموزشی و آزمایشی و انتخاب مدل مناسب از آن جلوگیری می‌کند.
  5. یادگیری تقویتی چه کاربردی دارد؟
    این روش در سناریوهایی مانند رباتیک و بازی‌های استراتژیک، جایی که عامل از پاداش و جریمه یاد می‌گیرد، کاربرد دارد.

طبقه‌بندی‌کننده نزدیک‌ترین همسایه: ساده اما قدرتمند

مقدمه
طبقه‌بندی‌کننده نزدیک‌ترین همسایه (K-Nearest Neighbors یا KNN) یکی از ساده‌ترین و در عین حال مؤثرترین روش‌های یادگیری ماشین است که با یافتن نمونه‌های مشابه در داده‌های آموزشی، پیش‌بینی انجام می‌دهد. این روش در کاربردهایی مانند سیستم‌های توصیه‌گر و تشخیص الگوها بسیار کاربردی است. این مقاله، که برای مجله «هوش مصنوعی سیمرغ» نوشته شده است، به بررسی اصول طبقه‌بندی‌کننده نزدیک‌ترین همسایه، نحوه کارکرد آن، و کاربردهایش در دنیای واقعی می‌پردازد. با ما همراه شوید تا ببینیم چگونه این الگوریتم ساده، مسائل پیچیده را حل می‌کند.


طبقه‌بندی‌کننده نزدیک‌ترین همسایه: اصول و مبانی

KNN چیست؟
طبقه‌بندی‌کننده نزدیک‌ترین همسایه یک روش یادگیری نظارت‌شده است که یک نمونه جدید را با یافتن نزدیک‌ترین نمونه‌های موجود در داده‌های آموزشی طبقه‌بندی می‌کند. این الگوریتم بر اساس فرض ساده‌ای کار می‌کند: نمونه‌هایی که از نظر ویژگی‌ها شبیه هم هستند، احتمالاً به یک کلاس تعلق دارند.

چگونه کار می‌کند؟

  1. انتخاب داده‌های آموزشی: مجموعه‌ای از داده‌ها با برچسب‌های شناخته‌شده (مانند تصاویر ارقام دست‌نویس با برچسب‌های ۰ تا ۹) در دسترس است.
  2. محاسبه فاصله: فاصله نمونه جدید با تمام نمونه‌های آموزشی محاسبه می‌شود (معمولاً با استفاده از فاصله اقلیدسی).
  3. انتخاب نزدیک‌ترین همسایه: نزدیک‌ترین نمونه (یا نمونه‌ها در صورت استفاده از K>1) انتخاب شده و برچسب آن به نمونه جدید اختصاص می‌یابد.

مثال: تشخیص ارقام دست‌نویس
در مجموعه داده MNIST، برای شناسایی یک رقم دست‌نویس، KNN پیکسل‌های تصویر جدید را با تصاویر آموزشی مقایسه می‌کند. اگر نزدیک‌ترین تصویر آموزشی به عدد ۷ تعلق داشته باشد، تصویر جدید به‌عنوان ۷ طبقه‌بندی می‌شود.

جدول نمونه داده‌های MNIST

تصویربرچسبویژگی‌ها (پیکسل‌ها)
تصویر ۱۷[۰, ۲۵۵, ۱۲۸, …]
تصویر ۲۴[۲۵۵, ۰, ۶۴, …]
تصویر ۳۷[۰, ۲۰۰, ۱۰۰, …]

تعریف «نزدیک‌ترین» در KNN

معیار فاصله
در KNN، مفهوم «نزدیکی» با استفاده از معیارهای فاصله مانند فاصله اقلیدسی تعریف می‌شود. فاصله اقلیدسی، فاصله مستقیم بین دو نقطه در فضا است، مانند کشیدن یک نخ بین دو نقطه روی کاغذ.

چالش‌های تعریف فاصله

  • در مسائل غیرهندسی (مانند متن)، تعریف فاصله دشوار است. برای مثال، در تشخیص ارقام MNIST، می‌توان تطابق پیکسل به پیکسل را بررسی کرد، اما این روش به جابجایی یا مقیاس‌بندی تصاویر حساس است.
  • در MNIST، تصاویر از قبل متمرکز شده‌اند تا این مشکل کاهش یابد.

مثال: معیار فاصله در متن
برای مقایسه دو سند متنی، می‌توان تعداد کلمات مشترک یا معیارهایی مانند فاصله کسینوسی را استفاده کرد. انتخاب معیار فاصله باید متناسب با نوع داده باشد.


کاربرد KNN: سیستم‌های توصیه‌گر

سیستم‌های توصیه‌گر و فیلتر مشارکتی
KNN در سیستم‌های توصیه‌گر، مانند پیشنهاد موسیقی یا محصولات، بسیار کاربرد دارد. ایده اصلی این است که کاربران با رفتار مشابه در گذشته، احتمالاً در آینده نیز رفتار مشابهی خواهند داشت.

مثال: پیشنهاد موسیقی
فرض کنید در یک سرویس موسیقی، کاربری به آهنگ‌های دیسکوی دهه ۱۹۸۰ گوش داده است. سیستم KNN کاربرانی را که الگوی مشابهی دارند پیدا کرده و آهنگ‌های مورد علاقه آن‌ها را به کاربر پیشنهاد می‌دهد.

تمرین: پیش‌بینی خرید مشتری
داده‌های زیر خریدهای اخیر شش کاربر را نشان می‌دهد:

کاربرتاریخچه خریدخرید اخیر
سانیدستکش بوکس، موبی دیک، هدفون، عینک آفتابیدانه قهوه
یونایتی‌شرت، دانه قهوه، قهوه‌ساز، دانه قهوهدانه قهوه
یانیناعینک آفتابی، کتانی، تی‌شرت، کتانیجوراب پشمی
هنریک۲۰۰۱: ادیسه فضایی، هدفون، تی‌شرت، دستکش بوکسدمپایی
ویلهتی‌شرت، دمپایی، عینک آفتابی، موبی دیکضدآفتاب
تیموموبی دیک، دانه قهوه، ۲۰۰۱: ادیسه فضایی، هدفوندانه قهوه

وظیفه: پیش‌بینی خرید بعدی کاربر تراویس که تاریخچه خریدش شامل چای سبز، تی‌شرت، عینک آفتابی، و دمپایی است.

  1. محاسبه شباهت: شباهت تراویس با هر کاربر با شمارش اقلام مشترک در تاریخچه خرید محاسبه می‌شود (خرید اخیر در نظر گرفته نمی‌شود).
    • سانی: ۲ (تی‌شرت، عینک آفتابی)
    • یونای: ۱ (تی‌شرت)
    • یانینا: ۲ (تی‌شرت، عینک آفتابی)
    • هنریک: ۲ (تی‌شرت، دمپایی)
    • ویله: ۳ (تی‌شرت، عینک آفتابی، دمپایی)
    • تیمو: ۰
  2. انتخاب نزدیک‌ترین همسایه: ویله با شباهت ۳ نزدیک‌ترین است.
  3. پیش‌بینی: خرید اخیر ویله (ضدآفتاب) به‌عنوان خرید بعدی تراویس پیش‌بینی می‌شود.

نتیجه

  • نزدیک‌ترین کاربر: ویله
  • پیش‌بینی خرید: ضدآفتاب

چالش‌ها: حباب‌های فیلتر

حباب فیلتر چیست؟
سیستم‌های توصیه‌گر مبتنی بر KNN ممکن است کاربران را در «حباب‌های فیلتر» قرار دهند، جایی که تنها محتوای مطابق با علایق گذشته آن‌ها پیشنهاد می‌شود. این می‌تواند تنوع اطلاعات دریافتی را محدود کند.

چرا حباب‌های فیلتر مضرند؟

  • محدود شدن دیدگاه‌ها: کاربران ممکن است فقط محتوای هم‌راستا با باورهایشان ببینند، که می‌تواند تعصبات را تقویت کند.
  • کاهش تنوع: در اخبار یا شبکه‌های اجتماعی، این پدیده ممکن است به قطبی‌سازی اجتماعی منجر شود.

راه‌حل‌های پیشنهادی

  1. تنوع در پیشنهادات: سیستم می‌تواند به‌صورت تصادفی محتوای خارج از علایق کاربر را پیشنهاد دهد.
  2. وزن‌دهی به تنوع: الگوریتم می‌تواند معیاری برای تنوع محتوا در نظر بگیرد تا کاربران با دیدگاه‌های جدید آشنا شوند.
  3. شفافیت: به کاربران اطلاع داده شود که چرا محتوا پیشنهاد شده و امکان انتخاب گزینه‌های متنوع‌تر فراهم شود.

جمع‌بندی

طبقه‌بندی‌کننده نزدیک‌ترین همسایه با سادگی و انعطاف‌پذیری خود، ابزاری قدرتمند برای حل مسائل طبقه‌بندی و پیشنهاد در دنیای واقعی است. از تشخیص ارقام دست‌نویس تا پیشنهاد محصولات، این روش با یافتن شباهت‌ها، تصمیم‌گیری می‌کند. با این حال، چالش‌هایی مانند حباب‌های فیلتر نشان‌دهنده نیاز به طراحی هوشمندانه‌تر سیستم‌ها هستند. درک KNN گامی مهم در فهم یادگیری ماشین و کاربردهای آن است.


پرسش‌های متداول

  1. طبقه‌بندی‌کننده نزدیک‌ترین همسایه چیست؟
    KNN یک الگوریتم یادگیری نظارت‌شده است که نمونه جدید را بر اساس شباهت به نمونه‌های آموزشی طبقه‌بندی می‌کند.
  2. چگونه فاصله در KNN محاسبه می‌شود؟
    معمولاً از فاصله اقلیدسی استفاده می‌شود، اما معیار فاصله باید متناسب با نوع داده انتخاب شود.
  3. KNN در چه کاربردهایی استفاده می‌شود؟
    در سیستم‌های توصیه‌گر، تشخیص الگو، و تحلیل داده‌های متنی مانند تشخیص هرزنامه کاربرد دارد.
  4. حباب‌های فیلتر چیستند و چرا مشکل‌سازند؟
    حباب‌های فیلتر کاربران را به محتوای مشابه علایق گذشته محدود می‌کنند و ممکن است تنوع اطلاعات و دیدگاه‌ها را کاهش دهند.
  5. چگونه می‌توان از حباب‌های فیلتر جلوگیری کرد؟
    با افزودن تنوع در پیشنهادات، وزن‌دهی به محتوای جدید، و افزایش شفافیت در سیستم‌های توصیه‌گر
1 2 3
Share.
Leave A Reply Cancel Reply
Exit mobile version