هوش مصنوعی در المپیاد ریاضی بین‌المللی به مدال نقره دست پیدا کرد!

هوش مصنوعی، مدال نقره المپیاد جهانی ریاضی را از آن خود کرد

سیستم‌های هوش مصنوعی AlphaProof و AlphaGeometry 2 توانستند چهار سوال از شش سوال المپیاد جهانی ریاضی را حل کنند.

یک دستاورد بزرگ در زمینه هوش مصنوعی به ثبت رسید. سیستم‌های هوش مصنوعی AlphaProof و AlphaGeometry 2 موفق شدند چهار سوال از شش سوال پیچیده المپیاد جهانی ریاضی (IMO) را حل کنند. این دستاورد به معنای کسب مدال نقره در این رقابت معتبر جهانی است.

المپیاد جهانی ریاضی، چالشی بزرگ برای هوش مصنوعی

المپیاد جهانی ریاضی قدیمی‌ترین، بزرگ‌ترین و معتبرترین رقابت ریاضیات برای دانش‌آموزان است که از سال ۱۹۵۹ برگزار می‌شود. هر ساله، نخبگان ریاضیات سرتاسر جهان ساعت‌ها تمرین می‌کنند تا بتوانند شش سوال فوق‌العاده دشوار در زمینه جبر، ترکیبات، هندسه و نظریه اعداد را حل کنند. بسیاری از برندگان مدال فیلدز، یکی از بالاترین افتخارات در ریاضیات، سابقه حضور در المپیاد جهانی ریاضی را دارند.

در سال‌های اخیر، المپیاد جهانی ریاضی به یک چالش بزرگ در حوزه یادگیری ماشین تبدیل شده و به عنوان یک معیار مهم برای سنجش توانایی استدلال ریاضی پیشرفته سیستم‌های هوش مصنوعی شناخته می‌شود.

سیستم‌های هوش مصنوعی، هم‌تراز با نخبگان ریاضی

امسال، سیستم ترکیبی هوش مصنوعی تیم‌های AlphaProof و AlphaGeometry بر روی سوالات ارائه شده توسط برگزارکنندگان المپیاد جهانی ریاضی اعمال شد. پاسخ‌های این سیستم توسط پروفسور سر تیموتی گاورز، دارنده مدال فیلدز و مدال طلای المپیاد جهانی ریاضی، و دکتر جوزف مایرز، دو بار دارنده مدال طلای المپیاد جهانی و رئیس کمیته انتخاب سوالات المپیاد جهانی ریاضی ۲۰۲۴، بر اساس قوانین امتیازدهی المپیاد جهانی امتیازدهی شد.

پروفسور سر تیموتی گاورز در این باره می‌گوید: «این واقعیت که این برنامه می‌تواند یک ساختار غیر بدیهی مانند این را ارائه دهد بسیار چشمگیر است و فراتر از آنچه من فکر می‌کردم سطح پیشرفت است.»

ابتدا، سوالات به زبان رسمی ریاضی ترجمه شدند تا سیستم‌ها بتوانند آن‌ها را درک کنند. در رقابت رسمی، دانش‌آموزان دو جلسه ۴.۵ ساعته برای پاسخگویی دارند. این سیستم‌ها یک سوال را در عرض چند دقیقه حل کردند و برای حل بقیه سوالات تا سه روز زمان صرف کردند.

AlphaProof دو سوال جبر و یک سوال نظریه اعداد را با تعیین پاسخ و اثبات صحت آن حل کرد که سخت‌ترین سوال مسابقه بود و تنها پنج شرکت‌کننده در المپیاد امسال توانستند آن را حل کنند. AlphaGeometry 2 نیز سوال هندسه را اثبات کرد، اما دو سوال ترکیبیات بدون پاسخ ماند.

هر یک از شش سوال می‌تواند هفت امتیاز کسب کند و حداکثر نمره ممکن ۴۲ است. سیستم ارائه شده به امتیاز نهایی ۲۸ دست یافت و در هر سوال حل شده امتیاز کامل کسب کرد که معادل بالاترین سطح دسته مدال نقره است. امسال، آستانه مدال طلا از ۲۹ امتیاز شروع می‌شود و توسط ۵۸ نفر از ۶۰۹ شرکت‌کننده در رقابت رسمی به دست آمد.

AlphaProof: رویکردی رسمی برای استدلال

AlphaProof سیستمی است که خود را برای اثبات مسائل ریاضی در زبان رسمی Lean آموزش می‌دهد. برای حل مسائل این سیستم یک مدل زبان از پیش آموزش دیده شده را با الگوریتم یادگیری تقویتی AlphaZero ترکیب نموده است.

مزیت زبان‌های رسمی این است که امکان ارائه اثبات همراه با استدلال های منطقی را دارند اما به دلیل کمبود داده ورودی محدودیت هایی دارند.

در مقابل، رویکردهای مبتنی بر زبان طبیعی علیرغم دسترسی به داده‌های بسیار بیشتر می‌توانند مراحل استدلال و راه‌حل‌های احتمالی اما نادرست را ایجاد کنند. تیم توسعه دهندگان با تنظیم دقیق یک مدل Gemini برای ترجمه خودکار بیانیه‌های مسائل زبان طبیعی به بیانیه‌های رسمی، یک پل بین این دو حوزه مکمل ایجاد کرد و در نهایت کتابخانه ای بزرگ از مسائل رسمی با سطوح دشواری متفاوت ایجاد شد.

هنگامی که با یک مسئله مواجه می‌شود، AlphaProof گزینه‌های حل را تولید می‌کند و سپس آن‌ها را با جستجو بر روی مراحل اثبات احتمالی در Lean اثبات یا رد می‌کند. هر اثباتی که پیدا و تأیید شد برای تقویت مدل زبان AlphaProof استفاده می‌شود و توانایی آن را برای حل مسائل چالش‌برانگیز بعدی افزایش می‌دهد.

ما AlphaProof را برای المپیاد جهانی ریاضی با اثبات یا رد میلیون‌ها مسئله، پوشش طیف گسترده‌ای از دشواری‌ها و حوزه‌های موضوعی ریاضی در طول چند هفته منتهی به رقابت آموزش دادیم. حلقه آموزشی همچنین در طول مسابقه اعمال شد و اثبات‌های تغییرات خودساخته مسائل مسابقه را تا زمانی که یک راه حل کامل پیدا شود، تقویت کرد.

AlphaGeometry 2 رقابتی‌تر

AlphaGeometry 2 نسخه بهبود یافته قابل توجهی از AlphaGeometry است. این یک سیستم ترکیبی عصبی-سمبولی است که در آن مدل زبان بر اساس Gemini بوده و از ابتدا بر روی یک مرتبه بزرگتر از داده‌های مصنوعی نسبت به سلف خود آموزش دیده است. این به مدل کمک کرد تا با مشکلات هندسه بسیار چالش‌برانگیزتر، از جمله مشکلات مربوط به حرکت اشیاء و معادلات زاویه، نسبت یا فاصله مقابله کند.

AlphaGeometry 2 از یک موتور نمادین استفاده می‌کند که دو مرتبه سریع‌تر از سلف خود است. هنگام مواجهه با یک مشکل جدید، از یک مکانیسم به اشتراک‌گذاری دانش جدید برای فعال کردن ترکیبات پیشرفته درختان جستجوی مختلف برای مقابله با مشکلات پیچیده‌تر استفاده می‌شود.

قبل از رقابت امسال، AlphaGeometry 2 توانست ۸۳ درصد از تمام مسائل هندسه المپیاد جهانی ریاضی تاریخی از ۲۵ سال گذشته را حل کند، در مقایسه با نرخ ۵۳ درصدی که توسط سلف خود به دست آمده بود. برای المپیاد جهانی ریاضی ۲۰۲۴، AlphaGeometry 2 مسئله ۴ را در عرض ۱۹ ثانیه پس از دریافت رسمی‌سازی آن حل کرد.

مشخصات فنی سیستم‌های هوش مصنوعی AlphaProof و AlphaGeometry 2

Tech Specs

  • مدل پایه: مدل زبان از پیش آموزش دیده
  • داده‌های آموزشی: میلیون‌ها مسئله ریاضی به زبان رسمی
  • الگوریتم یادگیری: AlphaZero
  • وظیفه: اثبات قضایای ریاضی

افق‌های جدید در استدلال ریاضی

به عنوان بخشی از کار المپیاد جهانی ریاضی ما، ما همچنین با یک سیستم استدلال زبان طبیعی آزمایش کردیم که بر اساس Gemini و تحقیقات اخیر ما برای فعال کردن مهارت‌های حل مسئله پیشرفته ساخته شده است. این سیستم نیازی به ترجمه مسائل به یک زبان رسمی ندارد و می‌تواند با سایر سیستم‌های هوش مصنوعی ترکیب شود. ما همچنین این رویکرد را روی مسائل المپیاد جهانی ریاضی امسال آزمایش کردیم و نتایج نویدبخش بود.

تیم‌های ما به کاوش رویکردهای مختلف هوش مصنوعی برای پیشبرد استدلال ریاضی ادامه می‌دهند و قصد دارند جزئیات فنی بیشتری را در مورد AlphaProof منتشر کنند.

ما برای آینده‌ای هیجان‌زده هستیم که در آن ریاضیدانان با ابزارهای هوش مصنوعی برای کاوش فرضیه‌ها، امتحان کردن رویکردهای جدید جسورانه برای حل مسائل طولانی‌مدت و تکمیل سریع عناصر زمان‌بر اثبات‌ها همکاری می‌کنند – و جایی که سیستم‌های هوش مصنوعی مانند Gemini در ریاضیات و استدلال گسترده‌تر توانمندتر می‌شوند.


Share.
Exit mobile version