کلود فِیبل ۵ و کلود میتوس ۵ معرفی شدند

تحریریه هوش مصنوعی سیمرغ

5 روز ago

مدل تازه با توانمندی بالاتر، قیمت کمتر و محدودیت‌های امنیتی سخت‌گیرانه‌تر

سازنده مدل‌های کلود از عرضه دو مدل تازه با نام‌های Claude Fable 5 و Claude Mythos 5 خبر داد؛ محصولاتی که به گفته این شرکت، در میان پیشرفته‌ترین مدل‌هایی قرار می‌گیرند که تاکنون به‌صورت عمومی ارائه شده‌اند و در عین حال با مجموعه‌ای از تدابیر ایمنی جدید منتشر می‌شوند. بر اساس این اعلام، فِیبل ۵ برای استفاده عمومی در دسترس قرار گرفته، اما میتوس ۵ فعلا فقط برای گروهی محدود از شرکای مورد اعتماد و برخی کاربران تخصصی عرضه می‌شود.

به گفته سازنده، فِیبل ۵ از نظر توانایی در بیشتر بنچمارک‌های آزموده‌شده، از تمام مدل‌های عمومی قبلی این مجموعه عملکرد بهتری دارد و در حوزه‌هایی مانند مهندسی نرم‌افزار، کارهای دانشی، بینایی ماشین، پژوهش‌های علمی و چندین زمینه دیگر، نتایج چشمگیری ثبت کرده است. در این اعلام همچنین تاکید شده است که هرچه یک وظیفه طولانی‌تر و پیچیده‌تر باشد، فاصله عملکرد فِیبل ۵ با مدل‌های پیشین بیشتر می‌شود.

با این حال، سازنده این مدل‌ها تصریح کرده است که عرضه چنین مدلی بدون ملاحظات امنیتی می‌تواند خطرآفرین باشد؛ به‌ویژه در حوزه‌هایی مانند امنیت سایبری که ممکن است از چنین توانایی‌هایی برای آسیب جدی سوءاستفاده شود. به همین دلیل، فِیبل ۵ همراه با سامانه‌های تشخیص و فیلتر محتوای حساس عرضه شده است تا در برخی موضوعات، پاسخ به‌جای این مدل، از مدل بعدی و کم‌خطرتر، یعنی Claude Opus 4.8، ارائه شود. این شرکت می‌گوید این تدابیر به‌صورت محافظه‌کارانه تنظیم شده‌اند و در کمتر از ۵ درصد نشست‌ها فعال می‌شوند، هرچند در برخی موارد ممکن است درخواست‌های بی‌خطر را هم به‌اشتباه مشکوک تشخیص دهند.

در کنار فِیبل ۵، مدل Claude Mythos 5 نیز برای گروه کوچکی از مدافعان امنیت سایبری و ارائه‌دهندگان زیرساخت معرفی شده است. این مدل همان زیرساخت اصلی فِیبل ۵ را دارد، اما بخشی از محدودیت‌های امنیتی آن در حوزه‌های خاص برداشته شده است. نسخه میتوس ۵ در آغاز از طریق Project Glasswing و با همکاری دولت آمریکا، به‌عنوان ارتقای نسخه Claude Mythos Preview عرضه می‌شود و سازنده می‌گوید این مدل، قوی‌ترین توانمندی‌های امنیت سایبری را در میان مدل‌های موجود در جهان دارد. همچنین برنامه‌ریزی شده است که دسترسی به آن به‌تدریج از طریق یک برنامه گسترده‌تر «دسترسی مورد اعتماد» افزایش یابد.

سازنده کلود همچنین مدعی است که توانایی‌های این مدل‌ها می‌تواند در حوزه‌های مثبت و اثرگذار نیز به‌کار گرفته شود. در نمونه‌هایی که به آن اشاره شده، این مدل‌ها به مدافعان امنیت کمک کرده‌اند تا نرم‌افزارهای حیاتی را ایمن‌تر کنند و در پژوهش‌های علوم زیستی نیز به طرح فرضیه‌های تازه و سرعت‌بخشیدن به توسعه درمان‌های نو کمک کرده‌اند.

از نظر قیمت‌گذاری، فِیبل ۵ و میتوس ۵ با نرخ ۱۰ دلار برای هر یک میلیون توکن ورودی و ۵۰ دلار برای هر یک میلیون توکن خروجی عرضه می‌شوند؛ رقمی که به گفته سازنده، کمتر از نصف قیمت Claude Mythos Preview است. این شرکت تاکید کرده است که هدف آن، رساندن توانمندی‌های پیشرفته هوش مصنوعی به شمار بیشتری از کاربران، با سرعت بیشتر و در عین حال با ایمنی بالاتر است.

در بخش ارزیابی فنی، این مدل‌ها نسبت به نسل‌های قبلی کلود قابلیت کار مستقل برای مدت طولانی‌تری دارند. در حوزه مهندسی نرم‌افزار، گزارش شده است که شرکت Stripe در آزمایش‌های اولیه اعلام کرده فِیبل ۵ توانسته است کاری را که به‌طور معمول ماه‌ها زمان می‌برد، در چند روز فشرده کند. در یک پایگاه کد روبی با ۵۰ میلیون خط کد نیز این مدل توانسته است مهاجرتی سراسری را در یک روز انجام دهد؛ کاری که در حالت دستی برای یک تیم کامل بیش از دو ماه زمان می‌برد. همچنین گفته شده است که فِیبل ۵ نسبت به مدل‌های قبلی کلود از نظر مصرف توکن بهینه‌تر است و در ارزیابی FrontierCode متعلق به Cognition، در میان مدل‌های مرزی بالاترین امتیاز را کسب کرده است.

در حوزه کارهای دانشی و تحلیلی نیز عملکرد این مدل قابل توجه توصیف شده است. بر اساس اعلام سازنده، فِیبل ۵ در بنچمارک مالی Hebbia برای استدلال در سطح ارشد، بالاترین امتیاز را در میان مدل‌ها به دست آورده و در استدلال مبتنی بر اسناد، تفسیر نمودار و جدول و حل مسئله، پیشرفت چشمگیری داشته است. همچنین IMC گزارش داده که فِیبل ۵ در ارزیابی‌های مربوط به تحلیل معاملات، تقریبا در همه زمینه‌ها از جمله بازیابی اطلاعات دقیق، استدلال مفهومی، تحلیل ریشه‌ای مسائل و تحلیل ارزش مورد انتظار، عملکرد بسیار خوبی داشته است.

در بخش بینایی، فِیبل ۵ به‌عنوان مدل جدید پیشتاز معرفی شده است. این مدل بنا بر اعلام سازنده، می‌تواند اعداد دقیق را از نمودارها و شکل‌های علمی پیچیده استخراج کند و حتی وظایف دشوار بینایی‌محور مانند بازسازی کد منبع یک وب‌اپلیکیشن تنها از روی تصویر را انجام دهد. همچنین گفته شده است که این مدل به زیرساخت‌های کمکی کمتری نیاز دارد؛ برای نمونه، مدل‌های پیشین کلود حتی با ابزارهای کمکی هم در اجرای بازی Pokémon FireRed با دشواری روبه‌رو بودند، اما فِیبل ۵ توانسته است آن را تنها با اتکا به بینایی و بدون کمک اضافی به پایان برساند.

در حوزه حافظه و زمینه بلندمدت نیز فِیبل ۵ پیشرفت قابل توجهی نشان داده است. سازنده می‌گوید این مدل می‌تواند در وظایف طولانی‌مدت، تمرکز خود را روی میلیون‌ها توکن حفظ کند و از یادداشت‌های خودش برای بهبود خروجی استفاده کند. در آزمایشی مربوط به بازی Slay the Spire نیز، افزودن حافظه پایدار مبتنی بر فایل برای این مدل، نسبت به Opus 4.8 سه برابر بیشتر به بهبود عملکرد منجر شده و میزان رسیدن آن به مرحله پایانی بازی را نیز سه برابر افزایش داده است.

از سوی دیگر، نسخه میتوس ۵ در کاربردهای علمی نیز برجسته شده است. سازنده می‌گوید کارشناسان داخلی طراحی پروتئین توانسته‌اند با استفاده از این مدل، بخش‌هایی از فرایند طراحی دارو را حدود ۱۰ برابر سریع‌تر کنند. در یکی از نمونه‌ها، میتوس ۵ بدون کمک انسانی و با استفاده از ابزارهای طراحی پروتئین و زیست‌اطلاعات، توانسته است در سطحی ظاهر شود که با عملکرد اپراتورهای انسانی ماهر برابری می‌کند یا حتی از آن فراتر می‌رود. در این فرایند، مدل تمام کارهایی را انجام داده که معمولا یک دانشمند انجام می‌دهد؛ از انتخاب محل اتصال گرفته تا انتخاب و اجرای ابزارهای طراحی پروتئین و بازیابی از خطاها در طول مسیر. به گفته سازنده، ۹ مورد از ۱۴ هدف پروتئینی در این مطالعه، به نتایج امیدوارکننده‌ای برای طراحی دارو رسیده‌اند.

همچنین در علوم زیستی، میتوس ۵ به‌عنوان نخستین مدل این مجموعه معرفی شده که می‌تواند به‌طور مستمر فرضیه‌های علمی جدید و قابل توجه تولید کند. در مقایسه‌های کور و رودررو با مدل‌های هم‌رده اپوس، دانشمندان این شرکت حدود ۸۰ درصد مواقع فرضیه‌های مولکولی ارائه‌شده از سوی میتوس را ترجیح داده‌اند. علاوه بر این، یکی از فرضیه‌های این مدل درباره سازوکار تازه‌ای در یک پروتئین E. coli نیز بعدا در مطالعه‌ای مستقل تایید شده است.

در بخش ژنومیک نیز اعلام شده است که میتوس ۵ توانسته پژوهشی نو را در مدت بیش از یک هفته کار عمدتا خودمختار انجام دهد. این مدل داده‌های تک‌سلولی مربوط به میلیون‌ها سلول از ۱۳۸ گونه جانوری را گردآوری کرده و سپس یک مدل یادگیری ماشین اختصاصی طراحی و آموزش داده است تا سلول‌هایی را که وظیفه‌ای مشابه دارند، حتی در گونه‌های بسیار دور از هم، شناسایی کند. به گفته سازنده، این مدل آموزش‌دیده با ورودی انسانی در سطح بالا، از مدلی که اخیرا در نشریه Science منتشر شده بود بهتر عمل کرده، در حالی که ابعاد آن ۱۰۰ برابر کوچک‌تر بوده است. قرار است نتایج این پژوهش‌ها در ماه‌های آینده منتشر شود.

در بخش ایمنی و هم‌راستاسازی نیز سازنده اعلام کرده است که در ارزیابی‌های خودکار، سطح رفتارهای ناهماهنگ در میتوس ۵ پایین بوده و تقریبا با Opus 4.8 برابری می‌کند. با توجه به این‌که فِیبل ۵ و میتوس ۵ بر یک مدل زیربنایی مشترک استوارند، انتظار می‌رود سطح هم‌راستایی فِیبل نیز مشابه باشد. جزئیات کامل این ارزیابی‌ها در system card مدل منتشر شده است.

بر اساس برنامه اعلام‌شده، فِیبل ۵ از امروز به‌صورت عمومی در دسترس است، اما میتوس ۵ فعلا فقط برای شرکای Glasswing با محدودیت‌های امنیتی کمتر و در آینده برای برخی پژوهشگران زیست‌پزشکی در قالب برنامه دسترسی مورد اعتماد عرضه خواهد شد. همچنین توسعه‌دهنده این مدل‌ها اعلام کرده است که فِیبل ۵ از امروز برای کاربران Claude API و طرح‌های سازمانی مبتنی بر مصرف، به‌طور کامل قابل استفاده است. در طرح‌های اشتراکی نیز این مدل از امروز تا ۲۲ ژوئن بدون هزینه اضافی در طرح‌های Pro، Max، Team و Enterprise مبتنی بر صندلی ارائه می‌شود، اما از ۲۳ ژوئن استفاده از آن در این طرح‌ها نیازمند اعتبار مصرفی خواهد بود، مگر آن‌که ظرفیت اجازه دهد این بازه تمدید شود.

این رونمایی تازه، به‌گفته سازنده کلود، گامی دیگر در مسیر عرضه سریع‌تر و ایمن‌تر توانمندی‌های پیشرفته هوش مصنوعی به شمار می‌رود؛ گامی که هم بر افزایش قدرت مدل‌ها تاکید دارد و هم بر ضرورت کنترل، محدودسازی و نظارت سخت‌گیرانه بر کاربردهای پرخطر.