مدل تازه با توانمندی بالاتر، قیمت کمتر و محدودیتهای امنیتی سختگیرانهتر
سازنده مدلهای کلود از عرضه دو مدل تازه با نامهای Claude Fable 5 و Claude Mythos 5 خبر داد؛ محصولاتی که به گفته این شرکت، در میان پیشرفتهترین مدلهایی قرار میگیرند که تاکنون بهصورت عمومی ارائه شدهاند و در عین حال با مجموعهای از تدابیر ایمنی جدید منتشر میشوند. بر اساس این اعلام، فِیبل ۵ برای استفاده عمومی در دسترس قرار گرفته، اما میتوس ۵ فعلا فقط برای گروهی محدود از شرکای مورد اعتماد و برخی کاربران تخصصی عرضه میشود.
به گفته سازنده، فِیبل ۵ از نظر توانایی در بیشتر بنچمارکهای آزمودهشده، از تمام مدلهای عمومی قبلی این مجموعه عملکرد بهتری دارد و در حوزههایی مانند مهندسی نرمافزار، کارهای دانشی، بینایی ماشین، پژوهشهای علمی و چندین زمینه دیگر، نتایج چشمگیری ثبت کرده است. در این اعلام همچنین تاکید شده است که هرچه یک وظیفه طولانیتر و پیچیدهتر باشد، فاصله عملکرد فِیبل ۵ با مدلهای پیشین بیشتر میشود.
با این حال، سازنده این مدلها تصریح کرده است که عرضه چنین مدلی بدون ملاحظات امنیتی میتواند خطرآفرین باشد؛ بهویژه در حوزههایی مانند امنیت سایبری که ممکن است از چنین تواناییهایی برای آسیب جدی سوءاستفاده شود. به همین دلیل، فِیبل ۵ همراه با سامانههای تشخیص و فیلتر محتوای حساس عرضه شده است تا در برخی موضوعات، پاسخ بهجای این مدل، از مدل بعدی و کمخطرتر، یعنی Claude Opus 4.8، ارائه شود. این شرکت میگوید این تدابیر بهصورت محافظهکارانه تنظیم شدهاند و در کمتر از ۵ درصد نشستها فعال میشوند، هرچند در برخی موارد ممکن است درخواستهای بیخطر را هم بهاشتباه مشکوک تشخیص دهند.

در کنار فِیبل ۵، مدل Claude Mythos 5 نیز برای گروه کوچکی از مدافعان امنیت سایبری و ارائهدهندگان زیرساخت معرفی شده است. این مدل همان زیرساخت اصلی فِیبل ۵ را دارد، اما بخشی از محدودیتهای امنیتی آن در حوزههای خاص برداشته شده است. نسخه میتوس ۵ در آغاز از طریق Project Glasswing و با همکاری دولت آمریکا، بهعنوان ارتقای نسخه Claude Mythos Preview عرضه میشود و سازنده میگوید این مدل، قویترین توانمندیهای امنیت سایبری را در میان مدلهای موجود در جهان دارد. همچنین برنامهریزی شده است که دسترسی به آن بهتدریج از طریق یک برنامه گستردهتر «دسترسی مورد اعتماد» افزایش یابد.
سازنده کلود همچنین مدعی است که تواناییهای این مدلها میتواند در حوزههای مثبت و اثرگذار نیز بهکار گرفته شود. در نمونههایی که به آن اشاره شده، این مدلها به مدافعان امنیت کمک کردهاند تا نرمافزارهای حیاتی را ایمنتر کنند و در پژوهشهای علوم زیستی نیز به طرح فرضیههای تازه و سرعتبخشیدن به توسعه درمانهای نو کمک کردهاند.
از نظر قیمتگذاری، فِیبل ۵ و میتوس ۵ با نرخ ۱۰ دلار برای هر یک میلیون توکن ورودی و ۵۰ دلار برای هر یک میلیون توکن خروجی عرضه میشوند؛ رقمی که به گفته سازنده، کمتر از نصف قیمت Claude Mythos Preview است. این شرکت تاکید کرده است که هدف آن، رساندن توانمندیهای پیشرفته هوش مصنوعی به شمار بیشتری از کاربران، با سرعت بیشتر و در عین حال با ایمنی بالاتر است.
در بخش ارزیابی فنی، این مدلها نسبت به نسلهای قبلی کلود قابلیت کار مستقل برای مدت طولانیتری دارند. در حوزه مهندسی نرمافزار، گزارش شده است که شرکت Stripe در آزمایشهای اولیه اعلام کرده فِیبل ۵ توانسته است کاری را که بهطور معمول ماهها زمان میبرد، در چند روز فشرده کند. در یک پایگاه کد روبی با ۵۰ میلیون خط کد نیز این مدل توانسته است مهاجرتی سراسری را در یک روز انجام دهد؛ کاری که در حالت دستی برای یک تیم کامل بیش از دو ماه زمان میبرد. همچنین گفته شده است که فِیبل ۵ نسبت به مدلهای قبلی کلود از نظر مصرف توکن بهینهتر است و در ارزیابی FrontierCode متعلق به Cognition، در میان مدلهای مرزی بالاترین امتیاز را کسب کرده است.
در حوزه کارهای دانشی و تحلیلی نیز عملکرد این مدل قابل توجه توصیف شده است. بر اساس اعلام سازنده، فِیبل ۵ در بنچمارک مالی Hebbia برای استدلال در سطح ارشد، بالاترین امتیاز را در میان مدلها به دست آورده و در استدلال مبتنی بر اسناد، تفسیر نمودار و جدول و حل مسئله، پیشرفت چشمگیری داشته است. همچنین IMC گزارش داده که فِیبل ۵ در ارزیابیهای مربوط به تحلیل معاملات، تقریبا در همه زمینهها از جمله بازیابی اطلاعات دقیق، استدلال مفهومی، تحلیل ریشهای مسائل و تحلیل ارزش مورد انتظار، عملکرد بسیار خوبی داشته است.
در بخش بینایی، فِیبل ۵ بهعنوان مدل جدید پیشتاز معرفی شده است. این مدل بنا بر اعلام سازنده، میتواند اعداد دقیق را از نمودارها و شکلهای علمی پیچیده استخراج کند و حتی وظایف دشوار بیناییمحور مانند بازسازی کد منبع یک وباپلیکیشن تنها از روی تصویر را انجام دهد. همچنین گفته شده است که این مدل به زیرساختهای کمکی کمتری نیاز دارد؛ برای نمونه، مدلهای پیشین کلود حتی با ابزارهای کمکی هم در اجرای بازی Pokémon FireRed با دشواری روبهرو بودند، اما فِیبل ۵ توانسته است آن را تنها با اتکا به بینایی و بدون کمک اضافی به پایان برساند.
در حوزه حافظه و زمینه بلندمدت نیز فِیبل ۵ پیشرفت قابل توجهی نشان داده است. سازنده میگوید این مدل میتواند در وظایف طولانیمدت، تمرکز خود را روی میلیونها توکن حفظ کند و از یادداشتهای خودش برای بهبود خروجی استفاده کند. در آزمایشی مربوط به بازی Slay the Spire نیز، افزودن حافظه پایدار مبتنی بر فایل برای این مدل، نسبت به Opus 4.8 سه برابر بیشتر به بهبود عملکرد منجر شده و میزان رسیدن آن به مرحله پایانی بازی را نیز سه برابر افزایش داده است.
از سوی دیگر، نسخه میتوس ۵ در کاربردهای علمی نیز برجسته شده است. سازنده میگوید کارشناسان داخلی طراحی پروتئین توانستهاند با استفاده از این مدل، بخشهایی از فرایند طراحی دارو را حدود ۱۰ برابر سریعتر کنند. در یکی از نمونهها، میتوس ۵ بدون کمک انسانی و با استفاده از ابزارهای طراحی پروتئین و زیستاطلاعات، توانسته است در سطحی ظاهر شود که با عملکرد اپراتورهای انسانی ماهر برابری میکند یا حتی از آن فراتر میرود. در این فرایند، مدل تمام کارهایی را انجام داده که معمولا یک دانشمند انجام میدهد؛ از انتخاب محل اتصال گرفته تا انتخاب و اجرای ابزارهای طراحی پروتئین و بازیابی از خطاها در طول مسیر. به گفته سازنده، ۹ مورد از ۱۴ هدف پروتئینی در این مطالعه، به نتایج امیدوارکنندهای برای طراحی دارو رسیدهاند.
همچنین در علوم زیستی، میتوس ۵ بهعنوان نخستین مدل این مجموعه معرفی شده که میتواند بهطور مستمر فرضیههای علمی جدید و قابل توجه تولید کند. در مقایسههای کور و رودررو با مدلهای همرده اپوس، دانشمندان این شرکت حدود ۸۰ درصد مواقع فرضیههای مولکولی ارائهشده از سوی میتوس را ترجیح دادهاند. علاوه بر این، یکی از فرضیههای این مدل درباره سازوکار تازهای در یک پروتئین E. coli نیز بعدا در مطالعهای مستقل تایید شده است.
در بخش ژنومیک نیز اعلام شده است که میتوس ۵ توانسته پژوهشی نو را در مدت بیش از یک هفته کار عمدتا خودمختار انجام دهد. این مدل دادههای تکسلولی مربوط به میلیونها سلول از ۱۳۸ گونه جانوری را گردآوری کرده و سپس یک مدل یادگیری ماشین اختصاصی طراحی و آموزش داده است تا سلولهایی را که وظیفهای مشابه دارند، حتی در گونههای بسیار دور از هم، شناسایی کند. به گفته سازنده، این مدل آموزشدیده با ورودی انسانی در سطح بالا، از مدلی که اخیرا در نشریه Science منتشر شده بود بهتر عمل کرده، در حالی که ابعاد آن ۱۰۰ برابر کوچکتر بوده است. قرار است نتایج این پژوهشها در ماههای آینده منتشر شود.
در بخش ایمنی و همراستاسازی نیز سازنده اعلام کرده است که در ارزیابیهای خودکار، سطح رفتارهای ناهماهنگ در میتوس ۵ پایین بوده و تقریبا با Opus 4.8 برابری میکند. با توجه به اینکه فِیبل ۵ و میتوس ۵ بر یک مدل زیربنایی مشترک استوارند، انتظار میرود سطح همراستایی فِیبل نیز مشابه باشد. جزئیات کامل این ارزیابیها در system card مدل منتشر شده است.
بر اساس برنامه اعلامشده، فِیبل ۵ از امروز بهصورت عمومی در دسترس است، اما میتوس ۵ فعلا فقط برای شرکای Glasswing با محدودیتهای امنیتی کمتر و در آینده برای برخی پژوهشگران زیستپزشکی در قالب برنامه دسترسی مورد اعتماد عرضه خواهد شد. همچنین توسعهدهنده این مدلها اعلام کرده است که فِیبل ۵ از امروز برای کاربران Claude API و طرحهای سازمانی مبتنی بر مصرف، بهطور کامل قابل استفاده است. در طرحهای اشتراکی نیز این مدل از امروز تا ۲۲ ژوئن بدون هزینه اضافی در طرحهای Pro، Max، Team و Enterprise مبتنی بر صندلی ارائه میشود، اما از ۲۳ ژوئن استفاده از آن در این طرحها نیازمند اعتبار مصرفی خواهد بود، مگر آنکه ظرفیت اجازه دهد این بازه تمدید شود.
این رونمایی تازه، بهگفته سازنده کلود، گامی دیگر در مسیر عرضه سریعتر و ایمنتر توانمندیهای پیشرفته هوش مصنوعی به شمار میرود؛ گامی که هم بر افزایش قدرت مدلها تاکید دارد و هم بر ضرورت کنترل، محدودسازی و نظارت سختگیرانه بر کاربردهای پرخطر.