در تاریخ ۲۲ مه ۲۰۲۵، شرکت Anthropic نسل جدیدی از مدلهای هوش مصنوعی خود را با نامهای Claude Opus 4 و Claude Sonnet 4 معرفی کرد. این مدلها با هدف ارتقاء توانمندیهای کدنویسی، استدلال پیشرفته و عملکرد عاملهای هوشمند طراحی شدهاند و استانداردهای جدیدی را در این حوزهها بازتعریف میکنند.
Claude Opus 4 در آزمونهای SWE-bench با امتیاز ۷۲.۵٪ و Terminal-bench با امتیاز ۴۳.۲٪ پیشتاز است و بهعنوان قدرتمندترین مدل کدنویسی معرفی شده است. این مدل قابلیت اجرای وظایف پیچیده و طولانیمدت را دارد و میتواند بهصورت مداوم برای چندین ساعت فعالیت کند، که این ویژگی آن را از مدلهای قبلی متمایز میسازد.
شرکتهای مختلفی مانند Cursor، Replit، Block و Rakuten عملکرد برتر Opus 4 را در پروژههای خود تأیید کردهاند. بهعنوان مثال، Rakuten از این مدل برای بازسازی یک پروژه متنباز بهمدت ۷ ساعت استفاده کرده است.
Claude Sonnet 4 نسخه ارتقاءیافتهای از Sonnet 3.7 است که با امتیاز ۷۲.۷٪ در آزمون SWE-bench عملکرد قابلتوجهی دارد. این مدل با تمرکز بر بهرهوری و دقت در پیروی از دستورالعملها، برای استفادههای داخلی و خارجی مناسب است.
GitHub اعلام کرده است که از Sonnet 4 در نسخه جدید GitHub Copilot استفاده خواهد کرد. همچنین، شرکتهایی مانند Manus، iGent و Sourcegraph بهبودهای این مدل در درک دستورالعملهای پیچیده و توسعه نرمافزار را گزارش دادهاند.
هر دو مدل Claude Opus 4 و Sonnet 4 دارای قابلیتهای پیشرفتهای هستند که شامل موارد زیر میشود:
Claude Code اکنون بهصورت عمومی در دسترس است و امکاناتی مانند:
همچنین، یک SDK قابل توسعه برای Claude Code منتشر شده است که به توسعهدهندگان امکان ساخت عاملها و برنامههای سفارشی را میدهد.
چهار قابلیت جدید در API شرکت Anthropic معرفی شده است:
مدلهای Claude Opus 4 و Sonnet 4 بهصورت هیبریدی طراحی شدهاند و دو حالت عملکرد دارند:
این مدلها در برنامههای Pro، Max، Team و Enterprise در دسترس هستند و Sonnet 4 همچنین برای کاربران رایگان نیز قابل استفاده است.
علاوه بر قابلیتهای جدید، رفتار مدلها در استفاده از میانبرها یا راههای میانبر برای تکمیل وظایف به میزان ۶۵٪ کاهش یافته است. همچنین، Claude Opus 4 در زمینه حافظه عملکرد بهتری نسبت به مدلهای قبلی دارد و میتواند فایلهای حافظهای ایجاد و نگهداری کند تا آگاهی بلندمدت از وظایف را بهبود بخشد.
برای مدلهای Claude 4، خلاصهسازی تفکر با استفاده از مدلهای کوچکتر معرفی شده است تا فرآیندهای فکری طولانی را فشرده کند. این خلاصهسازی تنها در حدود ۵٪ مواقع مورد نیاز است و برای کاربران پیشرفته، حالت Developer Mode برای دسترسی کامل به زنجیرههای فکری خام در دسترس است.
این مدلها گامی بزرگ بهسوی همکار مجازی هستند که میتوانند زمینه کامل را حفظ کرده، تمرکز بر پروژههای طولانیمدت را ادامه داده و تأثیر تحولآفرینی داشته باشند. با آزمایشها و ارزیابیهای گسترده برای کاهش ریسک و افزایش ایمنی، این مدلها در سطوح بالای ایمنی هوش مصنوعی مانند ASL-3 پیادهسازی شدهاند.
برای شروع، میتوانید از Claude، Claude Code یا پلتفرم مورد نظر خود استفاده کنید. همچنین، بازخوردهای شما به ما در بهبود این مدلها کمک میکند.
دادههای بنچمارک عملکرد از منابع مختلفی مانند OpenAI، Gemini و Claude جمعآوری شدهاند. مدلهای Claude 4 در آزمونهای مختلفی مانند SWE-bench Verified، Terminal-bench، TAU-bench، GPQA Diamond، MMMLU، MMMU و AIME عملکرد قویای از خود نشان دادهاند. برای اطلاعات بیشتر در مورد روششناسی این آزمونها، به پیوست مراجعه کنید.
با معرفی Claude 4، شرکت Anthropic گامی مهم در توسعه مدلهای هوش مصنوعی برداشته است که میتواند تأثیرات قابلتوجهی در زمینههای مختلفی مانند کدنویسی، تحقیق، نوشتن و کشف علمی داشته باشد.
Sora 2: نسل جدید تولید ویدئو و صدا با هوش مصنوعی OpenAI تازهترین مدل خود…
۱۰۰ فرد تأثیرگذار حوزه هوش مصنوعی از دید رسانه هوش مصنوعی سیمرغ هوش مصنوعی در…
ChatGPT Pulse آغازگر نسلی تازه از دستیارهای هوش مصنوعی است؛ این مدل از پاسخ به…
نقشه راه فریلنسرها برای تامین امنیت آینده شغلی در عصر هوش مصنوعی فهرست دسترسی سریعنقشه…
راهنمای راهاندازی مدل Grok 4 در Cursor با استفاده از xAI API مدلهای هوش مصنوعی…
مرورگرها مدتهاست فقط وسیلهای برای باز کردن وبسایتها بودهاند، اما حالا با معرفی مرورگر Genspark…