دو جوان ۲۲ ساله پیشنهاد چندمیلیوندلاری ایلان ماسک را رد کردند تا یک مدل هوش مصنوعی شبیه مغز انسان بسازند(تولد معماری HRM) و حالا از OpenAI و Anthropic هم پیشی گرفتهاند!
مقدمه: تولد یک جریان تازه در مسیر AGI
در دنیایی که رقابت میان مدلهای غولپیکر هوش مصنوعی هر روز شدیدتر میشود، کمتر کسی انتظار داشت یک مدل فوقالعاده کوچک و الهامگرفته از مغز انسان بتواند توجه جامعه علمی را به خود جلب کند. اما این دقیقاً همان کاری است که دو جوان ۲۲ ساله، ویلیام چن و گوان وانگ انجام دادهاند.
آنها نهتنها پیشنهاد چندمیلیوندلاری ایلان ماسک را رد کردند، بلکه مسیر متفاوتی را آغاز کردند؛ مسیری که اکنون به تولد استارتاپ Sapient Intelligence و معماری جدیدی به نام Hierarchical Reasoning Model (HRM) منجر شده؛ معماریای که برخی آن را جدیترین رقیب ترنسفورمرها میدانند.
از دبیرستان میشیگان تا آزمایشگاه مغز پکن
یک دوستی بر پایه «اهداف والا»
ویلیام چن و گوان وانگ نخستین بار در دبیرستانهای ایالت میشیگان ملاقات کردند؛ دو نوجوان که گفتگوی روز اولشان بهجای فوتبال و تفریح، درباره «هدف والای زندگی» بود.
وانگ از همان نوجوانی رؤیای ساخت AGI را در سر میپروراند؛ هدفی که آن زمان حتی نام مشخصی هم نداشت. چن نیز شیفته بهینهسازی و مهندسی بود. این همسویی فکری نقطه آغاز مسیر نامتعارف آنها شد.
تصمیمی متفاوت برای دانشگاه
چن با وجود پذیرش در دانشگاههایی مانند Carnegie Mellon، تصمیم گرفت بهجای مسیر معمول همه نخبگان رباتیک، راه وانگ را دنبال نموده و وارد دانشگاه تسینگهوا در پکن شود؛ یکی از معتبرترین مراکز مهندسی در جهان.
آنها در آزمایشگاه «علوم شناختی و هوش الهامگرفته از مغز» تسینگهوا وارد پروژهای شدند که بعدها نگاه جامعه علمی را تغییر داد.
OpenChat: مدلی کوچک که جهان هوش مصنوعی را غافلگیر کرد
مدلی کوچک، دادهای اندک، و یک نتیجه شگفتانگیز
چن و وانگ یک مدل زبانی کوچک ساختند:
- بدون میلیونها گیگابایت داده
- بدون اینترنت
- تنها با مکالمات واقعی و باکیفیت
- همراه با یادگیری تقویتی (RL)
این مدل به شکلی غیرمنتظره محبوب شد. محققان دانشگاههای بزرگ مانند استنفورد و برکلی کد آن را توسعه دادند. OpenChat تبدیل شد به نمونهای زنده از اینکه:
«کوچک اما هوشمند» میتواند بر «بزرگ اما سطحی» برتری داشته باشد.
و کمی بعد، نام مدل به ایمیل ایلان ماسک راه یافت.
لحظه سرنوشتساز: رد پیشنهاد چند میلیون دلاری ماسک
ایلان ماسک از طریق شرکت تازهتأسیس خود xAI یک پیشنهاد بزرگ برای جذب این دو جوان ارائه داد.
اما آنها تصمیم گرفتند آن را رد کنند.
چن میگوید:
«میخواستیم معماریای بسازیم که محدودیتهای مدلهای زبانی را نداشته باشد. مقیاسگذاری بینهایت، راه رسیدن به AGI نیست.»
این تصمیم، مسیر ساخت یکی از نوآورانهترین معماریهای هوش مصنوعی سالهای اخیر را آغاز کرد.
تولد Sapient Intelligence و معماری HRM
HRM چیست؟
Hierarchical Reasoning Model معماریای است که عملکرد آن بر اساس دو سیستم شناختی انسان طراحی شده:
- سیستم سریع و واکنشی
- سیستم کند و تحلیلی
ترکیب این دو، مدلی میسازد که برخلاف LLMها «حدس» نمیزند؛ فکر میکند.
آزمونهای اولیه: یک شوک برای جامعه هوش مصنوعی
در یکی از شبهای ژوئن، ساعت ۳ صبح، نتایج اولیه HRM بازگشت:
مدل ۲۷ میلیون پارامتری؛ کوچکتر از کوچکترین مدلهای رایج، در آزمونهای زیر از OpenAI، Anthropic و DeepSeek بهتر عمل کرد:
- حل سودوکوی پیشرفته
- پیدا کردن مسیر بهینه در مازهای ۳۰×۳۰
- عملکرد چشمگیر در آزمون ARC-AGI
- بدون chain-of-thought
- بدون افزایش حجم مدل
چن میگوید:
«فقط با تغییر معماری، عمق استدلال ایجاد شد.»
چرا HRM میتواند آینده AGI باشد؟
۱. کوچکتر، سریعتر، هوشمندتر
در حالی که مدلهای امروزی به سمت ۱۰۰ میلیارد پارامتر میروند، HRM نشان میدهد شاید آینده در مدلهای کممصرف باشد.
۲. کاهش شدید خطای ادراکی (Hallucination)
چن ادعا میکند HRM خطاهای رایج LLMها را تا حد قابلتوجهی کاهش میدهد.
۳. برتری در پیشبینی زمانسلسلهها
از آبوهوا و بازار مالی تا دادههای پزشکی؛ HRM در پیشبینی روندها عملکردی مشابه SOTA ارائه کرده است.
۴. قابلیت یادگیری پیوسته (Continuous Learning)
مدل میتواند بدون بازآموزی کامل، اطلاعات تازه بیاموزد؛ دقیقاً مانند مغز انسان.
گامهای بعدی Sapient Intelligence
این استارتاپ در حال:
- افتتاح دفتر آمریکا
- جذب سرمایه جدید
- بازطراحی برند
- و آمادهسازی نسخه دوم مدل HRM
است.
چن میگوید:
«AGI جام مقدس هوش مصنوعی است. و بهنظرم در دهه آینده محقق میشود.»
نتیجهگیری: آغاز رقابتی تازه در هوش مصنوعی
داستان Sapient Intelligence فقط روایت موفقیت دو جوان نیست؛
نمادی است از تغییر پارادایم در هوش مصنوعی.
مسیر آینده شاید دیگر از دل مدلهای غولپیکر نگذرد،
بلکه از معماریهایی بگذرد که بتوانند واقعاً فکر کنند.
سؤالات متداول (FAQ)
آیا HRM رقیب مستقیم ترنسفورمرهاست؟
بله؛ HRM یک معماری جدید است و هدف آن جایگزینی ترنسفورمر در کارهای پیچیده استدلالی است.
چرا OpenChat مهم بود؟
چون نشان داد کیفیت داده مهمتر از حجم داده است و مدل کوچک میتواند بزرگها را شکست دهد.
آیا Sapient Intelligence به AGI نزدیک است؟
سازندگان معتقدند HRM مسیر واقعی AGI است و دهه آینده زمان ظهور آن خواهد بود.
چرا پیشنهاد ماسک رد شد؟
چن و وانگ نمیخواستند زیرساختهای قدیمی را توسعه دهند؛ آنها به دنبال معماری جدید بودند.
همراه ما در کانال ایتا جامعه هوش مصنوعی ایران | هوش مصنوعی سیمرغ بمانید.

