تا همین چندی پیش، تمام توجه رسانهها و افکار عمومی به مدلهای زبانی بزرگ (LLM) معطوف بود؛ سیستمهای هوشمندی که با مهارت تمام مینویسند، کدنویسی میکنند و به پیچیدهترین پرسشها پاسخ میدهند. اما بررسی روند فعلی صنعت و برنامهریزی توسعهدهندگان پیشرو نشان میدهد که هوش مصنوعی در حال عبور از یک پیچ تاریخی است: گذار از فضای دیجیتال و ورود به عرصه «هوش مصنوعی تجسمیافته» (Embodied AI).
در این پارادایم جدید، هوش مصنوعی دیگر محدود به چتباتها و صفحات نمایشگر نیست. ما به زودی با موجی از رباتهای انساننما، خودروهای کاملاً خودران، ماشینآلات هوشمند صنعتی و پهپادهای تصمیمگیرنده روبهرو خواهیم شد که کالبد فیزیکی پیدا کردهاند و در دنیای ما قدم میگذارند.
کارشناسان معتقدند تفاوت بنیادین این رویکرد جدید، در ماهیت عملکرد آنهاست. یک چتبات در امنترین حالت ممکن، تنها در فضای سرورها «فکر میکند»؛ اما یک سیستم تجسمیافته با چالشهای جهانِ بینظم و پیشبینیناپذیرِ واقعی مواجه است. چنین سیستمی باید بتواند محیط پیرامون خود را در لحظه درک کند، بر اساس متغیرهای فیزیکی تصمیم بگیرد، برای انجام وظایفش برنامهریزی دقیقی داشته باشد و مهمتر از همه، از تعامل با محیط اطرافش بیاموزد.
نکته جالب توجه در این تحول بزرگ، همزمانی آن با گسترش پروژههای متنباز (Open-Source) است. امروز انحصار توسعه مدلهای زبانی شکسته شده و پژوهشگران مستقل نیز میتوانند با بهرهگیری از فریمورکهایی مانند PyTorch و سختافزارهای پردازشی مناسب، مدلهای اختصاصی خود را از پایه آموزش دهند. این دموکراتیزه شدن فناوری، سرعت توسعه را دوچندان کرده است.
برآیند این تحولات نشان میدهد که آینده این صنعت، در نقطه تلاقی سه رکن کلیدی یعنی «مدلهای زبانی»، «عاملهای هوشمند (AI Agents)» و «هوش مصنوعی تجسمیافته» رقم خواهد خورد. به بیان سادهتر، الگوریتمی که امروز در حال تولید متن برای شماست، فردا در جایگاه پردازشگر مرکزی یک ربات فیزیکی ایفای نقش خواهد کرد.
اکنون پرسش اساسی این است: در چشمانداز پنج سال آینده، آیا بزرگترین تحولات فناوری را همچنان در قالب نرمافزارها و دستیارهای متنی خواهیم دید، یا باید منتظر رباتهایی باشیم که جهان فیزیکی را میبینند، درک میکنند و در آن دست به عمل میزنند؟

