جادوی حرکت در دنیای ۴ بعدی با گوگل!

گوگل به همراه دانشگاه برکلی از تکنولوژی جدیدی به نام “Shape of Motion for 4D” رونمایی کرده! این روش میتونه با استفاده از ویدیوهای کوتاه ساده، کل صحنه‌های پویا رو به صورت سه‌بعدی و با تمام جزئیات بازسازی کنه. به عبارت دیگه، میتونه کل حرکت‌های موجود تو یه ویدیو رو به صورت سه بعدی و با جزئیات کامل بازسازی کنه. عجب قابلیت ردیابی فوق العاده‌ای! سورس کد این پروژه هم برای عموم علاقه مندان منتشر شده.

نکات کلیدی:
نمایش صحنه پویا با روش جدید
تولید نماهای جدید به صورت لحظه‌ای از ویدیوهای تک‌ی
ردیابی سه بعدی مداوم برای هر نقطه در هر زمان
استفاده از قوانین فیزیکی حرکت و داده‌های قبلی برای پیش‌بینی
دستاورد جدید در زمینه حرکت سه‌بعدی و دو بعدی طولانی‌مدت و تولید نماهای جدید

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

3D Tracking Comparison

For each method, we render the video from a novel viewpoint and overlay their predicted 3D tracks onto the novel views. TAPIR + Depth Anything does not produce novel views and we instead overlay their tracks onto our renderings.

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

Novel View Synthesis Comparison

HyperNeRF

Deformable-3D-GS

Ours

HyperNeRF

Deformable-3D-GS

Ours

2D Tracking Comparison

TAPIR

Ours

TAPIR

Ours

Failure Cases

Fast motion and occlusions are challenging for our method.

Our method relies on off-the-shelf methods, e.g., mono-depth estimation, which can be incorrect.

پست جذاب میخوای؟

بهینه‌سازی موتورهای جستجوی مولد (GEO)

همه چیز در مورد گراک ۴ (Grok4)

کاربرد هوش مصنوعی در توسعه بازی‌های رایانه‌ای

همه چیز در مورد گراک ۴ (Grok4)

هوش مصنوعی Gemma 3n گوگل

V-JEPA 2 مدل جدید متا

با Perplexity Labs در ۱۰ دقیقه پروژه‌های حرفه‌ای بسازید

Runner H چیست؟ سیمرغ اتوماسیون وب در عصر هوش مصنوعی

آنتروپیک با راه‌اندازی برنامه‌ای جدید، پیامدهای اقتصادی هوش مصنوعی را زیر ذره‌بین می‌برد

مدل‌های Claude 4

ابزار هوش‌مصنوعی گوگل : معرفی ابزار Jules

پرتکرارترین سوالات کاربران ChatGPT

همه چیز در مورد گراک ۴ (Grok4)

هوش مصنوعی Gemma 3n گوگل

دیباگ خودکار با Code Researcher

V-JEPA 2 مدل جدید متا

دانشمند هوش مصنوعی: آینده علم در دستان هوش مصنوعی

دلایل اصلی شکست پروژه‌های هوش مصنوعی و راه‌های موفقیت آنها

اعتماد به موتورهای جستجوی هوشمند. آری یا خیر؟

Modern Warfare 2 – نبردی تاکتیکی بر روی PC ؛ بررسی دقیق عملکرد

کاربرد هوش مصنوعی در ردیابی گوشی گم‌شده: انقلابی در امنیت دیجیتال

احتمال می‌رود که گلکسی A54 در ۲۰۲۳ با افزایش نامحسوس ظرفیت باتری ارائه شود

تولید آیفون ۱۴، ۲۰ درصد گران‌تر از آیفون ۱۳ است

مایکروسافت قصد دارد نمای دسکتاپ یا موبایل را در نوار کناری Edge معرفی کند

همه چیز در مورد گراک ۴ (Grok4)

هوش مصنوعی Gemma 3n گوگل

دیباگ خودکار با Code Researcher

V-JEPA 2 مدل جدید متا

با Perplexity Labs در ۱۰ دقیقه پروژه‌های حرفه‌ای بسازید

Runner H چیست؟ سیمرغ اتوماسیون وب در عصر هوش مصنوعی

جدیدترین مطالب

بهینه‌سازی موتورهای جستجوی مولد (GEO)

همه چیز در مورد گراک ۴ (Grok4)

کاربرد هوش مصنوعی در توسعه بازی‌های رایانه‌ای

هوش مصنوعی در خدمت آموزش: همکاری اوپن‌ای‌آی با ۴۰۰,۰۰۰ معلم

برای دریافت جدیدترین اخبار عضو خبرنامه شوید

پست جذاب میخوای؟

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

Input Video

3D Tracks

Novel View

3D Tracking Comparison

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

HyperNeRF

Deformable-3D-GS

TAPIR + Depth Anything

Ours

Novel View Synthesis Comparison

HyperNeRF

Deformable-3D-GS

Ours

HyperNeRF

Deformable-3D-GS

Ours

2D Tracking Comparison

TAPIR

Ours

TAPIR

Ours

Failure Cases

پست‌های مشابه