اکانت لینکدین استاد هوش مصنوعی
دکتری: مهندسی برق، دانشگاه صنعتی شریف، ایران (۱۳۹۴)
عنوان رساله: تخمین شدت واحدهای کنشی چهره با استفاده از مشخصه های تنکی آنها
منبع جداول : دانشگاه علم و صنعت
در چند سال اخیر، الگوریتمهای هوش مصنوعی توسعه زیادی پیدا کردهاند و در زندگی روزمره تاثیرگذار شدهاند و حتی به زندگی شخصی افراد نفوذ کردهاند. به همین دلیل، نیاز به تدوین چارچوب و سند نسبت گذشته بسیار بیشتر احساس میشود.
به صورت ساده، هوش مصنوعی شامل تمام الگوریتمهایی میشود که انجام دادن آنها توسط انسان نیاز به تفکر دارد. در حوزه بینایی کامپیوتر، هوش مصنوعی کاربردهای بسیار گستردهای از سیستمهای کنترل کیفیت تا نظارت تصویری و حتی تولید تصویر دارد.
ماشینها هم از هر شیئ ویژگیهای مختلفی مانند رنگ و اندازه را استخراج میکنند تا بتوانند بر اساس آنها تصمیمگیری کنند. با این حال، بسیار از مدلهای موجود برای یک وظیفه خاص آموزش میبینند و تنها همان وظیفه را میتوانند به خوبی انجام دهند و توانایی استدلال ندارند. در سالهای اخیر، مدلهای فونداسیون با استفاده از مجموعهدادههای بزرگ به سمتی رفتهاند که توانایی استدلال هم داشته باشند.
در حال حاضر، نمیتوان گفت مدلهای بینایی مانند انسانها میبینند، اما بسیاری از اطلاعات موجود در تصویر را به خوبی استخراج میکنند. با توسعه مدلهای فونداسیون میتوان امیدوار بود که ماشینها بتوانند در آیندهای نزدیک، رابطه بین اجزاء تصویر را بهتر درک کنند و اطلاعات بسیار بیشتری را از تصویر استخراج نمایند و عملکرد آنها نسبت به ما هم بهتر شود.
در بینایی ماشین، به دنبال آموزش مدلهایی هستیم که بتوانند وظایف مرتبط با بینایی را به خوبی انجام دهند و حتی از انسانها عملکرد بهتری داشته باشند. در انسانها هم تصویر محیط توسط چشم ثبت و توسط مغز پردازش میشود اما پردازشی که توسط شبکههای عصبی مصنوعی انجام میشود با پردازشی که توسط مغز انسانها انجام میشود لزوما مشابه نیست.
الگوریتمهای مختلفی در دسترس قرار دارد از جمله در حوزه شناسایی چهره، تولید تصویر، تشخیص اشیاء و ردیابی اشیاء. بازار اپلیکیشنها و سیستمهایی که از بینایی ماشین بهره میبرند، همچنان در حال رشد است. برخی از اپلیکیشنهای معروف شامل Google Lens، Microsoft Azure Computer Vision، و Amazon Rekognition هستند که از این فناوری برای تشخیص تصاویر و ویدئوها استفاده میکنند.
بسیاری از مسائل حوزه بینایی کامپیوتر پیچیدگی زیادی دارند و با استفاده از روشهای سنتی هوش مصنوعی نمیتوان به پاسخ قابل قبولی برای آنها دست یافت. با ظهور یادگیری عمیق و توانایی یادگیری از حجم زیادی از دادههای تصویری، کااربردهای بسیار زیادی برای بینایی کامپیوتر به وجود آمده است.
در ماشینهای موجود، تصویر دیجیتال به صورت یک ماتریس از اعداد (که رنگ پیکسلها را مشخص میکنند) وارد مدل میشود و مدل با استفاده از فرمولهای ساده ریاضی، به صورت سلسلهمراتبی از این ماتریس ویژگیهای جدیدی را استخراج میکند تا بتواند اطلاعات خواسته شده را از این ماتریس استخراج نماید.
در حوزه تشخیص پلاک و شناسایی چهره اپلیکیشنهای متعددی توسعه یافته است و به صورت روزمره استفاده میشود. در حوزه کنترل کیفیت و خطوط تولید، بینایی ماشین کاربرد زیادی داشته است. همچنین، در حوزه پردازش تصاویر هوایی (پهپادها و کوادکوپترها و …) پروژههای خوبی انجام شده است. در حوزه تشخیص پزشکی نیز برنامههای خوبی توسعه یافته است. در مجموع تیمهای خوبی در این زمینه فعال هستند و تعداد محصولات بسیار بیشتر از چیزی است که اشاره شد.
در خودروهای خودران از سنسورهای مختلفی استفاده میشود که شامل تعدادی دوربین نیز میشود. برای پردازش این تصاویر و ترکیب اطلاعات آنها با سنسورهای دیگر، به طور معمول از یادگیری عمیق و حجم بسیار زیادی داده آموزشی استفاده میشود تا بتوانند در شرایط مختلف عملکرد مطلوبی داشته باشند.
یکی از کاربردهای متداول پردازش تصاویر پزشکی، تشخیص مرز اشیاء مختلف از جمله تومورها است. بدست آوردن این ناحیهها، به پزشکان برای تشخیص بیماری و همچنین انجام عمل جراحی با دقت بالا کمک میکند. علاوهبراین، با توسعه هوش مصنوعی، میتوان درمانهای شخصیسازی شده برای افراد مختلف بر اساس شرایط آنها طراحی کرد.
مدلهای مولد برای تولید تصاویر ساختگی واقعگرایانه پیشرفت زیادی داشتهاند و با استفاده از آنها میتوان تصاویر و ویدئوهایی ایجاد کرد که به واقعیت بسیار نزدیک هستند و تشخیص ساختگی بودن آنها دشوار است.
با توسعه مدلهای بزرگ زبانی-بینایی، الگوریتمهای یادگیری بدون نمونه (Zero-Shot Learning) توسعه پیدا خواهند کرد و برای توسعه یک کاربرد جدید، بجای جمعآوری مجموعهداده بزرگ، کافی است با مدل گفتگو کرد. همچنین، با توسعه مدلهای مولد، میتوان فیلمهای واقعگرایانه را تنها بر اساس یک متن ایجاد کرد.
صنایعی که در کشور گردش مالی بالایی دارند (مانند صنایع پتروشیمی، صنایع فولاد، کشاورزی، معدن و …) نیاز زیادی به الگوریتمهای بینایی ماشین دارند. همچنین، استفاده از بینایی کامپیوتر در صنعت انمیشن نیز کاربرد زیادی خواهد داشت.
بله، الگوریتمهای بینایی کامپیوتر که مبتنی بر یادگیری هستند، وابستگی زیادی به دادههای آموزشی خود دارند و در مقالات متعددی به سوگیری مدلهای یادگیری عمیق پرداخته شده است. تهیه مجموعهدادههای بدون سوگیری تاثیر زیادی در مقابله با این چالش دارد. همچنین، با توجه به پرهزینه بودن توسعه مدلهای بینایی بزرگ، توسعه چنین مدلهایی محدود به چند شرکت بزرگ شده است که منجر به سوگیری توسعه مدلهای بینایی ماشین خواهد شد.
تصویب قوانین مناسب و استفاده از فناوریهای امنیتی میتواند از سوءاستفاده از سیستمهای تشخیص چهره جلوگیری کند. ایجاد سازمانهای نظارتی و آموزش جامعه نیز نقش مهمی در حفاظت از حریم خصوصی افراد دارد. استفاده از رمزنگاری و تکنیکهای ناشناسسازی نیز به حفظ اطلاعات کمک میکند.
مدلهای بینایی توسعه یافته هنوز توانایی استدلال بالایی ندارند و میتوانند مورد حمله قرار بگیرند و عملکرد آنها مختل شود. همچنین، تفسیر کردن دانش آموخته شده توسط مدلهای بینایی ماشین یک چالش مهم است و در بسیاری از مواقع، مدلهای بزرگ را به صورت جعبه سیاه تعریف میکنند. تولید دادههای ساختگی شبیه به واقعی میتواند برای جامعه خطرات زیادی داشته باشد.
برای فائق آمدن بر چالش جمعآوری دادههای بومی، میتوان همکاریهای مشترک بین سازمانها و دانشگاهها ایجاد کرد و از تکنیکهای پیشپردازش برای ناشناسسازی دادهها استفاده نمود. همچنین، تدوین قوانین شفاف و ارائه مشوقها میتواند به افزایش تمایل به اشتراکگذاری دادهها کمک کند.
برای رفع مشکل کمبود زیرساختهای سختافزاری، میتوان از خدمات ابری مثل سیمرغ امیرکبیر استفاده کرد. ایجاد مشوقهایی از جمله گرنت به دانشجویان و شرکتهای دانشبنیان میتواند این زیستبوم را تقویت کند. در نهایت، زمانیکه شرکتها بتوانند از هوش مصنوعی درآمدزایی مناسبی بدست بیاورند، خودشان برای ایجاد زیرساختهای مناسب هزینه نمایند.
در حال حاضر، زیرساخت پردازشی و مجموعهداده دو چالش مهم هستند. با این حال، شناخت درست قابلیتهای هوش مصنوعی و سرمایهگذاری هدفمند میتواند منجر به توسعه شرکتهایی شود که بر این موانع غلبه کنند.
آینده بینایی ماشین بسیار روشن است، با پیشرفتهای بزرگی که در دقت و سرعت الگوریتمهای بینایی ماشین ایجاد شده است و کاربردهای فراوانی که در صنایع مختلف دارند. فناوریهای جدید مانند تحلیلهای چندمنظوره و چندگانه در حال توسعه هستند. در ده سال آینده، ترکیب اطلاعات مختلف مانند صوت و مکان با تصاویر برای تحلیل دقیقتر، نقش کلیدی خواهد داشت. این پیشرفتها میتوانند کاربردهای وسیعتری در صنایع مختلف ایجاد کنند.
با توجه به اهمیت هوش مصنوعی در آینده، وجود چنین سازمانی برای کشور ضروری است. این سازمان باید تلاش کند موانع موجود در توسعه هوش مصنوعی را شناسایی کند و برای رفع آنها تلاش نماید تا شرکتهای خصوصی بتوانند در این زمینه فعالیت موفقی داشته باشند.
گسترش فناوری بینایی ماشین میتواند تأثیر زیادی بر بازار کار بگذارد. برخی مشاغل سنتی ممکن است منسوخ شوند، اما در عوض مشاغل جدیدی در زمینه توسعه، مدیریت و نگهداری این فناوریها ایجاد خواهند شد. توانایی تطبیق با تغییرات و کسب مهارتهای جدید برای افراد حیاتی خواهد بود. این تحول میتواند فرصتهای شغلی جدید و متنوعی ایجاد کند.
تصویب قوانین مناسب و استفاده از فناوریهای امنیتی میتواند از سوءاستفاده از سیستمهای تشخیص چهره جلوگیری کند. ایجاد سازمانهای نظارتی و آموزش جامعه نیز نقش مهمی در حفاظت از حریم خصوصی افراد دارد. استفاده از رمزنگاری و تکنیکهای ناشناسسازی نیز به حفظ اطلاعات کمک میکند.
شغل مناسب با درآمد مطلوب میتواند از مهمترین عوامل حفظ نخبگان باشد. برای دستیابی به این هدف، باید از توسعه و رشد شرکتهای خصوصی فعال در زمینه هوش مصنوعی حمایت کرد. استفاده مناسب از هوش مصنوعی میتواند خدمات قابل توجهی به جامعه ارائه دهد و متخصصان این حوزه نیز از درآمد خوبی برخوردار شوند.
مدلهای فونداسیون زبانی-بینایی تحولات زیادی در حوزه بینایی کامپیوتر ایجاد خواهند کرد.
یکی از عواملی که مانع استفاده از هوش مصنوعی در حوزههایی مانند مراقبتهای بهداشتی شده، همین مسئله است. در سالهای اخیر، تلاشهای زیادی برای تفسیر مدلهای یادگیری عمیق صورت گرفته، اما هنوز نتایج رضایتبخشی به دست نیامده است.
تا کنون الهام گیری از زیستشناسی در هوش مصنوعی باعث پیشرفتهای زیادی شده است. ادامه این روند میتواند به توسعه سیستمهای هوشمندتر و کارآمدتر کمک کند. مطالعه مغز و شبکههای عصبی زیستی، الگوریتمهایی پیچیدهتر و توانمندتر ایجاد میکند که شبیه به فرآیندهای طبیعی عمل میکنند و به پیشرفتهای بزرگی در حوزههای مختلف هوش مصنوعی منجر میشود.
از هیجانانگیزترین کاربردهای این مدلها میتوان به تولید تصاویر واقعگرایانه، ارتقای کیفیت تصاویر، و تغییر سبک هنری تصاویر اشاره کرد. این پیشرفتها امکانپذیریهای جدیدی را در حوزههای مختلفی مانند هنر، پزشکی و تولید محتوا فراهم میکنند. به عنوان مثال، میتوان با یک جمله ساده از این مدلها خواست تا یک فیلم کامل راجع به آن تولید کنند.
Bishop, Christopher M., and Hugh Bishop. Deep learning: Foundations and concepts. Springer Nature, 2023.
Zhang, Aston, et al. Dive into deep learning. Cambridge University Press, 2023.
Chollet, Francois. Deep learning with Python. Simon and Schuster, 2021.
یادگیری ریاضیات مورد نیاز (جبرخطی، آمار و احتمال و …)، مطالعه کتابهای پایه، سپس مطالعات مقالات مرتبط در حوزه پژوهشی، و شرکت در مسابقات هوش مصنوعی و انجام پروژههای واقعی
استفاده از ابزارهای کدنویسی مبتنی بر هوش مصنوعی مانند Cursor.
صبر و حوصله. زیرا بسیاری از ایدهها به نتیجه نمیرسند و توسعه یک الگوریتم هوش مصنوعی جدید نیاز به صبر و حوصله دارد.
برای مشاهده و ارسال فرم به برگه کامل بروید.
در بخش نظرات سوالات خود را مطرح نمایید تا در مصاحبههای بعدی مورد استفاده قرار گیرد.
بزودی مصاحبه با دکتر اخایی نیز منتشر خواهد شد.
۱۰۰ فرد تأثیرگذار حوزه هوش مصنوعی از دید رسانه هوش مصنوعی سیمرغ هوش مصنوعی در…
ChatGPT Pulse آغازگر نسلی تازه از دستیارهای هوش مصنوعی است؛ این مدل از پاسخ به…
نقشه راه فریلنسرها برای تامین امنیت آینده شغلی در عصر هوش مصنوعی فهرست دسترسی سریعنقشه…
راهنمای راهاندازی مدل Grok 4 در Cursor با استفاده از xAI API مدلهای هوش مصنوعی…
مرورگرها مدتهاست فقط وسیلهای برای باز کردن وبسایتها بودهاند، اما حالا با معرفی مرورگر Genspark…
بهینهسازی پرامپتها در GPT-5 با استفاده از «Prompt Optimizer» با معرفی خانواده مدلهای GPT-5، اوپناِیآی…