علائم راهنمایی و رانندگی : تشخیص با دقت بیش از ۹۰ درصد

0

هوش مصنوعی جایگزین چشمان راننده می‌شود؛ تشخیص خودکار علائم راهنمایی و رانندگی با دقت بالاتر از ۹۰ دردصد | تحلیل مقالات مرتبط

علائم راهنمایی و رانندگی
عنوان مقاله: “Traffic Sign Detection and Recognition using Features Combination and Random Forests”

نویسندگان: Ayoub Ellahyani، Mohamed El Ansari، Ilyas El Jaafari و Said Charfi
موسسه: دانشگاه ابن زهر، مراکش، دانشکده علوم، بخش علوم کامپیوتر
مجله: (IJACSA) International Journal of Advanced Computer Science and Applications
سال انتشار: ۲۰۱۶
مقاله به معرفی سیستمی برای تشخیص و شناسایی علائم ترافیکی با استفاده از ترکیب ویژگی‌ها و طبقه‌بند جنگل تصادفی می‌پردازد و نتایج آزمایشات روی مجموعه‌داده‌ای از علائم ترافیکی سوئدی را ارائه می‌کند.

۱. مقدمه

سیستم‌های پیشرفته کمک راننده (ADAS) امروزه به سرعت در حال توسعه و پیشرفت هستند و نقش پررنگی در صنعت خودروسازی ایفا می‌کنند. این سیستم‌ها با بهره‌گیری از تکنولوژی‌های نوین بینایی ماشین، حسگرهای پیشرفته و شبکه‌های ارتباطی خودرو، قادرند اطلاعات جامعی از محیط اطراف خودرو استخراج کنند. با این حال یکی از مهم‌ترین چالش‌های این سیستم‌ها، درک دقیق و آنی محیط رانندگی و به ویژه تشخیص علائم راهنمایی و رانندگی در این محیط‌هاست.

علائم راهنمایی و رانندگی به عنوان راهنماهای بصری، نقش حیاتی در ایمنی و تسهیل ترافیک ایفا می‌کنند. با این حال، عوامل متعددی همچون شرایط نامساعد جوی، نورپردازی نامناسب، فرسودگی علائم و تداخل نوری خودروهای دیگر، می‌توانند به شدت در تشخیص صحیح این علائم اختلال ایجاد کنند و منجر به بروز حوادث ناگوار شوند.

در همین راستا، توسعه سیستم‌های هوشمند تشخیص علائم راهنمایی و رانندگی مبتنی بر بینایی ماشین، گامی مهم در جهت ارتقای ایمنی جاده‌ها و خودکارسازی خودروها محسوب می‌شود. این سیستم‌ها علاوه بر کاربرد در خودروهای مجهز به ADAS، در حوزه‌های دیگری همچون نظارت بر ترافیک شهری، توسعه خودروهای خودران و مدیریت هوشمند زیرساخت‌های شهری نیز کاربرد گسترده‌ای دارند.

با وجود پیشرفت‌های چشمگیر در این حوزه، تشخیص دقیق و سریع علائم راهنمایی و رانندگی همچنان با چالش‌های جدی مواجه است. تغییرات شدید نور محیط، انسداد علائم توسط موانع، تغییر شکل علائم در اثر عوامل محیطی و کیفیت پایین تصاویر ویدئویی از جمله مهم‌ترین این چالش‌ها هستند.

در این پژوهش، یک سیستم تشخیص علائم راهنمایی و رانندگی مبتنی بر بینایی ماشین ارائه شده است که با بهره‌گیری از الگوریتم‌های پیشرفته پردازش تصویر و یادگیری عمیق، ادعا دارد قادر به غلبه بر چالش‌های مذکور و تشخیص دقیق و سریع علائم در شرایط مختلف رانندگی است.

۲. بررسی روش‌های تشخیص و شناسایی علائم راهنمایی و رانندگی در پژوهش‌های گذشته

تشخیص و شناسایی دقیق علائم راهنمایی و رانندگی (Traffic Sign Recognition یا TSR) از اهمیت بالایی در توسعه سیستم‌های کمک راننده و خودروهای خودران برخوردار است. در سال‌های اخیر، پژوهشگران روش‌های متنوعی را برای این منظور پیشنهاد داده‌اند که هر یک مزایا و محدودیت‌های خاص خود را دارند.

الف. تشخیص علائم راهنمایی و رانندگی

هدف اصلی در این مرحله، یافتن موقعیت دقیق علائم در تصاویر است. از آنجایی که علائم معمولاً دارای ویژگی‌های بصری مشخصی مانند رنگ، شکل و اندازه هستند، روش‌های تشخیص به دو دسته کلی تقسیم می‌شوند:

  • روش‌های مبتنی بر رنگ: این روش‌ها با بهره‌گیری از ویژگی‌های رنگی علائم، به سرعت و با دقت قابل قبولی، علائم را در تصویر شناسایی می‌کنند. با این حال، حساسیت به تغییرات شدید نور و وجود نویزهای رنگی از جمله چالش‌های این روش‌ها است. برای بهبود عملکرد، محققان از فضاهای رنگی مختلفی مانند HSV و HSI استفاده کرده‌اند که نسبت به تغییرات نور کمتر حساس هستند. همچنین، تکنیک‌های پیش‌پردازش تصویر مانند تقویت کنتراست و فیلتر کردن نویز نیز به کار گرفته شده‌اند.
  • روش‌های مبتنی بر شکل: این روش‌ها با تمرکز بر ویژگی‌های هندسی علائم، به تشخیص دقیق‌تر آن‌ها کمک می‌کنند. از جمله تکنیک‌های پرکاربرد در این حوزه می‌توان به استفاده از ویژگی‌های شبیه به Haar، توصیف‌گرهای SIFT و SURF و همچنین مدل‌های یادگیری عمیق مانند شبکه‌های عصبی کانولوشنی (CNN) اشاره کرد. این روش‌ها به دلیل انعطاف‌پذیری بالا و توانایی در استخراج ویژگی‌های پیچیده، عملکرد بسیار خوبی در تشخیص علائم با اشکال متنوع دارند.

ب. شناسایی علائم راهنمایی و رانندگی

پس از تشخیص علائم، مرحله بعدی، طبقه‌بندی آن‌ها به انواع مختلف است. در این مرحله، از الگوریتم‌های یادگیری ماشین و استخراج ویژگی‌های قدرتمند استفاده می‌شود. ماشین‌های بردار پشتیبان (SVM)، جنگل‌های تصادفی و شبکه‌های عصبی کانولوشنی (CNN) از جمله روش‌های پرکاربرد در این زمینه هستند. شبکه‌های عصبی کانولوشنی به دلیل توانایی در یادگیری خودکار ویژگی‌های بصری، عملکرد بسیار بالایی در شناسایی انواع مختلف علائم از جمله علائم با پیچیدگی بالا نشان داده‌اند.

۳. روش پیشنهادی

سیستم پیشنهادی برای تشخیص و شناسایی علائم راهنمایی و رانندگی شامل سه مرحله اصلی است: بخش‌بندی تصویر، تشخیص شکل، و شناسایی علائم. هر کدام از این مراحل به گونه‌ای طراحی شده‌اند تا با سرعت و دقت بالا، علائم راهنمایی و رانندگی را در تصاویر شناسایی و طبقه‌بندی کنند.

الف. پیش‌پردازش تصویر و استخراج نواحی مورد نظر

اولین گام در سیستم پیشنهادی، آماده‌سازی تصویر برای تحلیل است. این مرحله شامل پیش‌پردازش تصویر و استخراج نواحی محتمل برای وجود علائم راهنمایی و رانندگی (Regions of Interest یا ROI) است.

علائم راهنمایی و رانندگی معمولاً دارای رنگ‌های مشخصی هستند که می‌تواند به عنوان سرنخی برای تشخیص آن‌ها استفاده شود. از این رو، اطلاعات رنگی تصویر نقشی کلیدی در این مرحله ایفا می‌کند. برای بهره‌برداری بهتر از اطلاعات رنگی و کاهش تأثیر تغییرات نور محیط، از فضای رنگی HSV استفاده می‌شود. این فضا، که رنگ، اشباع و مقدار (روشنایی) رنگ را به صورت جداگانه نمایش می‌دهد، نسبت به فضای رنگی RGB به تغییرات نور حساسیت کمتری دارد.

پس از تبدیل تصویر به فضای رنگی HSV، عملیات پیش‌پردازش برای بهبود کیفیت تصویر و افزایش دقت تشخیص علائم انجام می‌شود. این عملیات شامل تنظیم کنتراست، حذف نویز و تقویت لبه‌ها است. در ادامه، با استفاده از مقادیر آستانه بهینه، تصویر به نواحی مختلف تقسیم می‌شود. مقادیر آستانه برای هر رنگ (قرمز، آبی، سفید) به صورت جداگانه تنظیم می‌شود تا حساسیت به تغییرات نور کاهش یافته و تشخیص علائم با دقت بیشتری انجام شود. در نهایت، با اعمال عملیات مورفولوژیکی و حذف نواحی کوچک و بی‌ربط، نواحی محتمل برای وجود علائم راهنمایی و رانندگی استخراج می‌شوند.

ب. تشخیص شکل علائم راهنمایی و رانندگی

پس از استخراج نواحی محتمل، مرحله بعدی شناسایی شکل هندسی علائم است. در این سیستم، تمرکز بر سه شکل اصلی دایره، مثلث و مستطیل است. برای تشخیص این اشکال هندسی، از ویژگی فاصله تا مرز (Distance to Borders) استفاده می‌شود. این ویژگی، فاصله هر نقطه از لبه داخلی یک شکل تا نزدیک‌ترین لبه جعبه محصورکننده آن را اندازه‌گیری می‌کند. با تحلیل الگوهای این فواصل، می‌توان شکل هندسی تقریبی یک ناحیه را تعیین کرد.

برای طبقه‌بندی دقیق‌تر اشکال، از الگوریتم جنگل تصادفی (Random Forest) استفاده شده است. جنگل تصادفی یک روش یادگیری ماشین قدرتمند است که بر اساس مجموعه‌ای از درختان تصمیم‌گیری عمل می‌کند. هر درخت تصمیم‌گیری به تنهایی شکل یک ناحیه را پیش‌بینی می‌کند و در نهایت، با ترکیب نظر همه درخت‌ها، طبقه نهایی تعیین می‌شود. این روش به دلیل توانایی در مدیریت داده‌های پیچیده و جلوگیری از بیش‌برازش، انتخاب مناسبی برای این مسئله است.

ج. شناسایی محتوای علائم راهنمایی و رانندگی

پس از تعیین شکل هندسی علائم، گام بعدی استخراج اطلاعات معنی‌دار از درون آن‌ها است. این اطلاعات می‌تواند شامل محدودیت سرعت، نوع خطر یا جهت مسیر باشد. برای این منظور، از ترکیب چندین توصیف‌گر تصویری قدرتمند استفاده می‌شود. این توصیف‌گرها شامل هیستوگرام گرادیان‌های جهت‌دار (HOG)، فیلترهای گابور، الگوهای دودویی محلی (LBP) و خودشباهتی محلی (LSS) هستند. این ویژگی‌ها با دقت بالایی جزئیات ظریف تصاویر را توصیف می‌کنند و به سیستم اجازه می‌دهند تا انواع مختلف علائم را از هم تشخیص دهد.

برای طبقه‌بندی نهایی علائم، همچنان از الگوریتم جنگل تصادفی استفاده می‌شود. با توجه به نتایج آزمایش‌ها، ترکیب ویژگی‌های HOG و LSS به همراه جنگل تصادفی بهترین عملکرد را در شناسایی علائم مختلف نشان داده است. این ترکیب، به سیستم اجازه می‌دهد تا با دقت بالا و سرعت مناسب، انواع متنوعی از علائم راهنمایی و رانندگی را تشخیص دهد.

۵. بخش‌بندی تصاویر

توضیح جزئیات بخش‌بندی تصاویر برای استخراج مناطق علائم (ROI):
در مرحله بخش‌بندی تصاویر، هدف اصلی استخراج مناطق علاقه‌مندی (ROI) است که احتمال وجود علائم راهنمایی و رانندگی در آن‌ها وجود دارد. در سیستم پیشنهادی این مقاله، فرآیند بخش‌بندی شامل بهبود کیفیت تصویر و سپس اعمال آستانه‌گذاری در فضای رنگی HSV است. ابتدا، مؤلفه‌های تصویر در فضای HSV به‌طور جداگانه مورد پردازش قرار می‌گیرند تا با انجام بهبود روشنایی و کنتراست، کیفیت تصویر بهبود یابد. سپس از آستانه‌گذاری ثابت برای جداسازی نواحی مورد نظر استفاده می‌شود و تصویر به یک تصویر باینری تبدیل می‌گردد که در آن نواحی سفید نشان‌دهنده پیکسل‌هایی است که با رنگ علائم مطابقت دارند.

استفاده از رنگ‌های قرمز و آبی برای تشخیص علائم:
برای تشخیص علائم، از ویژگی رنگ به‌عنوان یکی از معیارهای اصلی استفاده شده است، زیرا رنگ‌های قرمز و آبی معمولاً در طراحی علائم راهنمایی و رانندگی به کار می‌روند. در این روش، آستانه‌گذاری بر اساس مقادیر مشخصی از مؤلفه‌های رنگ (Hue)، اشباع (Saturation) و مقدار (Value) در فضای HSV صورت می‌گیرد. برای رنگ قرمز، بازه‌های مختلف برای تشخیص رنگ در نواحی تیره و روشن در نظر گرفته می‌شود، به‌طوری‌که بازه‌های Hue شامل مقادیر بین ۰ تا ۱۲ یا ۳۰۰ تا ۳۶۰ باشد. به همین ترتیب، برای رنگ آبی، از بازه ۱۹۰ تا ۲۶۰ برای تشخیص رنگ استفاده می‌شود. این تنظیمات به شناسایی دقیق‌تر علائم با رنگ‌های استاندارد کمک می‌کند.

چالش‌های ناشی از نورپردازی و شرایط آب‌وهوایی:
بخش‌بندی تصاویر با چالش‌های متعددی روبرو است که عمدتاً ناشی از تغییرات نورپردازی و شرایط آب‌وهوایی می‌باشد. تغییرات شدید در روشنایی، سایه‌های ناشی از اشیاء اطراف، و تغییرات رنگ علائم به‌دلیل تأثیرات جوی می‌تواند باعث اختلال در تشخیص صحیح نواحی مورد نظر شود. همچنین، حضور اشیاء دیگر با رنگ‌های مشابه در تصویر می‌تواند منجر به شناسایی نادرست گردد. برای مقابله با این چالش‌ها، مقاله از فضای رنگی HSV به دلیل جداسازی مناسب بین مؤلفه‌های رنگ و روشنایی استفاده کرده است تا اثرات تغییرات نوری کاهش یابد و دقت تشخیص افزایش پیدا کند.

۶. تشخیص شکل

استفاده از ویژگی فاصله تا مرز (DtBs) برای طبقه‌بندی اشکال:
در مرحله تشخیص شکل، از ویژگی فاصله تا مرز (Distance to Borders – DtBs) برای طبقه‌بندی اشکال استفاده می‌شود. این ویژگی‌ها فاصله بین لبه‌های بیرونی یک ناحیه (که از بخش‌بندی به دست آمده) تا مرز جعبه محاطی آن را نشان می‌دهند. استفاده از DtBs به دلیل انعطاف‌پذیری بالا در طبقه‌بندی اشکال مختلف، به‌ویژه در تشخیص اشکال هندسی علائم راهنمایی و رانندگی مانند دایره، مثلث و مستطیل، مورد توجه قرار گرفته است. این ویژگی‌ها به عنوان بردارهای ورودی برای طبقه‌بندی اشکال استفاده می‌شوند و به تفکیک دقیق‌تر بین انواع مختلف علائم کمک می‌کنند.

توضیح عملکرد Random Forest در شناسایی اشکال دایره‌ای، مثلثی و مستطیلی:
در این پژوهش، برای طبقه‌بندی اشکال هندسی (دایره، مثلث و مستطیل) در علائم راهنمایی و رانندگی، از الگوریتم جنگل تصادفی بهره گرفته شده است. جنگل تصادفی یک متا الگوریتم یادگیری ماشین است که بر مبنای مجموعه‌ای از درختان تصمیم‌گیری عمل می‌کند. هر درخت تصمیم‌گیری با استفاده از یک نمونه تصادفی از داده‌های آموزشی و یک زیرمجموعه تصادفی از ویژگی‌ها ساخته می‌شود. این رویکرد باعث ایجاد تنوع در مدل و کاهش خطای ناشی از بیش‌برازش می‌شود. در این مطالعه، جنگل تصادفی با استفاده از ویژگی‌های تصویری استخراج شده از نواحی مورد نظر، قادر به طبقه‌بندی دقیق اشکال هندسی بوده است.

استفاده از معیارهای ابعادی و نسبت برای حذف نویزها و مناطق غیرمطلوب:
برای کاهش تعداد نواحی غیرمطلوب و افزایش دقت سیستم، از معیارهای ابعادی و نسبت‌های هندسی برای حذف نویزها و نواحی غیرعلائم استفاده شده است. در این روش، نواحی که اندازه آن‌ها بیش‌ازحد بزرگ یا کوچک است و یا نسبت طول به عرض آن‌ها با نسبت‌های هندسی علائم استاندارد همخوانی ندارد، به عنوان نویز در نظر گرفته شده و کنار گذاشته می‌شوند. این فیلترها بر اساس نتایج تجربی به‌دست آمده و به کاهش بار پردازشی سیستم کمک می‌کنند، در حالی که دقت تشخیص شکل نیز حفظ می‌شود.

۷. شناسایی علائم

بررسی عملکرد سیستم در تشخیص اطلاعات درون علائم شناسایی شده:
پس از تشخیص شکل علائم و طبقه‌بندی آن‌ها به دسته‌های دایره‌ای، مثلثی و مستطیلی، مرحله شناسایی اطلاعات درون علائم آغاز می‌شود. هدف از این مرحله تعیین نوع و معنای دقیق علامت راهنمایی و رانندگی است که قبلاً به‌عنوان یک شکل خاص شناسایی شده است. برای این منظور، از روش‌های استخراج ویژگی و یادگیری ماشین استفاده می‌شود تا محتوای تصویری داخل علامت شناسایی و طبقه‌بندی گردد. سیستم پیشنهادی با استفاده از ترکیب ویژگی‌های مختلف و یک طبقه‌بند قوی، قادر است با دقت بالا اطلاعات موجود در علائم را تشخیص دهد و آن‌ها را به دسته‌های مناسب اختصاص دهد.

مقایسه دو طبقه‌بند Random Forest و SVM در دقت و سرعت پردازش:
برای انتخاب الگوریتم مناسب جهت طبقه‌بندی علائم راهنمایی و رانندگی، دو الگوریتم پرکاربرد جنگل تصادفی و ماشین بردار پشتیبان با هم مقایسه شدند. نتایج حاصل از آزمایش‌ها نشان داد که جنگل تصادفی عملکرد بهتری نسبت به SVM در این کاربرد خاص دارد.

جنگل تصادفی با ایجاد مجموعه‌ای از درختان تصمیم‌گیری و استفاده از روش رأی‌گیری، توانایی تعمیم‌پذیری بالایی را از خود نشان می‌دهد و کمتر تحت تأثیر بیش‌برازش قرار می‌گیرد. همچنین، این الگوریتم به دلیل ماهیت موازی خود، قابلیت پردازش سریع داده‌های بزرگ را داراست. در مقابل، SVM با استفاده از هسته RBF، مرز تصمیم بهینه‌ای را برای جداسازی داده‌ها پیدا می‌کند. اما انتخاب پارامترهای مناسب برای هسته RBF، مانند عرض باند، بسیار حساس است و نیاز به تنظیم دقیق دارد. علاوه بر این، پیچیدگی محاسباتی SVM با افزایش تعداد نمونه‌های آموزشی به صورت نمایی رشد می‌کند که ممکن است در مسائل بزرگ مقیاس به یک محدودیت تبدیل شود.

ترکیب ویژگی‌های مختلف مثل HOG، Gabor، LBP و LSS برای بهبود دقت:
به منظور افزایش دقت سیستم در تشخیص علائم راهنمایی و رانندگی، از ترکیبی از چندین ویژگی تصویری قدرتمند استفاده شده است. این ویژگی‌ها شامل هیستوگرام گرادیان جهت‌دار (HOG)، فیلتر گابور، الگوی باینری محلی (LBP) و شباهت خودمحلی (LSS) هستند. هر یک از این ویژگی‌ها جنبه‌های مختلفی از اطلاعات تصویری را استخراج می‌کنند.

به عنوان مثال، HOG اطلاعات مربوط به لبه‌ها و جهت‌گیری آن‌ها را در اختیار سیستم قرار می‌دهد، در حالی که LBP و LSS به توصیف بافت و جزئیات محلی تصاویر می‌پردازند. ترکیب این ویژگی‌ها، یک توصیف جامع و دقیق از علائم را فراهم کرده و به سیستم اجازه می‌دهد تا با تغییرات نوری و نویزهای موجود در تصاویر به خوبی مقابله کند. نتایج آزمایش‌ها نشان داده است که ترکیب HOG و LSS به همراه طبقه‌بند جنگل تصادفی، بهترین عملکرد را در تشخیص علائم مختلف داشته است.

۸. استخراج ویژگی‌ها

توضیح ویژگی‌های HOG، Gabor، LBP، و LSS و چگونگی استفاده از آن‌ها برای تشخیص بهتر علائم:
در سیستم شناسایی علائم راهنمایی و رانندگی پیشنهادی، از چهار نوع ویژگی مهم برای استخراج اطلاعات از تصاویر استفاده شده است: هیستوگرام گرادیان‌های جهت‌دار (HOG)، فیلتر گابور، الگوی باینری محلی (LBP)، و شباهت خودمحلی (LSS). هر یک از این ویژگی‌ها اطلاعات خاصی را از تصویر به دست می‌دهند که به تشخیص بهتر علائم کمک می‌کند:

  • HOG (هیستوگرام گرادیان‌های جهت‌دار): این ویژگی با محاسبه گرادیان‌های جهت‌دار لبه‌های تصویر، اطلاعات مربوط به شکل و لبه‌های علائم را استخراج می‌کند. ویژگی HOG به‌دلیل مقیاس‌ناپذیری و مقاومت در برابر تغییرات محلی در شدت نور، به‌ویژه برای تشخیص اشکال هندسی در علائم کاربرد دارد.
  • Gabor (فیلتر گابور): این فیلترها قادر به استخراج ویژگی‌های بافت و جزئیات محلی تصویر هستند. فیلترهای گابور به صورت باند‌گذر با انتخاب‌پذیری نسبت به فرکانس فضایی و جهت‌گیری خاص عمل می‌کنند و می‌توانند ویژگی‌های مختلف بافت‌های علائم را در زوایای مختلف شناسایی کنند.
  • LBP (الگوی باینری محلی): این ویژگی با مقایسه مقادیر پیکسل‌های همسایه نسبت به مقدار پیکسل مرکزی، اطلاعات بافتی محلی را استخراج می‌کند. LBP به عنوان یک توصیفگر بافت مقاوم در برابر تغییرات نوری شناخته می‌شود و برای تشخیص الگوهای متداول در علائم مناسب است.
  • LSS (شباهت خودمحلی): در این روش، تصویر به قسمت‌های کوچکی تقسیم شده و هر قسمت با یک پچ مرکزی مقایسه می‌شود. این مقایسه‌ها به تشخیص الگوهای مشابه در تصویر کمک کرده و می‌تواند در شناسایی جزئیات و ساختارهای تکراری مفید باشد.

مقایسه عملکرد این ویژگی‌ها به تنهایی و در ترکیب با یکدیگر:
برای ارزیابی کارایی هر یک از ویژگی‌های مذکور، آزمایش‌هایی انجام شد که عملکرد این ویژگی‌ها به‌صورت جداگانه و در ترکیب با یکدیگر مورد بررسی قرار گرفت. نتایج نشان داد که ویژگی HOG به‌تنهایی دقت بالاتری نسبت به ویژگی‌های دیگر دارد، زیرا به‌طور مؤثری اطلاعات مربوط به لبه‌ها و شکل‌های هندسی علائم را استخراج می‌کند. با این حال، ترکیب ویژگی‌ها منجر به بهبود عملکرد کلی سیستم می‌شود. به‌ویژه، ترکیب HOG با LSS، دقت بالاتری نسبت به استفاده از هر ویژگی به‌تنهایی ارائه داد.

این ترکیب ویژگی‌ها باعث می‌شود که سیستم بتواند اطلاعات مختلفی از تصویر را به‌دست آورد و با تغییرات نوری و شرایط محیطی به‌خوبی سازگار شود. آزمایش‌ها نشان دادند که استفاده از ترکیب HOG و LSS همراه با طبقه‌بند Random Forest، بهترین نتایج را در تشخیص علائم راهنمایی و رانندگی ارائه می‌دهد و عملکردی پایدار و قابل‌اعتماد برای شناسایی علائم مختلف دارد.

۹. نتایج آزمایش‌ها

ارزیابی عملکرد سیستم پیشنهادی بر روی داده‌های STS:
سیستم پیشنهادی برای تشخیص و شناسایی علائم راهنمایی و رانندگی بر روی مجموعه‌داده‌ی Swedish Traffic Sign Data set (STS) ارزیابی شده است. این مجموعه شامل بیش از ۲۰,۰۰۰ تصویر با ۳,۴۸۸ علامت راهنمایی و رانندگی مختلف است که از جاده‌های شهری و بزرگراه‌های سوئد جمع‌آوری شده است. آزمایش‌ها با هدف ارزیابی دقت و کارایی سیستم در شرایط مختلف نوری و محیطی انجام شده‌اند. پردازش تصاویر بر روی یک پردازنده Intel i5 با سرعت ۲.۷ گیگاهرتز صورت گرفته است.

تحلیل دقت و بازخوانی (Precision-Recall) برای فاز تشخیص و شناسایی:
برای ارزیابی عملکرد سیستم، از منحنی‌های دقت-بازخوانی (Precision-Recall) استفاده شده است که نشان‌دهنده کارایی سیستم در تشخیص و شناسایی علائم هستند. مقادیر دقت (Precision) و بازخوانی (Recall) به صورت زیر تعریف می‌شوند:

  • دقت: نسبت تعداد علائم صحیح شناسایی‌شده به تعداد کل علائم شناسایی‌شده.
  • بازخوانی: نسبت تعداد علائم صحیح شناسایی‌شده به تعداد کل علائم موجود در مجموعه‌داده.

آزمایش‌ها نشان داد که سیستم پیشنهادی به دقت ۹۵.۱۲٪ و بازخوانی ۹۳.۴۱٪ دست یافته است، و سطح زیر منحنی (AUC) دقت-بازخوانی برابر با ۹۴.۵۰٪ می‌باشد. این نتایج نشان‌دهنده کارایی بالای سیستم در تشخیص و شناسایی علائم با ترکیب ویژگی‌های HOG و LSS و استفاده از طبقه‌بند Random Forest است.

مثال‌هایی از تشخیص‌های موفق و ناموفق سیستم:
تصاویر آزمایشی نشان دادند که سیستم در بیشتر موارد قادر به تشخیص و شناسایی علائم به‌طور صحیح است. به‌عنوان مثال، علائم دایره‌ای و مثلثی در شرایط مختلف نوری به‌خوبی تشخیص داده شدند و در نتیجه شناسایی نیز با دقت بالایی انجام شد. در برخی موارد که علائم دارای وضوح کمتر یا دارای تاری بودند، سیستم نتوانست به‌درستی آن‌ها را تشخیص دهد. همچنین، در مواردی که نورپردازی بسیار شدید یا سایه‌های عمیق وجود داشت، عملکرد سیستم دچار افت شد و علائم به‌درستی شناسایی نشدند.

نمونه‌هایی از شناسایی‌های موفق شامل تصاویری با علائم واضح و شرایط نوری مناسب بودند که سیستم به‌راحتی توانست آن‌ها را تشخیص داده و شناسایی کند. در مقابل، در برخی تصاویر با علائم محو یا در حال حرکت، سیستم دچار خطا شد و علائم شناسایی‌شده به‌درستی دسته‌بندی نشدند.

۹. نتیجه‌گیری

در این مقاله، یک سیستم سریع و کارآمد برای تشخیص و شناسایی علائم راهنمایی و رانندگی ارائه شد. این سیستم شامل سه مرحله اصلی بخش‌بندی تصاویر، تشخیص شکل، و شناسایی علائم است که با استفاده از ویژگی‌های مختلف و الگوریتم‌های یادگیری ماشین پیاده‌سازی شده است. آزمایش‌های انجام شده بر روی مجموعه‌داده STS نشان داد که سیستم پیشنهادی می‌تواند با دقت بالا و سرعت مناسب علائم راهنمایی را در شرایط مختلف نوری و محیطی تشخیص داده و شناسایی کند.

نتایج به‌دست‌آمده نشان می‌دهد که ترکیب ویژگی‌های HOG و LSS به همراه استفاده از طبقه‌بند Random Forest، عملکرد سیستم را به‌طور چشمگیری بهبود بخشیده است. این ترکیب ویژگی‌ها باعث شده است که سیستم بتواند به‌طور مؤثر با چالش‌های مربوط به تغییرات نوری و ظاهری مقابله کند و دقت شناسایی را افزایش دهد. دقت ۹۵.۱۲٪ و بازخوانی ۹۳.۴۱٪ به‌دست‌آمده در ارزیابی‌های انجام شده، گواهی بر کارایی و قابلیت اطمینان این روش هستند.

به‌طور کلی، دستاورد اصلی این مقاله ارائه یک روش ترکیبی کارآمد است که با استفاده از ویژگی‌های متنوع و طبقه‌بندی دقیق، توانسته است عملکردی پایدار و قابل‌اعتماد در تشخیص و شناسایی علائم راهنمایی و رانندگی ارائه دهد. این سیستم می‌تواند به‌عنوان بخشی از سیستم‌های پیشرفته کمک راننده (ADAS) و دیگر کاربردهای مرتبط با ایمنی جاده‌ای مورد استفاده قرار گیرد.

۱۰. پیشنهادات برای کارهای آینده

در حالی که سیستم پیشنهادی برای تشخیص و شناسایی علائم راهنمایی و رانندگی عملکرد قابل‌قبولی داشته است، همچنان می‌توان برخی بهبودها و تغییرات را برای افزایش دقت و کارایی آن اعمال کرد. در این بخش، پیشنهاداتی برای کارهای آینده ارائه می‌شود که می‌تواند به ارتقای سیستم کمک کند:

استفاده از آستانه‌های تطبیقی برای مقابله با تغییرات نور:
یکی از چالش‌های اصلی در تشخیص علائم، تغییرات نوری و شرایط آب‌وهوایی متغیر است که بر فرآیند بخش‌بندی تصاویر تأثیر می‌گذارد. استفاده از آستانه‌های ثابت در این مقاله ممکن است در برخی شرایط نوری نتایج مناسبی ارائه ندهد. بنابراین، پیشنهاد می‌شود که از آستانه‌های تطبیقی بر اساس شرایط محیطی استفاده شود. این آستانه‌ها می‌توانند به‌طور خودکار و بر اساس ویژگی‌های تصویر ورودی تنظیم شوند تا دقت بخش‌بندی و تشخیص علائم در شرایط نوری مختلف بهبود یابد.

ادغام اطلاعات زمانی برای تقویت فرآیند تصمیم‌گیری:
برای افزایش دقت و کاهش نرخ خطا، می‌توان از اطلاعات زمانی برای پیگیری علائم در چندین فریم ویدئویی استفاده کرد. ادغام اطلاعات به‌دست‌آمده از فریم‌های متوالی می‌تواند به شناسایی و ردیابی پایدارتر علائم کمک کند و به‌ویژه در شرایطی که علائم به‌طور موقت از دید خارج می‌شوند یا دچار اختلال می‌شوند، عملکرد سیستم را بهبود بخشد. استفاده از الگوریتم‌های ردیابی مانند Kalman Filter یا تکنیک‌های یادگیری عمیق برای ردیابی می‌تواند این قابلیت را فراهم کند.

بهبود روش‌های استخراج ویژگی و ترکیب آن‌ها:
اگرچه ترکیب ویژگی‌های HOG و LSS در این مقاله نتایج قابل‌توجهی ارائه داده است، می‌توان با استفاده از تکنیک‌های پیشرفته‌تر مانند شبکه‌های عصبی کانولوشنی (CNN) و استخراج ویژگی‌های عمیق، دقت سیستم را افزایش داد. ادغام ویژگی‌های کلاسیک با ویژگی‌های عمیق می‌تواند به سیستم کمک کند تا با تغییرات شدیدتر در ظاهر علائم، مانند تغییرات شکل و رنگ، به‌خوبی سازگار شود.

استفاده از داده‌های بیشتر و متنوع‌تر برای آموزش سیستم:
افزایش دقت سیستم می‌تواند از طریق استفاده از مجموعه‌داده‌های بزرگ‌تر و متنوع‌تر که شامل شرایط نوری مختلف، انواع مختلف جاده‌ها، و علائم با اندازه‌ها و شکل‌های گوناگون است، به‌دست آید. همچنین، استفاده از تکنیک‌های افزایش داده (Data Augmentation) می‌تواند به بهبود قابلیت تعمیم‌دهی مدل کمک کند.

با اجرای این پیشنهادات، می‌توان انتظار داشت که سیستم تشخیص و شناسایی علائم راهنمایی و رانندگی به سطح بالاتری از دقت و کارایی دست یابد و به‌عنوان یک ابزار مؤثر در سیستم‌های کمک راننده و ایمنی جاده‌ای مورد استفاده قرار گیرد.

شاید این مطالب نیز مورد نظر شما باشه!
۱. هوش مصنوعی (AI) به زبان فارسی ساده!

Share.
Leave A Reply

Exit mobile version