The 11th Iranian and the first International Conference on Machine Vision and Image Processing

بهبود شناسایی اشیاء در شبکه‌ها‌ی عصبی کانولوشنی با بهره‌گیری از اطلاعات زمانی در توالی فریم‌های ویدئویی

حسن نجف‌زادهسید علیرضا سیدین
The 11th Iranian and the first International Conference on Machine Vision and Image Processing (MVIP 2020)

چکیده

شناسایی شیء یکی از زمینه‌های بینایی ماشین است که در حال حاضر به‌شدت مبتنی بر یادگیری ماشین است. در دهة گذشته، بخش عمده‌ای از یادگیری ماشین که تحت عنوان شبکه‌های عصبی عمیق نیز شناخته می‌شود با پیشرفت در توانایی محاسبات و دسترسی به داده، کاربردهای فراوانی داشته‌اند.یکی از زیرمجموعه‌های شبکه عصبی که برای وظایف مرتبط با تصویر مناسب است شبکه عصبی کانولوشنی نام دارد.این شبکه آموزش می‌بیند تا ویژگی‌های مختلف مانند لبه‌ها، گوشه‌ها و تفاوت‌های رنگ را در سراسر تصویر جستجو کند و آن‌ها را به شکل‌های پیچیده‌تر ترکیب کند. برای تشخیص شیء، سیستم باید مکان‌های اشیاء احتمالی را تخمین‌زده و طبقه‌بندی کند.شناسایی شیء با شبکه‌های کانولوشن هنوز هم به‌عنوان یک تکنولوژی در حال تکامل است، برخلاف دیگر روش‌های تشخیص که دیگر کاربرد چندانی ندارند. استفاده از اطلاعات زمانی در شبکه‌های کانولوشنی باعث افزایش دقت در طبقه‌بندی ‌می‌شود. در این مقاله با تغییر لایه‌های تماماً متصل شبکه‌های عصبی کانولوشنی و با بهره‌گیری از اطلاعات زمانی در توالی فریم‌هایی از ویدئو با استفاده از فیلتر کالمن عملکرد SVM سیستم‌های شناسایی به‌طور قابل ملاحظه‌ای بهبود می‌یابد. با استفاده از این شبکه جدید و طبقه‌بندی به دق

کلمات کلیدی: بازشناسی شیء، شبکه عصبی کانولوشنی، شناسایی شی‌ء در ویدئو، فیلتر کالمن



© 2017-2021 ISMVIP All Rights Reserved