The 11th Iranian and the first International Conference on Machine Vision and Image Processing

استفاده از ساختارهای هرمی و شبکه‌های کاملا کانولوشنی در قطعه‌بندی معنایی تصاویر

حسن علی‌کرمیمحمدجواد فدایی اسلامفرزین یغمایی
The 11th Iranian and the first International Conference on Machine Vision and Image Processing (MVIP 2020)

چکیده

فهم یک تصویر و درک محتوا از مهم‌ترین چالش‌های پیشرو در یادگیری و بینایی ماشین است. یکی از مهم‌ترین راه‌های بررسی این چالش از مسیر قطعه‌بندی معنایی خواهد بود. در این مقاله، با استفاده از معماری‌های کانولوشن و کانولوشن معکوس به همراه ساختارهای هرمی آتروس، به بررسی قطعه‌بندی معنایی پرداختیم. در این روش از معماری اولیه ResNet101 در قسمت استخراج ویژگی و در مراحل بعد از ساختارهای هرمی در مرکز اتصالات شبکه کانولوشن و کانولوشن معکوس استفاده شده است تا اطلاعات محلی و دید کلان در قسمت ویژگی‌ها ترکیب گردد. از طرفی لایه‌های استخراج ویژگی در سطوح مختلف انتقال داده شده است. نتایج حاصل از این روش، دقت 88.1 درصدی و برتری قطعه‌بندی معنایی نسبت به رویکردهای مورد بررسی را نشان می‌دهد.

کلمات کلیدی: قطعه‌بندی معنایی، کانولوشن، کانولوشن معکوس، ساختار هرمی آتروس، ResNet10



© 2017-2021 ISMVIP All Rights Reserved