برچسب گذاری تصویر بر مبنای نواحی مهم با استفاده از شبکه های کانوولوشن عمیق

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,095

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICMVIP10_032

تاریخ نمایه سازی: 2 تیر 1397

چکیده مقاله:

قابلیت تولید برچسب متنی برای تصاویر،کاری چالش برانگیز و درعین حال پر کاربرد است. ازکاربردهای برچسب گذاری خودکار می توان به ساختابزارهایی برای بازیابی بهتر تصاویر با استفاده از فهم معناییمحتوای و کمک به افرادی که در سیستم بینایی خود دچارمعلولیت هستند اشاره کرد. در این مقاله یک سیستم جامعو یکپارچه برای برچسب گذاری خودکار تصاویر معرفی شدهاست که با استخراج ناحیه های مهم تصویر، به ازای هر ناحیهبرچسبی که شامل یک کلمه، عبارت یا جمله است را بهنواحی نسبت میدهد. یک مدل Inception مانده ای برای استخراج ویژگی های تصویر معرفی شده است که علاوه برتعداد پارامتر کمتر، دارای عمق و دقت بیشتر نسبت به مدلهای پیشین همچون VGG است. مدل پیشنهاد شده قابلیت یادگیری در یک مرحله گذر رو به جلو را دارد. بانک داده استفاده شده جهت ارزیابی روش پیشنهادی Visual Genome می باشد.

نویسندگان

ناصر رضایی نوین

دانشگاه شهید بهشتی

علی نادیان قمشه

دانشگاه شهید بهشتی