برچسب گذاری تصویر بر مبنای نواحی مهم با استفاده از شبکه های کانوولوشن عمیق
محل انتشار: دهمین کنفرانس بینایی ماشین و پردازش تصویر ایران
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,095
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP10_032
تاریخ نمایه سازی: 2 تیر 1397
چکیده مقاله:
قابلیت تولید برچسب متنی برای تصاویر،کاری چالش برانگیز و درعین حال پر کاربرد است. ازکاربردهای برچسب گذاری خودکار می توان به ساختابزارهایی برای بازیابی بهتر تصاویر با استفاده از فهم معناییمحتوای و کمک به افرادی که در سیستم بینایی خود دچارمعلولیت هستند اشاره کرد. در این مقاله یک سیستم جامعو یکپارچه برای برچسب گذاری خودکار تصاویر معرفی شدهاست که با استخراج ناحیه های مهم تصویر، به ازای هر ناحیهبرچسبی که شامل یک کلمه، عبارت یا جمله است را بهنواحی نسبت میدهد. یک مدل Inception مانده ای برای استخراج ویژگی های تصویر معرفی شده است که علاوه برتعداد پارامتر کمتر، دارای عمق و دقت بیشتر نسبت به مدلهای پیشین همچون VGG است. مدل پیشنهاد شده قابلیت یادگیری در یک مرحله گذر رو به جلو را دارد. بانک داده استفاده شده جهت ارزیابی روش پیشنهادی Visual Genome می باشد.
کلیدواژه ها:
نویسندگان
ناصر رضایی نوین
دانشگاه شهید بهشتی
علی نادیان قمشه
دانشگاه شهید بهشتی