پالایش شرح گذاری مجموعه تصاویر با مقیاس بزرگ با یادگیری انتقالی در شبکه عصبی کانولوشنال عمیق
سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 233
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JMVIP-5-1_004
تاریخ نمایه سازی: 23 اردیبهشت 1400
چکیده مقاله:
فرآیند پالایش شرح گذاری تصاویر، رویکردی موثر در بهبود بازیابی تصاویر مبتنی بر برچسب می باشد. در شبکه های اجتماعی و موتورهای جستجو بسیاری از تصاویر دارای تگ های مبهم، ناقص و بی ارتباط با محتوا هستند. وجود این تگ های غیرقابل اعتماد، موجب کاهش دقت بازیابی تصاویر می شود. از اینرو در دهه اخیر، الگوریتم هایی با عنوان پالایش تگ (TR) مطرح شده اند که به رفع نویز و غنی سازی برچسب های تصاویر می پردازند. به منظور دستیابی به نتایج بهینه در TR، استخراج ویژگی هایی از تصویر که توصیف مناسبی از محتوای دیداری تصویر داشته باشند، تاثیر مستقیمی بر دقت فرآیند TR دارد. از جمله چالش های عمده در فرآیند پالایش شرح گذاری تصاویر، رسیدن به توصیفی مناسب و مرتبط با محتوای تصاویر میباشد. بدین منظور با توجه به کارآمدی فرآیند یادگیری عمیق در بسیاری از حوزه های پژوهشی، در این مقاله نیز به منظور استخراج ویژگی های کارآمد در تشابه دیداری تصاویر و ارتباط معنایی تصاویر با هم، از شبکه های عصبی کانولوشنال عمیق (DCNN) استفاده شده است. بهره گیری از فرآیند یادگیری انتقالی استفاده شده در DCNN مبتنی بر تصاویر ImageNet در توصیف و ایجاد ارتباط معنایی در مجموعه تصاویر با مقیاس بزرگ NUS-WIDE، بیانگر موثر بودن این رویکرد در کاربرد پالایش تگ تصاویر است.
کلیدواژه ها:
نویسندگان
شیما جوانمردی
دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی، دانشکده برق و کامپیوتر، دانشگاه یزد
محمد علی زارع چاهوکی
دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد