تولید شرح تصویر با استفاده از یادگیری عمیق

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 363

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTI04_088

تاریخ نمایه سازی: 20 مهر 1400

چکیده مقاله:

سیستم های تولید شرح تصویر از ترکیب دو حوزه پردازش تصویر و پردازش متن تشکیل شده اند. روند کار این گونه سیستم ها متشکل از شناسایی اشیا داخل تصویر و روابط بین آنها و سپس بیان اطلاعات شناسایی شده در تصویر به صورت متن می باشد. این مقاله مبتنی بر روش های یادگیری عمیق می باشد. از روش تشخیص اشیا MASK RCNN و شبکه های کانولوشن برای تصاویر و از شبکه بازگشتی LSTM بر مبنای توه برای تولید کلمات شرح تصویر در هر مرحله استفاده شده است. مجموعه داده مورد استفاده در این پژوهش flickr۳۰k است که در زمنیه تولید شرح تصویر از آن استفاده می شود که شامل ۳۱۰۱۴ تصویر است و هر تصویر دارای ۵ شرح مرتبط با تصویر می باشد. از معیار BLUE برای ارزیابی مدل پیشنهادی استفاده شده است. در نهایت با پیاده سازی روش پیشنهادی معیار BLUE برابر با ۲۱.۹ شد.

کلیدواژه ها:

نویسندگان

نگین باقری پور

دانشجوی کارشناسی ارشد دانشگاه شهید چمران اهواز، اهواز، ایران

سیدعنایت اله علوی

استادیاردانشگاه شهید چمران اهواز، اهواز، ایران

محمود فرخیان

مربی دانشگاه شهید چمران اهواز، اهواز، ایران