مروری بر تولید توصیف تصویر با بررسی کارایی مکانیزم

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 358

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NREAS03_249

تاریخ نمایه سازی: 16 آبان 1400

چکیده مقاله:

ایجاد توصیف برای تصویر، یک زمینه تحقیق بین رشته ای بینایی ماشین و پردازش زبان طبیعی است که توجه بسیاری را به خود جلب کرده است. برای تولید توصیف تصویر نیاز به تشخیص اشیا مهم و ویژگی ها و ارتباط آنها در یک تصویر است و همچنین باید جملاتی تولید شود که از لحاظ معنایی و نحوی صحیح باشند. براساس نتایج مطالعات و دقتهای گزارش شده این کار برای ماشین، کار دشواری است که مانند انسان توانایی درک تصویر را داشته باشند. با این حال هوش مصنوعی زمینه اکتشافات هوشمند را در این زمینه نیز فراهم کرده است. در این مطالعه، ما روش های پیشرفته عمیق را به دسته های مختلف شامل معماری مبتنی بر فضای چند حالته، شبکه های مولد و شبکه های مبتنی بر مکانیزم توجه، طبقه بندی کرده ایم. سپس با بررسی نقاط ضعف و قوت آنها نشان داده میشود که شبکه های مولد همراه با مکانیزم توجه عملکرد بهتری خواهند داشت. همچنین مجموعه داده های مرتبط و معیارهای ارزیابی استفاده شده برای مدل های توصیف تصویر مورد بحث قرار میگیرند.

کلیدواژه ها:

توصیف تصویر ، شبکه های عصبی عمیق ، بینایی ماشین ، پردازش زبان های طبیعی ، مکانیزم توجه

نویسندگان

زهرا فامیل ستاری

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان.

حسن ختن لو

عضو هیات علمی (استاد)، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان

الهام علی قارداش

دانشجوی دکتری، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان.