بررسی فرایند تولید عنوان تصویر با مدل CNN -RNN

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 414

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFITC06_069

تاریخ نمایه سازی: 3 خرداد 1401

چکیده مقاله:

برای تولید یک جمله عنان برای یک تصویر، نیاز است که مباحثی چون پردازش زبان طبیعی پردازش تصویر با یکدیگر تلفیق شوند. در نتیجه استفاده از الگوریتم های شبکه ی عصبی برای این مساله، موضوعیت پیدا می کند . پردازش متن نیاز به الگوریتمی دارد که بتوان با استفاده از متون موجوددر فرایند پردازش (یا متن قبلی پردازش شده)، متن های پیش رو (که بناست تولید شود) را پیش بینی و تولید کرد، که نیاز به استفاده از شبکه های عصبی بازگشتی بوجود می آید؛ و همچنین در مبحث پردازش نیز الگوریتم شبکه عصبی کانولوشنال، برای استخراج ویژگی های یک تصویر استفاده می شود. در نتیجه با تلفیق این دو، به نحوی که نتایج استخراج ویژگی های یک تصویر، در اختیار ورودی های ماژول پردازش متن قرار بگیرد، برای ساخت و پیش بینی عنوان با استفاده از الگوریتم های شبکه عصبی، اقداماتی صورت گرفته است. اما برای تولید نتایج دقیق تر به نیاز مقدار داده زیاد برای آموزش و مدل سازی نیاز است، که در این مقاله تمامی نتایج ارائه شده از دقت بالا برخوردار نیستند و برخی دارای خطا هستند. و مقدار خطا در مدل تشکیل شده، پس از ۱۰ مرحله به کمترین مقدار خود یعنی ۲/۲۹۷۳ می رسد.

کلیدواژه ها:

شبکه ی عصبی کانولوشنال ، شبکه ی عصبی با گشتی ، پردازش زبان طبیعی ، پردازش تصویر ، تولید عنوان تصویر

نویسندگان

سید امیر عطارحسینی

دانشجوی کارشناسی ارشد مهندسی رایانه، دانشگاه جامع امام حسین (ع)، تهران

محمدعلی جوادزاده

استادیار دانشگاه جامع امام حسین (ع)،تهران