پاسخ دهی خودکار به پرسش های مربوط به محتوای تصاویر به زبان فارسی با استفاده از تکنیک های مبتنی بر یادگیری عمیق
- سال انتشار: 1401
- محل انتشار: هجدهمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: CECCONF18_030
- زبان مقاله: فارسی
- تعداد مشاهده: 334
نویسندگان
دانش آموخته کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان
دانشجو کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان
چکیده
امروزه پاسخ دهی خودکار به پرسش های مربوط به محتوای تصاویر (سیستم پرسش و پاسخ تصویری) کاربرد فراوانی دارد. درسیستم های پرسش و پاسخ تصوبری. یک تصویر و یک سوال متنی در مورد تصویر به عنوان ورودی در نظر گرفته می شود واین سیستم باید پاسخ صحیح به پرسش مطرح شده را پیش بینی کند. هدف اصلی در این سیستم ها بالا بودن دقت صحتپاسخ پیش بینی شده است. برای این منظور عوامل مختلفی از جمله انتخاب شبکه های عصبی مناسب جهت پردازشورودی ها و انتخاب مجموعه داده مناسب بسیار مهم است. همچنین استفاده از انواع مختلف سازوکار توجه در مدل می تواندباعث بهبود عملکرد کلی سیستم پرسش و پاسخ تصویری شود. تا به امروز پژوهش های اندکی در مورد سیستم های پرسش وپاسخ تصویری به زبان فارسی انجام شده است. از همین رو در این مقاله به معرفی یک سیستم پرسش و پاسخ تصویری بهزبان فارسی پرداختیم. در مدل پیشنهادی، ما از شبکه عصبی کانولوشنی با معماری ResNext جهت پردازش تصویراستفاده کردیم که برای اولین بار در سیستم پرسش و پاسخ تصویری استفاده شده است. برای پردازش متن ورودی نیز ازشبکه عصبی بازگشتی از نوع حافظه کوتاه مدت طولانی دوسویه استفاده کردیم. همچنین از دو نوع سازوکار توجه در مدلپیشنهادی استفاده شده است. نتیجه حاصل شده نشان می دهد که دقت صحت پاسخ پیش بینی شده در مدل پیشنهادی اینمقاله، بالاترین مقدار بدست آمده نسبت به نمونه های موجود به زبان فارسی است. جزئیات پیاده سازی و کدهای این مقالهدر لینک زیر موجود می باشد: https://github.com/amirshnll/persian-visual-question-answeringکلیدواژه ها
سیستم پرسش و پاسخ تصویری، شبکه عصبی کانولوشنی، شبکه عصبی بازگشتی، سازوکار توجهمقالات مرتبط جدید
- بررسی اثر سیستم مدیریت ایمنی، بهداشت، محیط زیست بر عملکرد سازمان (مطالعه موردی: شرکت سنگ آهن گهرزمین)
- اصول آرماتور گذاری در پی ، دیوار و ستون ساختمان
- بررسی اصول مهم در طراحی نمای ساختمان ها
- اصول معماری سبز و روش دستیابی به ساختمان های سبز در زمان طراحی
- Control and intelligent simulation of electromechanical devices in communication networks
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.