ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 679

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICMVIP10_023

تاریخ نمایه سازی: 2 تیر 1397

چکیده مقاله:

ساخت توصیف تصویر بصورت خودکار، یکزمینه پژوهشی کلیدی در جامعه ی یادگیری ماشین است.با این حال بسیاری از پژوهش های اخیر روی ساخت توصیفانگلیسی انجام شده و زبان های دیگر مثل زبان فارسی،کمتر مورد توجه قرار گرفته است. در این مقاله، یک شبکهعصبی بازگشتی مالتی مودال (MRNN) برگرفته از [3]Karpathy and Fei-Fei, 2015 روی مجموعه داده Flickr8k باتوصیفات فارسی، آموزش داده شده است. مدل آموزش داده شده ی حاصل، با معیارهای CIDEr, BLEU score و Perplexity مورد ارزیابی قرار گرفته و با مدل انگلیسی ارایه شده در [ 3] و همچنین با ترجمه مدل [3] به فارسی، مقایسه شده است. مدل آموزش داده شده، بسیارنزدیک به مدل آموزش دیده توسط [3] روی توصیفاتانگلیسی است و همچنین از حالت ترجمه ای نیز بهتر عملمی کند. لذا میتوان نتیجه گرفت که مدل RNN بصورت عمومی خوب عمل می کند و یا حداقل برای سیستم هایتوصیف تصویر برای زبان های مختلف بطور مشابه کار می کند.

نویسندگان

حسن ملکی گلندوز

دانشگاه شهید بهشتی تهران

محسن ابراهیمی مقدم

دانشگاه شهید بهشتی تهران