دسته بندی و حاشیه نویسی تصویر با استفاده از مدل های احتمالاتی موضوع با ورودی های وزن دار

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 626

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI22_088

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

دسته بندی و حاشیه نویسی تصاویر از جمله مسایل پرکاربرد در حوزه پردازش تصاویر هستند. تا کنون تلاش های زیادی به منظور استفاده از مدل های موضوعی نظیر مدل احتمالاتی LDA جهت دسته بندی و حاشیه نویسی همزمان تصاویر صورت گرفته است. اخیرا مدل های موضوع دیگری بر مبنای شبکه های عصبی احتمالاتی نظیر SupDocNADE معرفی شده اند که نتایج خوبی در مدل کردن داده های چند مقداری مانند دسته‎بندی و حاشیه نویسی تصاویر ارایه داده اند. در این مدل ها کلمات حاشیه نویسی نیز در کنار کلمات بصری تعبیه شده و به عنوان بردار ویژگی برای شبکه در نظر گرفته می شود. در عمل تعداد ویژگی های استخراج شده از تصویر بسیار بزرگتر از ویژگی هایی است که از کلمات حاشیه نویسی بدست می آیند. عدم تعادل بین کلمات بصری و حاشیه نویسی سبب می شود تا سهم کلمات حاشیه نویسی برای بازنمایی در لایه پنهان شبکه عصبی مورد استفاده در این مدل، بسیار کمتر از کلمات بصری باشد. از طرفی گرادیانی که از کلمات حاشیه نویسی تولید می شود بسیار کوچک بوده تا بتواند تاثیر قابل توجهی در افزایش احتمال شرطی حاصل از کلمات حاشیه نویسی داشته باشد. در این مقاله، برای حل مشکلات عدم تعادل ویژگی ها، از وزن دهی کلمات حاشیه نویسی در هیستوگرام بردار ویژگی استفاده می شود. با آزمایش مدل پیشنهادی برروی پایگاه داده های UIUC_Sports و LabelMe، بهبود 5 درصدی در معیارF در کلمات حاشیه نویسی نسبت به مدل های موجود مشاهده می شود.

کلیدواژه ها:

دسته بندی و حاشیه نویسی تصویر ، مدل های موضوع ، مدل احتمالاتی ، شبکه عصبی

نویسندگان

سیدنوید محمدی فومنی

دانشجوی کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، تهران

احمد نیک آبادی

استادیار، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر و فناوری اطلاعات، تهران