دسته بندی و حاشیه نویسی تصویر با استفاده از مدل های احتمالاتی موضوع با ورودی های وزن دار
- سال انتشار: 1395
- محل انتشار: بیست و دومین کنفرانس ملی سالانه انجمن کامپیوترایران
- کد COI اختصاصی: ACCSI22_088
- زبان مقاله: فارسی
- تعداد مشاهده: 721
نویسندگان
دانشجوی کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، تهران
استادیار، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر و فناوری اطلاعات، تهران
چکیده
دسته بندی و حاشیه نویسی تصاویر از جمله مسایل پرکاربرد در حوزه پردازش تصاویر هستند. تا کنون تلاش های زیادی به منظور استفاده از مدل های موضوعی نظیر مدل احتمالاتی LDA جهت دسته بندی و حاشیه نویسی همزمان تصاویر صورت گرفته است. اخیرا مدل های موضوع دیگری بر مبنای شبکه های عصبی احتمالاتی نظیر SupDocNADE معرفی شده اند که نتایج خوبی در مدل کردن داده های چند مقداری مانند دستهبندی و حاشیه نویسی تصاویر ارایه داده اند. در این مدل ها کلمات حاشیه نویسی نیز در کنار کلمات بصری تعبیه شده و به عنوان بردار ویژگی برای شبکه در نظر گرفته می شود. در عمل تعداد ویژگی های استخراج شده از تصویر بسیار بزرگتر از ویژگی هایی است که از کلمات حاشیه نویسی بدست می آیند. عدم تعادل بین کلمات بصری و حاشیه نویسی سبب می شود تا سهم کلمات حاشیه نویسی برای بازنمایی در لایه پنهان شبکه عصبی مورد استفاده در این مدل، بسیار کمتر از کلمات بصری باشد. از طرفی گرادیانی که از کلمات حاشیه نویسی تولید می شود بسیار کوچک بوده تا بتواند تاثیر قابل توجهی در افزایش احتمال شرطی حاصل از کلمات حاشیه نویسی داشته باشد. در این مقاله، برای حل مشکلات عدم تعادل ویژگی ها، از وزن دهی کلمات حاشیه نویسی در هیستوگرام بردار ویژگی استفاده می شود. با آزمایش مدل پیشنهادی برروی پایگاه داده های UIUC_Sports و LabelMe، بهبود 5 درصدی در معیارF در کلمات حاشیه نویسی نسبت به مدل های موجود مشاهده می شود.کلیدواژه ها
دسته بندی و حاشیه نویسی تصویر، مدل های موضوع، مدل احتمالاتی، شبکه عصبیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.