CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طبقه بندی سنی و پیشنهاد فیلم براساس شباهت محتوایی فیلم ها و رده سنی کاربر با استفاده از روش های بازیابی اطلاعات

عنوان مقاله: طبقه بندی سنی و پیشنهاد فیلم براساس شباهت محتوایی فیلم ها و رده سنی کاربر با استفاده از روش های بازیابی اطلاعات
شناسه ملی مقاله: CSICC27_043
منتشر شده در بیست و هفتمین کنفرانس بین المللی کامپیوتر انجمن کامپیوتر ایران در سال 1400
مشخصات نویسندگان مقاله:

امین نظری - دانشجوی دکتری، گرایش هوش مصنوعی، دانشگاه بوعلی سینا ، همدان
مجتبی کردآبادی - کارشناسی ارشد هوش مصنوعی، دبیر آموزش وپرورش همدان، همدان
محرم منصوری زاده - دانشیار گروه کامپیوتر ، دانشگاه بوعلی سینا، همدان

خلاصه مقاله:
در قرن حاضر شاهد تولید روزافزون فیلم های سینمایی مختلف در دسته بندی و ژانرهای متفاوت هستیم . بسیاری از این تولیدات خارج از ارزش هایی است که متناسب با مقتضیات سنی یک کودک یا نوجوان باشد. بسیاری از والدین نگران فرزندان خود در مواجه با این تولیدات هستند. بنابراین، طبقه بندی صحیح فیلم میتواند راهنمای مناسبی برای والدین باشد. در حال حاضر سیستم های موجود دسته بندی و پیشنهادگر فیلم، عوامل کمی و ... را در نظر میگیرند توجه کمتری به محتوای فیلم دارند. هدف از این تحقیق استفاده از روش های بازیابی اطلاعات برای شناسایی موضوع، ژانر و طبقه بندی سنی فیلم ها براساس متن آنها است. به گونه ای که بتوان از این دانش در توصیه فیلم، با توجه به محتوای فیلم و رده سنی کاربر بهره گرفت. در این پژوهش از روش مدل سازی موضوعی LDA استفاده شده است که با استفاده از کشف روابط پنهان بین واژگان، موضوعات اسناد و درصد مشارکت هر موضوع در هر سند را مشخص میکند. از LDA عالوه بر خوشه بندی اسناد، برای استخراج ویژگی های اسناد استفاده شده است، که منجر به کاهش ابعاد داده ها نسبت به روش های دیگر نمایش کلمات word embedding میشود. کاهش ابعاد داده، موجب بهبود عملکرد مدل های یادگیری ماشین میشود. نتایج پیاده سازی نشان میدهد که روش پیشنهادی با دقت %۹۳ توانایی تشخیص رده سنی کاربر دارد و با دقت %۸۹ در تشخیص ژانر موفق عمل میکند.

کلمات کلیدی:
پردازش زبان طبیعی، طبقه بندی متن، متنکاوی، مدل سازی موضوعی، شبکه عصبی، سیستم های پیشنهادگر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1452949/