ارزیابی و مقایسه روشهای استخراج ویژگی و طبقه بندی در تحلیل احساسات نقدهای فیلم

  • سال انتشار: 1403
  • محل انتشار: دومین کنفرانس بین المللی هوش مصنوعی و مهندسی نرم افزار
  • کد COI اختصاصی: AISOFT02_008
  • زبان مقاله: فارسی
  • تعداد مشاهده: 204
دانلود فایل این مقاله

نویسندگان

حمیدرضا قدیری جعفربیگلو

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی

محمدعلی تبرزد

گروه مهندسی کامپیوتر، واحد شیراز، دانشگاه آزاد اسلامی

چکیده

فیلم ها نه تنها به عنوان یک شکل از هنر، بلکه به عنوان یک وسیله ارتباطی قدرتمند عمل می کنند که می توانند فرهنگ ها، ایده ها و احساسات را به مخاطبان منتقل کنند. نقدهای فیلم، به ویژه در عصر دیجیتال، ابزار مهمی برای تحلیل و درک عمیق تر از محتوای سینمایی فراهم می کنند. با این حال، حجم بالای نقدهای موجود می تواند مخاطبان را سردرگم کند. در اینجا تحلیل احساسات می تواند به عنوان یک راهکار کارآمد به کار رود تا با دسته بندی سریع نقدها، به مخاطبان کمک کند که به سرعت تصویری کلی از بازخوردهای مثبت و منفی پیرامون یک فیلم داشته باشند. تحلیل احساسات که گاهی به عنوان نظرکاوی نیز شناخته می شود، از فنون پردازش زبان طبیعی (NLP) برای شناسایی و استخراج نظرات و احساسات موجود در متون استفاده می شود. یکی از الگوریتم های محبوب در این حوزه، ناییو بیز است که به دلیل فرض استقلال ویژگی ها، ساختار ساده و عملکرد کارآمد، به ویژه در وظایف طبقه بندی، بسیار مورد توجه قرار گرفته است. این الگوریتم با وجود سادگی، اغلب نتایج قابل توجهی را در تحلیل داده های متنی ارائه می دهد. این مطالعه، به ارزیابی عملکرد چندین مدل یادگیری ماشینی بر روی یک مجموعه داده نقدهای فیلم پرداخته است؛ که شامل ۴ الگوریتم طبقه بندی ناییو بیز و یک الگوریتم ریج و ۲ الگوریتم XGBoost، RandomForest (همراه با چهار تکنیک برداری Count Vectorizer، TF-IDF، Word۲Vec، GloVe) استفاده شده است. مدل طبقه بندی ریج با استفاده از TF-IDF بهترین عملکرد را نسبت به سایر الگوریتم های طبقه بندی روی مجموعه داده های IMDb نشان داده است.

کلیدواژه ها

تحلیل احساسات, ناییو بیز, ریج, TF-IDF, مجموعه داده IMDb

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.