بررسی نظرکاوی جملات فارسی با تکنیک های N-grams

  • سال انتشار: 1400
  • محل انتشار: چهارمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران
  • کد COI اختصاصی: STCONF04_149
  • زبان مقاله: فارسی
  • تعداد مشاهده: 246
دانلود فایل این مقاله

نویسندگان

عماد نعمتی

دانشجوی ارشد مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب

پریسا دانشجو

استادیار گروه مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب

چکیده

در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربران مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی NLP ، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این پژوهش با استفاده از نظرات فارسی تلفن همراه سایت دیجی کالا در تکنیک های مختلف N-grams و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک و جنگل تصادفی و همچنین استفاده این الگوریتم ها در تکنیک های مختلف N-grams در هفت برند مختلف تلفن همراه از جمله Huawei ، LG ، Samsung ، Sony ، HTC ، Nokia و Apple و به منظور دستیابی به عملکرد آنها براساس پارامترهایی مانند صحت، بازیابی و دقت مورد بررسی قرار داده ایم. در نتیجه در همه روش های N-grams به جز روش سه واژه ای دقت و صحت و بازیابی به دست آمده توسط الگوریتم جنگل تصادفی بین ۸۸ تا ۹۱ درصد و همچنین دقت به دست آمده توسطالگوریتم جنگل تصادفی با میانگین ۹۹ درصد و الگوریتم کاهش گرادیان تصادفی با میانگین ۹۸ درصد در تمام برندهای مختلف عملکرد بهتری نسبت به الگوریتم های دیگر دارند.

کلیدواژه ها

شبکه اجتماعی، الگوریتم هوشمند، N-grams ، دیجی کالا، تلفن همراه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.