بررسی نظرکاوی جملات فارسی با تکنیک های N-grams
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 227
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
STCONF04_149
تاریخ نمایه سازی: 26 مهر 1400
چکیده مقاله:
در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربران مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی NLP ، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این پژوهش با استفاده از نظرات فارسی تلفن همراه سایت دیجی کالا در تکنیک های مختلف N-grams و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک و جنگل تصادفی و همچنین استفاده این الگوریتم ها در تکنیک های مختلف N-grams در هفت برند مختلف تلفن همراه از جمله Huawei ، LG ، Samsung ، Sony ، HTC ، Nokia و Apple و به منظور دستیابی به عملکرد آنها براساس پارامترهایی مانند صحت، بازیابی و دقت مورد بررسی قرار داده ایم. در نتیجه در همه روش های N-grams به جز روش سه واژه ای دقت و صحت و بازیابی به دست آمده توسط الگوریتم جنگل تصادفی بین ۸۸ تا ۹۱ درصد و همچنین دقت به دست آمده توسطالگوریتم جنگل تصادفی با میانگین ۹۹ درصد و الگوریتم کاهش گرادیان تصادفی با میانگین ۹۸ درصد در تمام برندهای مختلف عملکرد بهتری نسبت به الگوریتم های دیگر دارند.
کلیدواژه ها:
نویسندگان
عماد نعمتی
دانشجوی ارشد مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب
پریسا دانشجو
استادیار گروه مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب