استفاده از تکنولوژی داده های عظیم در نظرکاوی
محل انتشار: مجله محاسبات نرم، دوره: 9، شماره: 1
سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 227
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_SCJKA-9-1_003
تاریخ نمایه سازی: 31 تیر 1401
چکیده مقاله:
نظرات، نقش مهم و تعیین کننده ای در فرآیند تصمیم گیری چه برای مشتریان و چه برای سازمان های تجاری ایفا می کنند. از این رو، وجود سیستم های خودکار نظرکاوی برای داده های نظری موجود در وب، ضروری به نظر می رسد. از طرفی، با حجم بالا و رشد روزافزون داده های نظری روی وب، فرآیند نظرکاوی می تواند با چالشی بزرگ روبه رو شود؛ چرا که پردازش و تحلیل این حجم عظیم از داده ها با تکنولوژی های متداول، ممکن است عملی نباشد. در صورتی که سیستم های کاوش نظرات به تکنولوژی های داده های عظیم مجهز شوند، بدون نگرانی از مدیریت، ذخیره سازی و مدیریت حجم روزافزون داده های نظری، می توانند به کار خود ادامه دهند. با آنکه در سال های اخیر تحقیقات زیادی در حوزه تحلیل حسی نظرات انجام شده است، اما تلاش های کمی در حوزه کاوش داده های نظری در حیطه زبان فارسی در مقیاس بالا انجام گرفته است. از این رو، در این تحقیق، دو روش نظرکاوی برای داده های زبان فارسی با استفاده از یک لغت نامه حسی زبان فارسی در بستر تکنولوژی داده های عظیم ارائه شده است. برای ذخیره سازی و پردازش داده های نظری از چارچوب متداول و کارای هدوپ و مدل برنامه نویسی نگاشت_کاهش (MapReduce) استفاده شده است. نتایج به دست آمده از آزمایش ها حاکی از آن است که چارچوب پیشنهادی برای نظرکاوی به شکلی کارا عمل کرده و نه تنها برای حجم های بالا بلکه در حجم های حدود ۲۰ مگابایت شاهد افزایش ۱۰۰ برابری در کارامدی هستیم. این ضریب، در حجم های بالاتر به شکل محسوس تری افزایش می یابد.
کلیدواژه ها:
نویسندگان
فاطمه پورغلامعلی
دانشکده مهندسی، دانشگاه ولیعصر (عج) رفسنجان، رفسنجان، ایران
محسن کاهانی
دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
احسان عسگریان
دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :