افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 164

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JWS-1-1_004

تاریخ نمایه سازی: 28 آذر 1400

چکیده مقاله:

اصطلاح داده های بزرگ برای داده های محاسباتی و یا اطلاعاتی که می تواند تجزیه و تحلیل شود یا برای استفاده از تکنیک هاو ابزارهای سنتی یادگیری ماشین به کار رود، مفید است. تعریف کلی از داده های بزرگ نشان می دهد که داده های محاسباتی بیش ازحد سریع، گسترده و یا بیش از حد برای پردازش سخت هستند. مسئله انتخاب ویژگی، یکی از مسائلی است که در مبحث یادگیریماشین و همچنین شناسایی الگوی آماری مطرح است. این مسئله در بسیاری از کاربردها (مانند طبقه بندی) اهمیت زیادی دارد، زیرادر این کاربردها تعداد زیادی از ویژگی ها وجود دارد که بسیاری از آنها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند.حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کند، ولی بار محاسباتی را برای کاربرد مورد نظر بالا می برد؛ و علاوه براین باعث می شود که اطلاعات غیرمفید زیادی را به همراه داده های مفید ذخیره گردد. در این پژوهش با استفاده از استخراج ویژگی والگوریتم ژنتیک روشی ارائه شده است تا تحلیل نظرات کاربران درباره فیلم های سینمایی را انجام گیرد، در این روش با انتخاب ویژگیهر نظر در قالب یک برداری عددی ذخیره می شود و سپس توسط الگوریتم ژنتیک نوع جمله از نظر مثبت و منفی بودن مشخص شدهو تحلیل آماری انجام می شود.

نویسندگان

صبا چهل امیران

دپارتمان مهندسی برق و کامپیوتر، دانشکده زینب کبری، دانشگاه فنی و حرفه ای استان همدان، همدان، ایران