افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 456

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECTCONF02_022

تاریخ نمایه سازی: 6 شهریور 1399

چکیده مقاله:

اصطلاح داده های بزرگ برای داده های محاسباتی و یا اطلاعاتی که می تواند تجزیه و تحلیل شود یا برای استفاده از تکنیک ها و ابزارهای سنتی یادگیری ماشین بکار رود، مفید است. تعریف کلی از داده های بزرگ نشان می دهد کاهش داده های محاسباتی بیش از حد سریع، گسترده و یا بیش از حد برای پردازش سخت هستند. مسئله انتخاب ویژگی، یکی از مسائلی است که در مبحث یادگیری ماشین و همچنین شناسایی الگوی آماری مطرح است. این مسئله در بسیاری از کاربردها (مانند طبقه بندی) اهمیت زیادی دارد، زیرا در این کاربردها تعداد زیادی از ویژگی ها وجود دارد که بسیاری از آنها یا بلا استفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کند ولی بار محاسباتی را برای کاربرد مورد نظر بالا می برد؛ علاوه بر این باعث می شود که اطلاعات غیرمفید زیادی را به همراه داده های مفید ذخیره کنیم ما در این پایان نامه با استفاده از استخراج ویژگی و الگوریتم ژنتیک توانستیم روشی اراله دهیم تا تحلیل نظرات کاربران درباره فیلم های سینمایی را انجام دهیم، در این روش با انتخاب ویژگی هر نظر در قالب یک برداری عددی ذخیره می شود و سپس توسط الگوریتم ژنتیک نوع جمله از نظر مثبت و منفی بودن مشخص شده و تحلیل آماری انجام می شود.

نویسندگان

صبا چهل امیران

دپارتمان مهندسی برق و کامپیوتر - دانشکده زینب کبری - دانشگاه فنی و حرفه ای استان همدان ایران