بررسی روش های پیش پردازش داده های بزرگ برای افزایش دقت طبقه بندی آنها

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 876

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP03_098

تاریخ نمایه سازی: 14 شهریور 1396

چکیده مقاله:

انتخاب و استخراج یک یا چندین ویژگی محدود و در عین حال مهم و موثر، از بین تعداد بسیار زیادی از ویژگیهای مختلف، چالش اصلی و پیشپردازش ضروری بسیاری از الگوریتمهای طبقهبندی است. تا کنون الگوریتمهای بسیاری برای انتخاب یا استخراج بهینهی ویژگیها پیشنهاد شده است که بسته به کاربردشان، مزایا و معایب متفاوتی دارند. در این مقاله، ضمن توصیف وبررسی الگوریتمهای تحلیل تفکیکی خطی و بزرگترین زیر ماتریس نماینده، به ارزیابی کارآیی آنها در انتخاب و استخراج بهینه ویژگی از رشتههای ریزآرایهی دیانای پرداخته میشود که به دلیل بعد نسبتا بزرگ دادههای مذکور، کاهش ابعاد آن از طریقالگوریتمهای موثر، قبل از هر تحلیل کاربردی ضروری است. نتایج حاصل از ارزیابی کارآیی الگوریتمها در محیط نرمافزار متلب، نشان میدهد که تحلیل تفکیکی خطی در یک مجموعه دادهی دوکلاسی به شکل موثرتری منجر به کاهش بعد بهینه دادهها و دقتدر طبقهبندی نهایی میشود اما، پیچیدگی زمانی بیشتری را داشته و کندتر اجرا میشود؛ در حالیکه در دادههای دوکلاسی، الگوریتم بزرگترین زیرماتریس نماینده به طور متوسط 83 % دقت با وجود 30 % کاهش حجم داده را ممکن میکند.

نویسندگان

مهدیه نیلگون بخت

گروه علوم کامپیوتر، واحد شبستر، دانشگاه آزاد اسلامی، شبستر، ایران