بررسی روش های پیش پردازش داده های بزرگ برای افزایش دقت طبقه بندی آنها

مهدیه نیلگون بخت

بررسی روش های پیش پردازش داده های بزرگ برای افزایش دقت طبقه بندی آنها

محل انتشار: سومین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,167

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/649234

شناسه ملی سند علمی:

DCBDP03_098

تاریخ نمایه سازی: 14 شهریور 1396

چکیده مقاله:

انتخاب و استخراج یک یا چندین ویژگی محدود و در عین حال مهم و موثر، از بین تعداد بسیار زیادی از ویژگیهای مختلف، چالش اصلی و پیشپردازش ضروری بسیاری از الگوریتمهای طبقهبندی است. تا کنون الگوریتمهای بسیاری برای انتخاب یا استخراج بهینهی ویژگیها پیشنهاد شده است که بسته به کاربردشان، مزایا و معایب متفاوتی دارند. در این مقاله، ضمن توصیف وبررسی الگوریتمهای تحلیل تفکیکی خطی و بزرگترین زیر ماتریس نماینده، به ارزیابی کارآیی آنها در انتخاب و استخراج بهینه ویژگی از رشتههای ریزآرایهی دیانای پرداخته میشود که به دلیل بعد نسبتا بزرگ دادههای مذکور، کاهش ابعاد آن از طریقالگوریتمهای موثر، قبل از هر تحلیل کاربردی ضروری است. نتایج حاصل از ارزیابی کارآیی الگوریتمها در محیط نرمافزار متلب، نشان میدهد که تحلیل تفکیکی خطی در یک مجموعه دادهی دوکلاسی به شکل موثرتری منجر به کاهش بعد بهینه دادهها و دقتدر طبقهبندی نهایی میشود اما، پیچیدگی زمانی بیشتری را داشته و کندتر اجرا میشود؛ در حالیکه در دادههای دوکلاسی، الگوریتم بزرگترین زیرماتریس نماینده به طور متوسط 83 % دقت با وجود 30 % کاهش حجم داده را ممکن میکند.

کلیدواژه ها:

استخراج ویژگی ، انتخاب ویژگی ، بزرگترین زیرماتریس نماینده ، تحلیل تفکیکی خطی ، ریزآرایهی دی ان ای

نویسندگان

مهدیه نیلگون بخت

گروه علوم کامپیوتر، واحد شبستر، دانشگاه آزاد اسلامی، شبستر، ایران