طبقه بندی داده ها توسط الگوریتم های ماشین بردار پشتیبان و ازدحام ذرات در شرایط گم شدن داده ها

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 500

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT06_058

تاریخ نمایه سازی: 24 شهریور 1398

چکیده مقاله:

گمشده گی داده در تمامی پژوهش های علوم اجتماعی، رفتاری، پزشکی وجود دارد. در آمار ،گمشدن داده به وضعیتی گفته میشود که تعدادی از اطلاعات داده ها گزارش نشده باشند. گمشده گی داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و میتواند منجر به نتیجه گیری اشتباه در مورد جمعیت اصلی شود. گمشده گی داده یک اتفاق معمول بوده و بسته به میزان آن، می تواند اثر قابل توجهی در نتیجه گیری به دست آمده از داده ها داشته باشد. تمامی روشهای برآورد پارامترها بر پایه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراری این شرایط منجر به برآوردهایی نااریب می شوند؛ و البته با افزایش نسبت گمشدگی، مقدار اریبی نیز افزایش خواهد یافت.در این پژوهش بدین صورت عمل گردیده است که یک سری مجموعه داده واقعی بر حسب درصد گمشده گی مقادیری را از دست می دهند سپس بر اساس الگوریتم ازدحام ذرات مقادیر گمشده تخمین زده می شوند وبر اساس معیارمیانگین خطای مطلق میزان درصد خطای بدست آمده از روش ازدحام ذرات نسبت به مقادیر واقعی محاسبه می شود که این معیار بر اساس نتایج ارزیابی ، خطای کمتری را نشان میدهد و هر چه داده ها بیشتر باشند این معیار نیز به تناسب بیشتر می شود.سپس با استفاده از الگوریتم طبقه بندی svm برای طبقه بندی داده ها بر اساس مقادیر تعیین شده توسط الگوریتم ازدحام ذرات دقت حاصل با دقت طبقه بندی بر روی داده های حاصل ازپر کردن با میانگین ویژگی وهمچنین پرکردن داده ها با الگوریتم نزدیکترین همسایگی (K-NN) مقایسه میگردد.که در بخش ارزیابی نتایج نشان داده می شود که دقت طبقه بندی بر روی داده های بدست آمده از روش ازدحام ذرات نسبت به روشهای دیگر بالاتر است و هرچه درصد گمشدگی بیشتر شود این دقت کمتر می شود.

کلیدواژه ها:

نویسندگان

سارا نخعی

کارشناس ارشدمهندسی کامپیوتر،دانشکده کامپیوتر،دانشگاه غیرانتفاعی بهمنیار کرمان