CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طبقه بندی داده ها توسط الگوریتم های ماشین بردار پشتیبان و ازدحام ذرات در شرایط گم شدن داده ها

عنوان مقاله: طبقه بندی داده ها توسط الگوریتم های ماشین بردار پشتیبان و ازدحام ذرات در شرایط گم شدن داده ها
شناسه ملی مقاله: ITCT06_058
منتشر شده در ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات در سال 1398
مشخصات نویسندگان مقاله:

سارا نخعی - کارشناس ارشدمهندسی کامپیوتر،دانشکده کامپیوتر،دانشگاه غیرانتفاعی بهمنیار کرمان

خلاصه مقاله:
گمشده گی داده در تمامی پژوهش های علوم اجتماعی، رفتاری، پزشکی وجود دارد. در آمار ،گمشدن داده به وضعیتی گفته میشود که تعدادی از اطلاعات داده ها گزارش نشده باشند. گمشده گی داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و میتواند منجر به نتیجه گیری اشتباه در مورد جمعیت اصلی شود. گمشده گی داده یک اتفاق معمول بوده و بسته به میزان آن، می تواند اثر قابل توجهی در نتیجه گیری به دست آمده از داده ها داشته باشد. تمامی روشهای برآورد پارامترها بر پایه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراری این شرایط منجر به برآوردهایی نااریب می شوند؛ و البته با افزایش نسبت گمشدگی، مقدار اریبی نیز افزایش خواهد یافت.در این پژوهش بدین صورت عمل گردیده است که یک سری مجموعه داده واقعی بر حسب درصد گمشده گی مقادیری را از دست می دهند سپس بر اساس الگوریتم ازدحام ذرات مقادیر گمشده تخمین زده می شوند وبر اساس معیارمیانگین خطای مطلق میزان درصد خطای بدست آمده از روش ازدحام ذرات نسبت به مقادیر واقعی محاسبه می شود که این معیار بر اساس نتایج ارزیابی ، خطای کمتری را نشان میدهد و هر چه داده ها بیشتر باشند این معیار نیز به تناسب بیشتر می شود.سپس با استفاده از الگوریتم طبقه بندی svm برای طبقه بندی داده ها بر اساس مقادیر تعیین شده توسط الگوریتم ازدحام ذرات دقت حاصل با دقت طبقه بندی بر روی داده های حاصل ازپر کردن با میانگین ویژگی وهمچنین پرکردن داده ها با الگوریتم نزدیکترین همسایگی (K-NN) مقایسه میگردد.که در بخش ارزیابی نتایج نشان داده می شود که دقت طبقه بندی بر روی داده های بدست آمده از روش ازدحام ذرات نسبت به روشهای دیگر بالاتر است و هرچه درصد گمشدگی بیشتر شود این دقت کمتر می شود.

کلمات کلیدی:
داده های گمشده، ازدحام ذرات،داده کاوی، الگوریتم طبقه بندی svm ،دقت طبقه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/924239/