اعمال مدل های رگرسیون بر زیرمجموعه های با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی
سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 265
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-48-3_022
تاریخ نمایه سازی: 17 تیر 1398
چکیده مقاله:
حضور مقادیر جاافتاده در داده های دنیای واقعی مشکلی بسیار رایج و غیرقابل اجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده به طور دقیق پر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد می شود. در تمامی روش های پیشنهادی، مدل های رگرسیون بر زیرمجموعه هایی با همبستگی بالا اعمال می شوند. در انتخاب زیرمجموعه های مطلوب سعی می شود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعه ها با استفاده از رویکردهایی مبتنی بر انتخاب روبه جلو انجام می شود. از معیار ضریب همبستگی برای اندازه گیری میزان ارتباط بین صفات استفاده شده است. همچنین در روش های پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویت دهی می شوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعه داده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابی شده است. عملکرد رویکردهای ارائه شده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیک ترین همسایگان، روش جایگذاری با خوشه بندی c-means فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام الگوریتم جایگذاری با رگرسیون افزایشی صفات (IARI) مقایسه شده است. از دو معیار شناخته شده ی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روش های جایگذاری استفاده شده است. نتایج آزمایش ها نشان می دهد که رویکردهای ارائه شده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روش های مقایسه شده عمل می کنند.
کلیدواژه ها:
نویسندگان
امیرمسعود سفیدیان
دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران
نگین دانشپور
دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :