اعمال مدل های رگرسیون بر زیرمجموعه های با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 265

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-48-3_022

تاریخ نمایه سازی: 17 تیر 1398

چکیده مقاله:

حضور مقادیر جاافتاده در داده های دنیای واقعی مشکلی بسیار رایج و غیرقابل اجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده به طور دقیق پر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد می شود. در تمامی روش های پیشنهادی، مدل های رگرسیون بر زیرمجموعه هایی با همبستگی بالا اعمال می شوند. در انتخاب زیرمجموعه های مطلوب سعی می شود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعه ها با استفاده از رویکردهایی مبتنی بر انتخاب روبه جلو انجام می شود. از معیار ضریب همبستگی برای اندازه گیری میزان ارتباط بین صفات استفاده شده است. همچنین در روش های پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویت دهی می شوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعه داده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابی شده است. عملکرد رویکردهای ارائه شده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیک ترین همسایگان، روش جایگذاری با خوشه بندی c-means فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام الگوریتم جایگذاری با رگرسیون افزایشی صفات (IARI) مقایسه شده است. از دو معیار شناخته شده ی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روش های جایگذاری استفاده شده است. نتایج آزمایش ها نشان می دهد که رویکردهای ارائه شده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روش های مقایسه شده عمل می کنند.

نویسندگان

امیرمسعود سفیدیان

دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران

نگین دانشپور

دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مرتضی خرم کشکولی و مریم دهقانی، تشخیص، شناسایی و جداسازی ... [مقاله ژورنالی]
  • علیرضا سردار و رمضان هاونگی، بهبود عملکرد الگوریتم خوشه یابی ... [مقاله ژورنالی]
  • Y. Qin, S. Zhang, X. Zhu, J. Zhang, and C. ...
  • G. Sun, J. Shao, H. Han, and X. Ding, Missing ...
  • M. Lichman, UCI Machine Learning Repository, Available online at: http://archive.ics.uci.edu/ml, ...
  • P. J. Garcia-Laencina, J. L. Sancho-Gomez, and AR. Figueiras-Vidal, Pattern ...
  • E. L. Silva-Ramrez, R. Pino-Mejas, and M. Lpez-Coello, Single imputation ...
  • M. G. Rahman and M. Z. Islam, Missing value imputation ...
  • M. Amiri and R. Jensen, Missing data imputation using fuzzy-rough ...
  • H. Wang and S. Wang, Mining incomplete survey data through ...
  • C.F. Tsai and F.Y. Chang, Combining instance selection for better ...
  • C. T. Tran, M. Zhang, P. Andreae, and B. Xue, ...
  • M. G. Rahman and M. Z. Islam, Data quality improvement ...
  • B. van Stein and W. Kowalczyk, An incremental slgorithm for ...
  • G. Rahman and Z. Islam, A decision tree-based missing value ...
  • L. Breiman, Random Forests, Machine learning, vol. 45, no. 1, ...
  • C.H. Wu, C.H. Wun, and H.J. Chou, Using association rules ...
  • N. Singh, A. Javeed, S. Chhabra, and P. Kumar, Missing ...
  • J. Han, M. Kamber, and J. Pei, Data Mining: Concepts ...
  • C. Jiang and Z. Yang, CKNNI: an improved knn-based missing ...
  • R. Krishnamoorthy, S. S. Kumar, and B. Neelagund, A new ...
  • C. Zhang, X. Zhu, J. Zhang, Y. Qin, and S. ...
  • B. M. Patil, R. C. Joshi, and D. Toshniwal, Missing ...
  • V. Ayuyev, J. Jupin, P. Harris, and Z. Obradovic, Dynamic ...
  • D. Li, J. Deogun, W. Spaulding, and B. Shuart, Towards ...
  • P. Raja and K. Thangavel, Soft clustering based missing value ...
  • N. Ankaiah and V. Ravi, A novel soft computing hybrid ...
  • S. Azim, S. Aggarwal, Hybrid model for data imputation: using ...
  • S. Bashir, S. Razzaq, U. Maqbool, S. Tahir, and A. ...
  • D. R. Wilson and T. R. Martinez, Reduction techniques for ...
  • Batista, G. E., & Monard, M. C. (2002). A study ...
  • F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, ...
  • نمایش کامل مراجع