پیشگویی مقادیر صفات مفقود شده

  • سال انتشار: 1386
  • محل انتشار: دهمین کنفرانس دانشجویی مهندسی برق ایران
  • کد COI اختصاصی: ISCEE10_228
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1341
دانلود فایل این مقاله

نویسندگان

محمدحسین نوروزی بیرامی

بورسیه دانشگاه آزاد اسلامی واحد اسکو، دانشکده مهندسی کامپیوتر

فریبرز محمودی

عضو هیئت علمی دانشگاه آزاد اسلامی واحد قزوین، دانشکده برق، رایانه و ف

چکیده

مسئله پیشگویی مقادیر صفات مفقود شده Predicting Missing Attribute Values در داده کاوی و کشف دانش از پایگاه داده درسال های اخیر مورد توجه محققان قرار گرفته است. روش های مختلفی برای برخورد با این مقادیر پشنهاد شده است که ساده ترین آنها نادیده گرفتن مقادیر مفقود شده می باشد که این صورت به راحتی اطلاعات با ارزشی از بین می رود. روش های دیگری نیز مثل انتصاب مقادیر بسیار معمول و یا انتصاب میانگین مقادیر برای این صفات وجود دارد که استفاده بهتری از همه داده های در دسترس می نماید. با .[ وجود این ممکن است داده های بدست آمده مطابق اطلاعات اصلی نباشد که موجب اختلال در داده ها می شود[ 5 در این مقاله خلاصه ای از روش های موجود را برای پیشگویی مقادیر مفقود شده ارائه نماییم. در سال های اخیر سه روش عمده برای برخورد با این مسئله پیشنهاد شده است. 1) الگوریتم های بر پایه نظریه مجموعه های نادقیق 2) روش های مبتنی بر تکرار که تاکید بر روی تکرار مقادیر در مجموعه داده ها دارد. 3) روش های مبتنی بر تولید قوانین تصمیم برای بدست آوردن یک چارچوب کلی از داده ها. هر کدام از روش های ارائه شده مزایا و معایبی دارند که در این مقاله مورد بررسی قرار می دهیم.

کلیدواژه ها

نظریه مجموعه های نادقیق، قوانین انجمنی، قوانین تصمیم

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.