مروری بر روش های پیش بینی مقدار Miss Value در الگوریتم C4.5
- سال انتشار: 1395
- محل انتشار: اولین کنفرانس بین المللی دستاوردهای نوین پژوهشی در مهندسی برق و کامپیوتر
- کد COI اختصاصی: CBCONF01_0547
- زبان مقاله: فارسی
- تعداد مشاهده: 1456
نویسندگان
دانشجوی کارشناسی ارشد، مهندسی کامپیوتر (نرم افزار)، دانشگاه غیرانتفاعی بعثت کرمان
استادیار بخش مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید باهنر کرمان
چکیده
اغلب دیتاست های مربوط به ماشین یادگیری و داده کاوی دارای داده هایی با مقادیر Miss Value (داده گمشده) میباشند. چگونگی برخورد با Miss Value و نیز ارائه راهکارهایی مبنی بر پیش بینی مقدار مربوط به Miss Value ،منجر به بروز یک مسئله بسیار مهم در زمینه ماشین یادگیری و داده کاوی شده است. در بین الگوریتم های داده کاوی،الگوریتم C4.5 ، به دلیل کارآیی ، استفاده در کاربردهای مختلف داده کاوی و نیز توانایی در کار کردن و پیش بینی مقدارMiss Value در دیتاست ، به طور مکرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهایمتعددی جهت برخورد با مقادیر Miss Value و پیش بینی مقدار آن در الگوریتم C4.5 ارائه داده اند که هر یک ازروش ها به نحوی موجب افزایش دقت درخت تصمیم و در نتیجه تولید یک درخت تصمیم موثر و کاراتر شده است.لذا درمقاله حاضر به بررسی و مرور روش ها و راهکارهای ارائه شده و نیز دقت به دست آمده از هریک از روش ها، خواهیمپرداخت.کلیدواژه ها
ماشین یادگیری، داده کاوی، Miss Value ،الگوریتم C4.5 ، دقت، درخت تصمیممقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.