جانشینی مقادیر گمشده و تاثیر آن بر خطای کلاسه بندی
- سال انتشار: 1394
- محل انتشار: کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات
- کد COI اختصاصی: ITCC01_428
- زبان مقاله: فارسی
- تعداد مشاهده: 699
نویسندگان
مربی، عضو هیات علمی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران
مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران
مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران
چکیده
اجتناب از داده های گمشده در مجموعه داده های واقعی، حتی اگر نهایت دقت هم در جمع آوریداده ها بشود، باز هم غیرممکن است. این مقادیر می توانند تمام فرایند داده کاوی و تفسیرهایحاصل را تحت تاثیر قرار دهند. اکثر الگوریتم های داده کاوی با این فرض طراحی شده اند که هیچمقدار گمشدهای در مجموعه داده ها وجود ندارد. بنابراین برخورد با مقادیر گمشده می تواند بطورقابل ملاحظه ای کیفیت داده کاوی را افزایش دهد. در این مقاله، تاثیر روش های معروف جانشینیمقادیر گمشده شامل KNN, Hot Deck, Mean/Mode و Multiple Imputation برروی دقت و خطای کلاسه بندی با آزمایش بر روی ده مجموعه داده با کاربردهای مختلف موردمقایسه و ارزیابی قرار می گیرند. آزمایشات بر روی شش نرخ مختلف از مقادیر گمشده انجام میگیرند. این مجموعه داده ها در اندازه، تعداد مقادیر گمشده، و انواع داده های اسمی و عددی متفاوتمی باشند. در آزمایشات از پنج کلاسه بند معروف نزدیکترین k همسایه، بیزین ساده، مبتنی برقاعده ی RIPPER و ماشین بردار پشتیبان استفاده می شود.کلیدواژه ها
مقادیر گمشده، جانشینی مقادیر گمشده، کلاسه بندیمقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.